上海岩芯数智人工智能科技有限公司(RockAI)近期宣布,其自主研发的Yan架构大模型已成功通过国家互联网信息办公室发布的《生成式人工智能服务管理暂行办法》备案。这一成就标志着Yan架构大模型成为国内首个通过备案的非Transformer架构、非Attention机制的大模型。
Yan架构大模型采用了创新的MCSD架构和类脑激活机制,这一设计显著提升了模型的性能与效率。相较于传统的Transformer架构和Attention机制,Yan架构大模型在算力需求上大幅降低,仅需3B参数量即可达到Llama3 8B模型的水平,并且支持在CPU上运行部署。MCSD架构具备快速训练和推理能力,能够更高效地提取特征;类脑激活机制则模拟大脑神经元的工作模式,在计算过程中选择性激活部分参数,有效减少了算力冗余。
此次备案的成功,对RockAI及整个行业都具有深远的意义。Yan架构大模型的成功备案,为行业探索新的技术路径提供了有力支撑。它不仅证明了在算力受限的环境下,非Transformer架构的技术路线具有可行性和巨大潜力,还鼓励了更多企业勇于尝试多元化的技术发展方向。
值得注意的是,RockAI在AI技术研发领域的创新能力得到了进一步彰显。目前,RockAI是唯一一家同时拥有非Attention机制大模型和Attention机制大模型,并均通过备案的厂商。这一成就不仅展示了RockAI在技术创新上的领先地位,也为其在商业落地层面赢得了更多机会。
在商业应用方面,Yan架构大模型凭借其低算力要求、本地部署、无损运行等优势,已经与机器人、无人机、手机、电脑等多个领域的设备厂商建立了深度合作,并成功落地了多个项目。这些项目的成功实施,不仅验证了Yan架构大模型的实用性和可靠性,也为RockAI赢得了良好的市场口碑。
RockAI自成立以来,一直致力于以“群体智能”的理念构建通用人工智能技术,并以“让世界上每一台设备拥有自己的智能”为使命。Yan架构大模型的成功备案,是RockAI践行这一使命的重要里程碑。未来,随着Yan架构大模型在更多设备单元上的部署应用,我们有理由相信,RockAI将携手合作伙伴,共同开拓更加广阔的市场空间,推动群体智能向通用人工智能的迈进。