近日,为期两天的2024中国生成式AI大会(上海站)圆满落幕。本次大会吸引了超过4000人报名咨询,现场观众突破1200人,线上观看人次更是突破百万大关,成为业内瞩目的焦点。
大会以“智能跃进 创造无限”为主题,汇集了51位产学研投领域的嘉宾,共同探讨生成式AI的技术创新、商业落地及未来趋势。现场气氛热烈,主会场和分会场均座无虚席,产业交流活跃,15家企业的新技术、新产品备受关注。
上海交通大学副教授、无问芯穹联合创始人戴国浩在AI Infra峰会上强调,业界应关注单位算力的高效token吞吐,通过软硬协同优化和多元异构适配提升算力利用效率。北电数智智算云负责人郭文分享了全栈AI工厂的实践,提出通过“国产算力PoC平台”填补算力供需断层。GMI Cloud亚太区总裁King.Cui则介绍了高稳定性GPU集群在AI企业全球化布局中的关键作用。
阿里云智算集群产品解决方案负责人丛培岩预测,未来模型性能将随参数和数据集增长而提升,阿里云推出的灵骏智算集群支持超大规模分布式训练,具备高稳定性和极致性能。光羽芯辰创始人周强指出,个人大模型正在快速发展,端侧智能设备将成为重要载体。中昊芯英芯片软件栈负责人朱国梁分享了国产TPU芯片“No CUDA”软件栈的构建经验,实现高效管理和生态兼容。
在下午的圆桌讨论中,嘉宾们围绕“大模型行至深水区,AI Infra的新变化与新机会”展开深入交流。德联资本执行董事刘景媛指出,AI Infra在帮助大模型落地过程中,产品边界和功能需求逐渐明晰,开源社区和全球化成为重要趋势。Zilliz合伙人栾小凡认为,AI技术去年被高估,今年被低估,未来落地还需等待机会。
多位嘉宾还分享了AI Infra领域的最新进展。枫清科技创始人高雪峰提出,将生成式AI应用于企业决策场景,需融合符号逻辑推理。声网生成式AI产品负责人毛玉杰介绍了生成式AI对实时互动技术的变革,期待实现真正的心灵交互。腾讯云向量数据库技术负责人谢宇展示了向量数据库在RAG场景中的应用,解决召回率低的问题。Jina AI联合创始人王楠认为,长文本大模型与RAG将长期共存,长窗口向量模型面临推理成本和内存消耗挑战。英飞流创始人张颖峰提出了多模态RAG新范式,解决多模态文档处理和检索难题。Alluxio首席架构师傅正佳介绍了通过统一数据视图和高性能数据访问提升模型训练效率的方案。
本次大会不仅展示了生成式AI领域的最新成果,也为未来发展指明了方向。随着生成式AI技术的不断成熟和商业化进程的加速,全产业链的合作共赢将成为推动行业发展的关键。