科大讯飞近期宣布了一项重大技术突破,成功推出了讯飞星火X1,这一深度推理大模型在全国产算力平台上尚属首例。讯飞星火X1不仅在中文数学能力方面表现卓越,还率先在教育、医疗等多个实际需求领域实现了应用。
与此同时,讯飞星火4.0 Turbo平台的能力也得到了全面升级。图文识别、数学处理及长文本处理能力显著提升,并首次引入了混域知识搜索技术,旨在解决行业与企业面临的各种复杂问题。
科大讯飞一直致力于全国产化的发展道路。尽管在国产算力平台上训练深度推理模型面临诸多挑战,但通过与华为的深度合作,科大讯飞成功克服了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列技术难题,最终成功打造出了讯飞星火X1这一具备深度思考和推理能力的大模型。
在发布会上,科大讯飞研究院的研究员展示了讯飞星火X1在解答高考、AIME竞赛及高中奥林匹克竞赛题目方面的能力。讯飞星火X1不仅能够给出正确答案,还能够详细解析解题方法和步骤,其解题过程与人类“慢思考”的方式极为相似。
讯飞星火X1的深度推理模型具备三大显著特点:首先,它能够化繁为简,将复杂问题逐步拆解简化;其次,它具备自我探索和反思验证的能力;最后,它还能够基于答案的正确性进行强化训练,不断优化自身性能。
讯飞星火X1在多项考试中取得了优异成绩,包括小初高(含竞赛)、大学(包含竞赛)、AIME、MATH 500等,其在业界的标志性指标中均位居前列,实现了以更少算力取得卓越成果的目标。
讯飞星火4.0 Turbo平台的数学处理能力也得到了显著增强,这得益于讯飞星火X1的高质量合成数据。该平台能够更有效地支持数学教学、金融分析和科研演示等工作,进一步提升了其应用价值。
在图文识别方面,讯飞星火4.0 Turbo的提升显著。通用文档的版面分析和识别准确率提高了40%,针对复杂表格和潦草手写文字的识别准确率更是提升了60%。这一改进显著提高了高价值数据的获取效率。
讯飞星火4.0 Turbo还针对长文本处理进行了创新。通过强化文档要素检测,使得知识的准确切分和构建更加精细,减少了模型幻觉的发生。同时,推出的极速版扫描文档解析技术,使得从扫描到解析的速度提升了超过10倍,进一步优化了长文本处理效果。
为了进一步提升用户的信息获取效率,讯飞星火还推出了混域知识搜索技术。用户只需一次性提问,即可获得综合搜索结果,极大地提升了信息获取的便利性。
根据第三方数据统计,2024年讯飞星火在大模型的中标数与金额方面均位居前列,特别是在能源、金融、汽车、电信等领域,与客户共同打造了近百个智能体应用。借助“技术与应用”的良性循环,讯飞星火4.0 Turbo全面提升了其在各行业的能力,特别是在金融、油气、电力、钢铁、航空等行业,整体能力提升幅度均超过10%,成为“最懂得行业需求的大模型”。