近期,科技界传来了一则令人惊讶的消息:OpenAI的o3-mini-high模型被曝出在推理过程中竟然频繁使用中文。这一发现迅速引发了全球网友的广泛关注和热议。
众多外国网友在各大社交平台上纷纷晒出截图,展示了o3-mini-high模型在思考问题时,中文语句频繁出现的情景。这一现象让不少网友感到困惑,他们不解为何在没有明确指令的情况下,该模型会自发地采用中文进行推理。
更为有趣的是,当有网友使用俄语向该模型提问时,它依然选择了中文作为思考语言。这一现象进一步加剧了网友们的疑惑和猜测,不少人开始怀疑OpenAI是否抄袭了中国的DeepSeek模型。
针对这一质疑,有分析人士给出了几种可能的解释。一种观点认为,中文相较于其他语言可能更为简洁,因此在强化学习过程中更容易获得奖励,从而被模型更多地采用。另一种观点则指出,OpenAI的通用模型,如GPT-3/4等,本身就具备多语言能力,中文推理只是其多语言能力的自然延伸。
GPT系列模型的训练数据涵盖了互联网上的多语言文本,包括中文,因此它们能够处理中文输入并生成相应的回答。这些模型通过海量数据自动学习语言模式,无需为单一语言单独设计架构,这也是它们能够轻松应对多种语言场景的原因。
然而,就在这一风波尚未平息之际,彭博社又曝出了一则新的消息。据知情人士透露,微软公司和OpenAI正在联合调查一起数据泄露事件。他们怀疑与中国人工智能初创公司DeepSeek有关的团体可能未经授权地获取了OpenAI的技术输出数据。
据称,微软的安全研究人员在秋季发现了这一可疑行为,他们认为可能与DeepSeek有关的个人利用OpenAI的应用程序编程接口(API)窃取了大量数据。不过,OpenAI的首席执行官奥特曼对此表示,他们目前并没有计划控告DeepSeek。