在科技界的浩瀚星空中,一颗名为DeepSeek的新星正以前所未有的光芒照亮了整个硅谷与华尔街。近日,这家被誉为“国产AI之光”的企业再次震撼全球,不仅让美股科技板块风声鹤唳,更是在1月28日乘胜追击,发布了其最新的开源多模态AI模型——Janus-Pro。
DeepSeek的这一举动,显然给业界巨头带来了不小的压力。OpenAI的联合创始人兼CEO Sam Altman罕见地在社交媒体上连续发文,对DeepSeek的新模型R1给予了高度评价,称其为“令人印象深刻的模型”,并预告OpenAI也将推出更强大的模型,坚持其既定的技术发展路线。
据DeepSeek公布的数据,其新开源的Janus-Pro-7B模型在Geneval和DPG-Bench两大基准测试中,性能超越了OpenAI的DALL-E 3和Stable Diffusion。这一消息迅速点燃了业界的热情,网友们纷纷在社交平台上分享各种创意梗图,其中一张更是将GPT-5打上了大红叉,而在巨鲸图案上赫然印上了DeepSeek的logo。
早在之前,DeepSeek凭借其R1模型的高性能和成本效益,已经赢得了“国产AI价格屠夫”的称号,让整个硅谷为之震动,也让业界开始质疑美国科技巨头在AI基础设施上的巨额投入是否必要。随着DeepSeek影响力的迅速扩大,它已登顶中美等多国App Store免费榜。
DeepSeek的冲击波也席卷了美股市场。英伟达股价昨日暴跌17%,市值蒸发近6000亿美元(折合人民币约4.35万亿元),其创始人兼CEO黄仁勋的财富一夜之间缩水201亿美元(约合人民币1458亿元)。同时,台积电的市值也蒸发了1508亿美元(约合人民币1.09万亿元)。DeepSeek作为“AI界拼多多”,这一刀“砍”掉了英伟达和台积电超5万亿元的市值,堪称奇迹。
美股科技股和芯片股均受到重创,纳斯达克100指数下跌3.1%,标普500指数下跌1.5%,微软、谷歌母公司Alphabet、博通、台积电、ASML等科技巨头纷纷下跌。而一向对AI竞赛保持谨慎态度的苹果,却在这场风暴中逆势上涨3.2%,重返全球市值第一的宝座。
DeepSeek的崛起也引起了全球主流媒体的广泛关注,多家外媒的头版都报道了这一事件,这在科技界并不多见。
随着DeepSeek以惊人的速度不断开源高质量新模型,其在全球科技圈引发的轰动效应还在持续扩大。新发布的Janus-Pro模型有1B和7B两款,能够生成高质量的AI图像,且一如既往地开源、免费、可商用。13页的技术报告也已经公开。
据技术报告介绍,Janus-Pro是前作Janus的升级版,结合了优化的训练策略、扩展的训练数据,并扩展到更大的模型尺寸,在多模态理解和文本到图像的指令遵循能力方面都取得了显著进步,同时也增强了文生图的稳定性。网友们已经在社交平台上分享了对Janus-Pro-7B的体验,总体评价是信息理解基本准确,生成图像完整,但在局部细节上有所欠缺。
Janus-Pro的技术解读显示,该模型遵循自回归框架,解耦了多模态理解和视觉生成的视觉编码,采用独立的编码方法将原始输入转换为特征,然后由统一的自回归Transformer进行处理。实验使用最大支持序列长度为4096的DeepSeek大模型作为基础,通过改进训练策略和数据比例,实现了更高效的训练和整体性能的提升。
尽管Janus-Pro在多模态理解和文生图指令遵循能力上取得了显著进步,但仍存在一定的局限性,如输入分辨率限制为384 × 384,可能影响其在细粒度任务中的性能。对于文生图,低分辨率加上视觉tokenizer带来的重建损失,导致图像虽然具有丰富的语义内容,但缺乏精细的细节。不过,技术报告指出,提高图像分辨率有望缓解这些问题。