全班第一的论文是它写出来的、89%的美国学生用它来完成作业、2个月内超过1亿用户向它提问……最近一段时间,聊天机器人ChatGPT火遍全球,它以强大的语言处理能力、海量的数据积累等特点让用户感到惊讶甚至震撼。但随着使用的人越来越多,ChatGPT开始暴露在一些场景下的缺陷和不足,让网友吐槽“智障”。
用户反映最多的问题是它经常“一本正经地胡说八道”。有时存在事实性错误,无法判断它回答的对错。不仅仅是在中文相关的题材下,就连在西方知识题材中也会胡言乱语。将王勃《滕王阁序》的诗句说成出自王焕之《登鹳雀楼》,将钢琴女祭司玛塔·阿格里奇说成20世纪最杰出的小提琴家之一。
有时结果并不稳定,换个问法后甚至刷新一下ChatGPT回答可能会变化。
并且ChatGPT并不诚实,也无法查询最新的信息,无法获知最新的知识。这在一些垂直领域的使用中,特别是像高校科研这种需要前沿研究和实时数据的场景下,实属不便。问询前沿问题,让它帮忙查找一篇论文,它的回答看起来有条有理,但DOI指向的是另一篇论文,题目和作者甚至都是捏造不存在的。
对于互联网上含有大量非英语语言,比如中文,没有丰富的中文训练数据,它有时就会胡言乱语。甚至当问题就是错的时,ChatGPT仍然会顺着往下说,一骗就上当。
再退一步,不在query设置专业限定词,而是简单问题,ChatGPT在中文语境的错误还是比较多的。
当ChatGPT脱离通用领域来到需要极其丰厚的领域知识的垂直领域,它还不一定合适。下图是ChatGPT在中文字词相关问题上的回复,涉及拼音相关的知识,尽管好像有一些道理,但结果是错误的。
以上提到的一些缺陷,无疑说明了ChatGPT距离“完美”依然有着不小的距离,比如中文基准的自然语言处理效果、面对国内用户的限制、不能获取新的知识等。
在当前全球的ChatGPT热潮下,中国更应该有自己的生成式AI产品,站在国际军备竞赛场上,与世界争锋。即使不完美,也是英雄。这不仅对于我国人工智能技术的发展和国际数据争夺意义重大,也将会弥补了我国缺乏与国外人工智能对话机器人相匹配的人工智能技术带来的一系列隐患。
上场即是胜利,哪怕不完美,能达到ChatGPT去年11月上市水平就行,早上线一个月都意义非凡。中国一定要有自己的生成式AI,无论是面向C端市场,还是面向B端市场,国内市场都将因为这项技术,迎来一轮新的发展契机。