近年来,关于人工智能语言模型对全球社会影响的讨论持续升温,特别是自ChatGPT在2022年末横空出世以来。近期,斯坦福大学主导的一项新研究为这一话题提供了更为清晰的视角,揭示了AI语言模型在多个行业中的广泛应用。
研究指出,企业在沟通中已大量依赖生成式AI,特别是在处理专业沟通任务时,AI的参与度高达四分之一。这一现象不仅限于技术前沿地区,反而在美国教育水平较低的地区更为显著。研究人员在报告中详细阐述了这一发现,通过对2022年1月至2024年9月期间的大量数据进行追踪分析,揭示了大型语言模型(LLM)在不同领域的渗透情况。
研究数据集覆盖了广泛的领域,包括美国消费者金融保护局收到的68万多份消费者投诉、53万多份企业新闻稿、超过3亿份工作招聘启事以及1.5万多份联合国新闻稿。通过先进的统计检测系统,研究人员发现,约18%的金融消费者投诉显示出AI协助的迹象,尤其是在阿肯色州,这一比例高达30%。同时,企业新闻稿、工作招聘启事以及联合国新闻稿中分别有24%、15%和14%的内容存在AI的参与。
令人惊讶的是,尽管城市地区的AI采用率总体较高,但在教育水平较低的地区,AI写作工具的使用频率却更高。这一发现与以往技术采用的常规模式大相径庭,通常受教育程度较高的人群会更快地接受新技术。然而,在这项研究中,教育水平较低的地区在消费者投诉中显示出略高的LLM采用率,这表明AI工具可能成为这些地区消费者维权过程中的“平等化工具”。
研究人员进一步指出,尽管在单个文档层面上,AI检测器的可靠性备受质疑,但在分析数百万份文档的整体数据时,一些特征性模式开始显现,这些模式暗示了AI语言模型对文本的影响。为了验证这一方法的可靠性,研究人员创建了已知AI内容比例的测试集,并发现其预测误差率低于3.3%。这一统计验证增强了研究人员对人口层面估算的信心。
然而,研究人员也承认,他们的估算可能仅代表AI使用的最低水平。由于AI生成的内容越来越难以检测,特别是经过大量编辑或由更复杂的AI模型生成的内容,因此实际的AI参与程度可能要高得多。这意味着,研究人员报告的采用率可能大幅低估了生成式AI的真实使用水平。
研究还发现,在所有分析的领域(消费者投诉、企业沟通、工作招聘启事)中,AI的采用模式都呈现出类似的趋势。特别是在ChatGPT推出后的三到四个月内,采用率急剧上升,随后在2023年底趋于稳定。这一趋势表明,AI语言模型正在迅速融入社会沟通的各个方面。
尽管如此,研究人员也指出了研究的局限性。由于主要关注英语内容,因此分析结果可能存在一定的偏差。他们发现无法可靠地检测经过人工编辑的AI生成文本或由更新模型生成的模仿人类写作风格的文本。这意味着,他们的研究结果仅代表实际AI写作工具采用率的下限。
最后,研究人员指出,2024年AI写作采用率的停滞可能反映了市场饱和或LLM生成的文本越来越难以被检测方法识别。他们警告说,如今我们生活在一个人类写作与AI写作越来越难以区分的世界,这对社会沟通产生了深远影响。过度依赖AI可能导致信息无法解决实际问题,或在对外发布时降低信息的可信度,从而引发公众对企业信息真实性的不信任。