【ITBEAR科技资讯】4月5日消息,谷歌近日推出了聊天机器人 Bard,并呼吁公司员工进行内部测试,同时也委托了许多外部承包商进行评估。在 OpenAI 聊天机器人 ChatGPT 爆火后,谷歌也迅速跟进,在 3 月份推出了聊天机器人 Bard 的有限测试版。与 ChatGPT 类似,用户可以向 Bard 提问或下达任务指令,Bard 会给出类似人类的答复。谷歌对此表示,聊天机器人会随着时间的推移而变得越来越好,它不应该被视为搜索的替代品。
据ITBEAR科技资讯了解,跨国 AI 训练数据服务公司 Appen 的承包商正在帮助改进谷歌的聊天机器人。虽然这些人没有被明确告知他们被分配的任务与 Bard 有关,但是关于新任务的内部讨论可以追溯到 2 月 7 日,也就是在谷歌首次发布 Bard 的时候。Appen 内部文件显示承包商需要审查 AI 聊天机器人所提供的回应质量。
根据承包商指导文件,他们将收到用户向 AI 聊天机器人发出的提示(例如提问、指令或陈述),以及两个机器生成的回应。承包商需要帮助确认哪种回应更好。他们还可以在文本框中详细说明选择的原因,以帮助聊天机器人学习在可接受的响应中寻找特定属性。聊天机器人给出的回答应该连贯而准确,并引入最新信息。
四名接受采访的承包商表示,自 1 月份以来,他们的大部分工作已经转向审查 AI 聊天机器人的提示。在评估过程中,承包商们对聊天机器人的表现感到失望,并称他们没有足够时间准确评估聊天机器人对提示的响应是否正确,有时只能凭借猜测。不过他们仍然可以拿到报酬。承包商表示,他们被设定固定的时间来完成每项任务。审查提示的任务时间从 60 秒到几分钟不等,差异很大。这些人承认,如果他们不熟悉聊天机器人谈论的话题,比如区块链等技术,就很难给 AI 的回应评分。