谷歌近期公布了一项创新的人工智能项目,名为“DolphinGemma”,该项目旨在探索海豚声音的秘密,并尝试生成与海豚相似的声音序列。
据悉,DolphinGemma是谷歌与“野生海豚计划”(WDP)组织及美国乔治亚理工学院合作的产物。通过利用WDP收集的海豚哨声、喀嗒声和脉冲声数据,研究人员训练了这一大型语言模型,以期更好地理解海豚的交流方式。
海豚以其高度的智力和复杂的社交互动而闻名,它们能通过各种声音来辨识个体和表达意图。科学家们长期以来一直致力于解读这些声音的含义,并试图通过模拟海豚的声音与它们进行沟通。
DolphinGemma基于谷歌先进的Gemini系统技术构建,拥有约4亿个参数,其运作方式与生成式语言模型类似,但不同之处在于它生成的是海豚声音而非文字。研究人员计划在未来几个月内对DolphinGemma及其配套的CHAT发声系统进行测试,以探索是否能够翻译并模仿海豚的声音,从而实现与海豚的初步“对话”。
目前的研究方向之一是让DolphinGemma在听到海豚声音的“前半部分”后,能够生成“后半部分”,并与海豚实际发出的后半部分进行比对。通过这种方式,研究人员可以初步判断海豚的声音是否包含固定的单词或结构。
研究计划还着眼于将海豚喜欢的物体与特定的“合成声”相关联。科学家们期望,通过这种方式,海豚在想要这些物体时能够发出对应的合成音,从而实现初步的沟通。
然而,尽管DolphinGemma项目充满了创新和潜力,但要让海豚与人类实现真正的对话仍然是一个遥远的目标。目前的研究仍处于初级阶段,未来的挑战和未知因素仍然众多。
尽管如此,这一项目仍然为科学家们提供了一个全新的视角来探索海豚的声音世界,也为人工智能技术在动物沟通领域的应用开辟了新的可能性。