滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

YouTube视频成AI训练数据源？OpenAI与Meta面临法律挑战

时间：2024-04-07 09:42:01 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

【ITBEAR科技资讯】4月7日消息，近日，有关AI公司在收集训练数据方面所面临的挑战引发了广泛关注。据《华尔街日报》本周早些时候的报道，AI企业正努力应对高质量训练数据收集的难题。而今日，《纽约时报》深入探讨了这些企业为解决此问题所采取的策略，其中一些做法牵涉到AI版权法的模糊地带。

据报道，为了获取训练数据，领先的AI公司OpenAI开发了一种名为Whisper的音频转录模型。该公司利用这一模型转录了超过100万小时的YouTube视频，以便训练其最新的大型语言模型GPT-4。OpenAI在2021年就已经耗尽了可用的数据资源，并在探讨利用YouTube视频、播客和有声读物等资源的可行性后，决定采用这种方法。此外，OpenAI还整合了包括Github的计算机代码、国际象棋走棋数据以及来自Quizlet的学习资料等多种数据源。

据ITBEAR科技资讯了解，尽管OpenAI意识到这种做法在法律上存在争议，但他们认为这属于合理使用范围。《泰晤士报》披露，OpenAI的总裁Greg Brockman甚至亲自参与了视频的收集工作。OpenAI的发言人Lindsay Held向媒体表示，公司为每个模型都策划了独特的数据集，旨在帮助其更好地了解世界，并维持其在全球研究领域的竞争力。Held还提到，公司使用了众多数据来源，并正在考虑生成自家的合成数据。

然而，这一做法并未得到所有相关方的认可。谷歌发言人Matt Bryant指出，他们注意到了有关OpenAI活动的报告，并重申其robots.txt文件和服务条款都明确禁止未经授权的YouTube内容抓取或下载。YouTube首席执行官Neal Mohan也在近日的采访中表示，尽管没有直接证据表明OpenAI使用YouTube视频来训练其AI模型，但此类行为确实违反了YouTube的服务条款。

同样面临数据可用性限制的还有meta公司。在《泰晤士报》披露的录音中，meta的AI团队为了追赶OpenAI，讨论了未经许可使用版权作品的可能性。该团队在考虑了互联网上几乎所有可用的英语书籍、散文、诗歌和新闻文章后，提出了诸如支付图书许可费，甚至收购大型出版商等解决方案。

标签： OpenAI

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

腾讯混元T1正式版发布，推理能力媲美DeepSeek-R1，价格更亲民

相比于T1-Preview，T1正式版基于腾讯混元3月初发布的业界首个超大规模Hybrid-Transformer-Mamba MoE大模型TurboS快思考基座，通过大规模后训练扩展了推理能力，并进一步对…

03-22

美团王兴：主动进攻AI，内部大模型longcat已上线

王兴在回答人工智能相关问题时表示，美团在人工智能技术方面的策略始终是“主动进攻”而非“被动防守”。美团的人工智能战略建立在三个层面上：首先是在日常工作中的应用；其次是在美团产品中的应用，还将推出全新的原生…

03-22

软银65亿美元大手笔！收购美国芯片设计巨头Ampere布局AI

03-22

乐鑫科技2024年度净利大增149%，非智能家居领域增速亮眼，端侧芯片布局加速！

03-22

腾讯混元T1深度思考模型发布：强推理、快回应，解锁超长文本处理新能力

03-21

百度地图领跑！核心API全面兼容MCP，大模型接入地图服务更便捷

03-21

Win11预览版大升级：画图、截图工具、记事本迎来AI新功能

03-21

Adobe新AI工具：Project Slide Wow，实时同步数据，让演示文稿更高效！

03-21

微软剑桥联手推出Aardvark Weather：AI让天气预报更精准高效

03-21

PCIe 7.0标准草案0.9版出炉，SSD普及还需苦等三年？

03-21

华为F5G-A万兆全光园区震撼登场：50G PON技术引领网络新升级！

03-21

云徙xAgent携手DeepSeek：重塑营销数字化底座，赋能企业智能化升级

03-21

富途“投资展”放大招：接入DeepSeek-R1，AI升级赋能零售投资者

03-21

富途接入DeepSeek，AI投资助手牛牛AI等升级功能亮相投资展

03-21

成龙电影A计划升级A³，可灵AI全程助力探索“人+AI”电影新纪元

03-21

点击查看更多 +

全站最新

空气悬架不再是豪车专属，20万内车型也能享受高端配置？

1300马力COPO版雪佛兰科迈罗亮相，送专业调教电脑及原厂数据！

蔚来巨亏224亿，李斌详解未来蓝图：销量翻倍，Q4盈利能否实现？

比亚迪3万转电机震撼发布，引领新能源汽车进入全新高性能时代！

腾势N9插混版上市，外观内饰科技感满满，售价38.98-44.98万元

地平线2024“三高”亮眼，智驾平权底气何在？征程6系列成关键

热门内容

本栏最新

腾讯混元T1正式版发布，推理能力媲美DeepSeek-R1，价格更亲民

乐鑫科技2024年度净利大增149%，非智能家居领域增速亮眼，端侧芯片布局加速！

腾讯混元T1深度思考模型发布：强推理、快回应，解锁超长文本处理新能力

百度地图领跑！核心API全面兼容MCP，大模型接入地图服务更便捷

Win11预览版大升级：画图、截图工具、记事本迎来AI新功能

Adobe新AI工具：Project Slide Wow，实时同步数据，让演示文稿更高效！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.