ITBear旗下自媒体矩阵:

华为景联文科技联手,打造AI数据湖新引擎,赋能行业智能升级

   时间:2025-03-25 12:23:07 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在2025年度的华为中国合作伙伴大会上,一场科技界的强强联手震撼上演。华为携手景联文科技,共同推出了面向AI数据湖的数据工程联合解决方案,这一创新方案旨在为AI行业注入强大的数据动能,推动智能化升级。

景联文科技的CEO刘云涛在会上发表演讲,他深刻指出:“AI的成功离不开高质量的数据支持。数据的优劣直接决定了AI大模型的表现。因此,提供高质量的数据集是AI行业发展的关键,也是数据要素交易繁荣的基石。”刘云涛还强调,精准全面的数据治理与可靠高效的数据基础设施,在智能化进程中扮演着不可或缺的角色。

面向AI的数据处理,通常需历经三大关键阶段:从海量原始数据中提炼结构化数据集,再经过精细标注形成语料集,最终构建知识库以支撑模型训练及业务应用。然而,在这一过程中,业界面临着多重严峻挑战。数据拥有者往往缺乏便捷安全的数据汇聚托管系统,导致数据共享壁垒重重;原始数据类型多样、格式复杂,增加了语料处理的难度;同时,数据作为风险资源,在流通中缺乏端到端的安全管控,存在被篡改、扩散的风险,加之区域间数据基础设施发展不均,数据跨域流通效率低下。

针对这些挑战,华为与景联文科技携手推出了创新的数据工程联合解决方案。依托景联文科技多年的数据工程经验,以及华为在数据存储领域的领先地位,这一方案将全方位提升数据处理效率。

在数据处理的全流程中,景联文科技的Solar Data平台采用AI Agent理念,与华为的全闪数据湖存储紧密协作,支持异构数据的高效加工。平台能自动或半自动化地清洗、解析、预处理30多种格式的数据,进行特征提取与初步分析。结合AI预标注与专业手工标注,最终整合出高质量的数据产品,全流程效率提升高达70%。

在数据流通与资源调度方面,华为DME(Omni-Dataverse)全局文件系统与可信数据空间的结合,实现了多源数据的无缝归集,全局数据可视、可管、可流,确保了数据交换过程的可信、可证、可控。基于华为DCS的统一资源调度,Solar Data平台的计算、存储、网络等资源实现了弹性服务与统一管理。通过ModelEngine AI使能工具链框架,数据集的开发进程得以加速。

该方案还采用了基于华为OceanStor Pacific分布式存储底座的统一数据底座。在先进介质、协议互通、负载优化、分布式并行客户端等领域,软硬件协同创新,打造了业界领先的高密绿色数据基础设施。这一基础设施使得海量数据能够更持久地存储、更高效地访问。

华为数据存储部门表示,将持续深化与业界伙伴的合作,共同推动AI时代应用生态的繁荣发展。秉持“以数据为中心”的产业理念,华为将充分发挥数据在数字经济中的核心驱动力作用,携手合作伙伴共同开创AI数据处理的新篇章。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version