ITBear旗下自媒体矩阵:

悦数科技:Graph RAG先行者,如何领跑向量与图数据库融合赛道?

   时间:2025-02-12 19:12:25 来源:ITBEAR编辑:快讯团队 发表评论无障碍通道

在数据库技术的浩瀚星空中,向量数据库近年来犹如一颗迅速崛起的新星,以其高效检索高维向量数据的能力,为大模型的训练和推理铺设了坚实的基石。特别是在2023年,随着大模型的狂飙突进,向量检索技术,尤其是作为检索增强生成(RAG)技术核心的一环,更是成为了数据库领域的焦点所在。

然而,正如所有新兴技术必然面临的挑战一样,RAG技术在广泛应用的过程中也逐渐暴露出了其局限性。它虽然能够高效地将知识向量化,但在处理独立信息之间的链接、结合关系和语境方面却显得力不从心。在面对需要深层次语义关系和上下文细微差别的复杂查询时,RAG技术往往显得捉襟见肘。

面对这一困境,杭州悦数科技有限公司(以下简称悦数)的CTO叶小萌带领团队,在2023年与LlamaIndex携手,提出了一个大胆的设想——Graph RAG。这一设想旨在通过知识图谱,将图数据库与向量数据库相结合,从而更精确、全面地检索相关信息,使模型能够关联上下文给出更为准确的答复。尽管这一设想在初期并未在国内引起太大波澜,但悦数团队并未因此气馁,而是持续推动其落地。

叶小萌,这位悦数的技术领航者,直言不讳地指出了悦数与行业的差异化策略——技术。在他看来,大模型的兴起无疑为RAG技术带来了前所未有的机遇,但要让大模型真正了解并应用私域数据,就需要先将这些数据保存下来,并通过向量化技术快速找到关联内容。而Graph RAG,正是这一过程中不可或缺的一环。

悦数团队在提出Graph RAG概念后,迅速组建了专项团队,由古思为牵头,开始了这一前沿技术的研发工作。尽管团队规模有限,且初期只有古思为一人专注于上层RAG的研发,但他们凭借对技术的深刻理解和不懈追求,最终在一年后推出了悦数RAG产品,并成功进入了产品市场匹配阶段(PMF),预计在今年内就能进行大规模推广。

古思为,这位深耕图库多年的技术专家,在回顾Graph RAG的研发历程时,笑称自己当时就像是一个人在撑起一支队伍。他敏锐地捕捉到了RAG技术在利用无状态大模型进行上下文理解和推理时的局限性,并意识到知识图谱在这一过程中的重要性。于是,他带领团队开始了Graph RAG的研究,并最终呈现出了一个令人振奋的初步验证结果。

悦数RAG产品的推出,不仅解决了RAG技术在处理复杂查询时的局限性,还为企业应对知识孤岛问题提供了有力的支持。与此同时,悦数在图数据库领域的探索也并未止步。2024年4月,国际标准化组织(ISO)发布了国际标准图查询语言GQL,而悦数图数据库v5.0也在同年11月应运而生,成为了全球首款原生支持GQL的分布式图数据库产品。

作为信创领域的积极参与者,悦数一直在努力推动其图数据库产品的信创认证。尽管目前图数据库还未被正式收录在信创名录中,但悦数已经做好了充分的准备,积极适配各种信创操作系统和硬件,只待东风吹来。

叶小萌深知,数据库市场的竞争犹如一场长跑,需要耐心和毅力。他形容现在的市场竞争已经进行到了半程左右,虽然不排除有人最后冲刺反超的可能性,但第一梯队和第二梯队已经逐渐显现。他相信,在经过大浪淘沙之后,最后能够留下的玩家必然是技术产品最为出色的。

在悦数团队的共同努力下,悦数图数据库已经取得了显著的成果。不仅在性能上通过了中国信通院的严格测试,还在市场上赢得了众多客户的青睐。叶小萌感慨地说,创业最难的是突破边界,从专注技术到与客户面对面沟通,每一步都需要不断地学习和适应。但他相信,只要团队保持对技术的热爱和追求,就一定能够克服一切困难,走向更加辉煌的未来。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version