【用友UAP技术大讲堂】主数据的历史数据梳理

时间：2014-12-25 14:18:17 来源：ITBEAR编辑：星辉 发表评论无障碍通道

摘要：通常主数据梳理工作的对象为每个主数据所对应的副本数据。数据梳理的手段，可以采用数据清洗引擎与人工干预两种方式。下面就用友UAP主数据平台中的数据清洗引擎与大家分享。

主数据的历史数据梳理工作，看起来很简单，涉及的理论知识很少。但是恰恰是这部分工作占据了主数据管理项目实施工作的大部分时间。如何借助工具软件，提高数据清洗工作效率则成为了该阶段工作的重点内容，也是保证主数据管理项目利润率的关键点。

通常主数据梳理工作的对象为每个主数据所对应的副本数据。目的是为了得到一份完整的、没有重复的，且与现实状况相符的数据集合。如果副本数据与主数据有不一致的地方，则需要进行修改，使其与主数据保持一致。

至于数据梳理的手段，可以采用数据清洗引擎与人工干预两种方式。下面就用友UAP主数据平台中的数据清洗引擎与大家分享。

这是用JFrame做的，可完全实现轻量化。现在用的MySql数据库，如果考虑安装问题可以用一个内存数据库或者直接用文件。清洗的时候，个人感觉直接用文件做会比较快。

最开始的是主数据建模，因为主数据模型比较简单，所以直接用模型描述了以后，存在数据库中的主数据注册表中了。然后写了一个描述引擎，把所有的主数据都转化为内部的MDMdescrip对象和DataContener对象，这样就可以直接在页面使用了，不用重启。

数据管理

默认的主数据管理页面，实现简单的增删改功能。

Kettle副本数据导入

主数据注册的时候有一个副本数量，系统默认为每一个副本生成以后存储空间。只要通过kettle工具将副本数据导入到清洗工具后台数据库中就可以了。

排重算法设计

排重算法设计是亮点，有两个阀值，大于第一个阀值就算数据一样。小工具就自动处理了。第一个和第二个之间则需要人工手工干预一下。小于第二个就算不同的数据。可以为每个比对字段设定权值和算法。现在的算法还比较少，最近刚刚增加了一个带分词和语意判断的。以后会根据项目需求随时添加，比如对邮件进行比对，zhangxu@yonyou.com和zhangxu@ufida.com.cn就应当是一个人，这个属于特殊情况，所以要在项目现场开发，以后通用的算法还可以有参数设定。这个算法库以后是这个工具的最大价值。

数据排重

对数据的排重，在此次我做的这个项目中，三千条数据大概用了48秒。而且所有的数据是一次读到内存中的。

本身排重结果的处理应该分成两种，一种是生成主数据，一种是副本数据与主数据一致，这里只做了第一种。其实大部分情况是把处理报告导出来交给用户去做，涉及到数据的问题都很关键。最后用户处理好后，导入主数据系统就可以使用了。

以上是本人在项目实施时所做的数据清洗引擎。这也是用友UAP MDM平台中的一部分功能。UAP MDM能够对业务系统中的各类数据进行整理、过滤、合并、分析。帮助企业实现：数据标准化;数据质量保障;数据共享;为BI或者集成应用提供可靠的基础服务。通过将数据合理利用，实现业务系统价值的最大化。、

12月16日，讯飞AI录音笔旗舰新品S8离线版重磅上市。该款产品为完全隔绝外界网络转文字AI录音设备，其所有功能均在本地实现，为对安全性有严格要求的用户群提供了新工具。数据泄露事件频发，信息保护需求凸显数字世界以网络连接为基础，以数据流动释放价值。在数字化浪潮

核心亮点：解锁电竞未来： ROG将于CES 2025 ROG新品发布会推出多项创新技术，彰显电竞实力超强产品阵容：探索为顶级性能释放和极致使用体验而打造的全新ROG新品笔记本终极性能：全新ROG枪神系列、ROG魔霸系列、ROG幻Air系列及幻X笔记本登场，为极致性能、便携性及潮流设

近日，以“科技赋能家电产业转型升级”为主题的2024中国家电科技年会在湖北武汉召开，海信空调受邀参加“家电噪声技术专题研讨会”，并作主题汇报。同时，“第三届全国轻工适老创新产品及智能健康解决方案大赛”结果隆重揭晓，海信空调以柔风、送风、智能等显著优势一举

时至十二月，又是一年终末。伴随着12.12的来临，厂商们纷纷开启了新一轮的促销优惠。作为年末备受期待的好物节，声势浩大的促销无疑是大家挑选心仪好物的好机会。如果你想在近期为自己选购一款智能手表来激励运动监测健康，不妨尝试一下最新的三星Galaxy Watch7和三星Ga

2024年进入尾声，国补政策即将在12月31日结束，还尚未使用笔记本国补资格的消费者朋友们不妨关注高颜值游戏本华硕天选5Pro锐龙版，其搭载GeForce RTX 4070笔记本电脑GPU，NVIDIA GeForce RTX™ 和 NVIDIA RTX™ GPU 专为 AI 时代打造。RTX GPU 由业界领先的 NVIDIA GPU

《使命召唤：黑色行动6》是由Treyarch和Raven Software联合开发，并由动视发行的第一人称射击游戏，于2024年10月25日正式发布。游戏上线Steam后，获得了广大玩家的好评。动视官方也宣称，《使命召唤：黑色行动6》成为《使命召唤》系列中首发最成功的作。在游戏正式发布

由GSC Game World开发并发行的《潜行者2:切尔诺贝利之心》已在STEAM正式上线,这是一款探索冒险题材的第一人称射击游戏。游戏以2006年第二次核反应堆爆炸事件为背景,玩家将化身为一名“潜行者”,面对一场史诗级的危险战斗。游戏首发即支持NVIDIA DLSS 3技术,搭载耕升 GeF

ROG游戏手机9系列自上市以来，赢得了不少信仰玩家的喜爱与支持，其凭借着出色的性能释放、独一档的185Hz屏幕刷新率，成为了手游爱好者们绝佳的上分利器。全新的矩阵式液冷散热架构9.0此次更是获得了酷冷风扇X Pro、ROG冰川液冷壳等全新配件的加持，使ROG 9系列获得了更

自12月2日掠夺者电竞大赛2025中国区挑战赛招募贴发布以来，受到了来自全国范围内游戏玩家及无畏契约战队的广泛关注，在不到一周的时间内，百余支战队积极报名。本届掠夺者电竞大赛不仅秉持公平公正的赛事精神，更是在战队筛选中推出了平等化社交媒体化的全新规则，在#宏

近日,2024年得力数码打印新品推介会在湖南长沙隆重举行。新品推介会以“善印起航,智绘新篇”为主题,得力集团副总裁张磊、设备事业部行业部总监薛峰、数码打印产品部总监丁启等众多公司领导共同出席活动,与专业渠道客户、行业渠道客户、B2B平台总部负责人等近百位经销商

在2024年12月6日至7日于北京举行的 “2024 T-EDGE全球创新大会”上，众多科技界精英齐聚一堂。大会期间，备受瞩目的「2024 EDGE AWARDS 全球创新评选」揭晓了年度各大奖项，其中，北京智爱未来科技有限公司旗下的AISON爱畅新一代便携式智能K歌音箱凭借“搭载了优质的扬

随着双12脚步的日益临近，2024年最后一场盛大的的购物狂欢节即将拉开帷幕。在这个专属于消费者的节日里，各大手机厂商也为消费者带来了诸多福利政策，给想要手机换新的朋友带来更多选择。作为潮流科技单品的代表，三星Galaxy Z Flip6集时尚设计、实用外屏、出众影像和尖

近年来，随着科技的迅猛发展和人们生活方式的变化，可穿戴设备的市场呈现出蓬勃发展的趋势。近日，国货品牌西普尼重磅发布首款搭载华为智能机芯的珠宝级智能女表，打破传统智能腕表的设计边界，为年末智能穿戴设备市场带来一场视觉与科技的双重盛宴。在外观设计上，它采

作为全球范围内显示技术的一个极其重要的分支，量子点这项在2023年获得诺贝尔奖的尖端技术，近年来引起了越来越多包括TCL、三星、索尼等在内的电视龙头企业关注，其中作为全球量子点显示技术先行者的TCL，近期在该领域再次取得了新突破，推出了量子点Pro 2025技术，并且

冷冬渐至，北风低吟，随着寒潮席卷国内多地，冬季也正式拉开序幕。骤然变冷的天气不仅容易诱发感冒等季节性疾病，同时也打乱了不少朋友们的生活节奏与运动规律。而如果想要在冬季追求健康生活，一款能够监测运动与身体健康情况的三星Galaxy Watch智能手表就成了非常不错

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.