还记得电影《亲爱的》里面有一个场景,法官在处理鲁晓娟和李红琴收养杨吉芳的案件时,面对两位当事人的哭诉与争执,显得极为无奈,案件长时间得不到解决。电影通常会映射现实,现实社会中基层法官也经常会面临“案多人少”“杂事太多”“案件类型相似”的问题。
根据2017年《最高人民法院工作报告》公布的数据,2016年各级法院审结一审商事案件402.6万件,2016年全国251家仲裁机构共受理案件20.8万件,此外,人民法院报数据显示,仅北京朝阳法院在2015-2017三年内处理的案件数量分别是7万件、10万件、13万件,法官仅200余人。
面对案多人少的现状,如何才能减轻法官负担、提升司法质量?
看到了司法等众多领域和社会发展的现实需求,北京国双科技有限公司(以下简称“国双”)利用大数据和人工智能技术,自成立之初就秉承“科技改变产业,促进社会发展”的企业愿景,为数字营销、司法、电子政务、工业互联网等领域客户挖掘数据价值,促进智能增长。在司法领域,国双将知识图谱、自然语言处理等人工智能技术成功“嫁接”行业,短短三年时间作出了不少成绩。例如国双与人民法院出版社、中国司法大数据研究院共同推出了国内首家法律专业智能问答服务平台“法信(智答版)”,以及为最高人民法院知识产权案例指导研究(北京)基地初步建成的“知识产权案例指导服务平台”,帮助法院实现多维度解析裁判文书,智能检索剖析,利用自然语言处理、机器学习技术实现同案类案一键推送,还可以进行远程审判,实时语音转写文字,当场生成庭审笔录,赋能中国智慧司法建设。
但是,术业有专攻,作为一家科技公司,要解决每个领域特有的难题是不容易的。国双的做法是优先立足于产业,如果业务涉及行业细分领域,必须结合相关行业中最懂行、最有经验、最有能力的专家,甚至让行业专家对项目组成员前期展开周期性的封闭式培训,以此熟悉行业特性和痛点,提升国双在产业领域的服务能力。国双CTO刘激扬说:“要做好一个产业,首先要成为这个行业的专家,既要引进外部行业专家人才,也要进行内部学习培训。”他介绍道,在决定进军司法领域之前,国双专门聘用了一批在司法领域中代表顶层知识能力的行业专家,包括拥有数十年经验的法官、律师、检察官等,并寻找有法律背景的人从事数据和业务分析,组成专业的大数据科学专家团队,在知识能力基础上开展数据建模和解析挖掘工作,这对于法律知识图谱的搭建,至关重要。知识图谱之于人工智能,如同认知能力之于人脑,是让机器具备分析、预测、决策等智能的关键。
国双的大数据平台的强大运算能力,加之具备感知及认知人工智能技术的混和式人工智能,让法律文本剖析更加迅速,其所呈现的分析结果,能够助力法官进行决策。
在实践过程中,当然也走过不少弯路,这也是一个不断学习的过程,必须针对用户的痛点,来设计产品、解决问题。例如,过去我们是站在产品的角度去思考解决方案--国双曾经尝试把一个法律数据挖掘产品,采用“一问一答”方式解决问题的产品,给法官使用,结果收到法官的“差评”。差评的原因是因为法官没时间去通过提问来获得他想要的结果。得到反馈之后,国双开始针对业务场景、业务特点研发产品,例如同案智推,可以直接将案情、起诉状、庭审笔录输入计算机,并将判决方式推送给法官,而不是法官先去系统咨询,一步一步地得到结果。扭转思维的结果,让国双推出的解决方案,迄今为止,成功地服务最高人民法院、江苏省高级人民法院、四川省达州市中级人民法院等多家省市和地级法院。
坚持初心,做以前没有能力做的事情
在推出司法大数据解决方案、电子政务解决方案等业务之后,开始有人说国双现在处在战略转型期,利用产业人工智能和产业互联网来开拓业务,但亿欧网经过此次采访后发现,国双并不是战略转型,而是继续坚持初心,做以前没有能力做的事情。
据悉,国双董事长兼CEO祁国晟日前曾表示,过去市场上人们提大数据和人工智能,现在市场说产业互联网,但是国双一年多前就提出了“产业互联网”的概念和思路。而且国双最初的目标就是数据分析和人工智能,所以从三四年前就开始做自然语言理解,开始利用大数据、人工智能技术与实体经济相结合,因此国双要做的不是追赶产业互联网风口,而是需要坚持初心。
国双CTO刘激扬也指出“趋势为因,技术为果”,一方面是顺应潮流与行业趋势,另外一方面是国双认为自身的技术能力、产品能力、平台能力完全可以有效地把产业领域的数据变成价值。
拥有这样的底气,离不开国双强大的、自主创新的技术能力作为核心优势。
先看人才,据介绍,现在国双现在共有上千名员工,技术人员比例很高,还与人大、哈工大等高校成立联合实验室,通过产学研结合从外部引进技术和人才。
再看技术。国双是从大数据起家,其独有大数据平台,是支撑商业、司法、工业互联网等行业,驱动产业智能、促进企业数字化转型的核心竞争力。国双擅长构建分布式数据仓库、进行实时数据分析及处理非结构化数据,搭建集成式的数据管理和营销平台,拥有一套完整的自主研发的数据科学产品系列及解决方案。国双强大的分布式计算技术,可以体现在这次中国信息通信研究院(以下简称“信通院”)公布的第七批DCA大数据产品评测结果。
据了解,国双在近期公布的第七批DCA大数据产品能力测评中,以5款产品一次性通过7个能力评测,创下历届之最。
国双一次性通过7个DCA大数据产品能力评测
国双通过第七批大数据评测的产品包括:
- 国双ZETA大数据平台(Gridsum ZETA)
同时通过分布式批处理平台基础能力、分布式处理平台性能2个评测
- 国双并行数据仓库系统(Gridsum ZETA PDW)
同时通过分布式分析性数据库基础能力、分布式分析型数据库性能2个评测
- 国双网站分析软件(Gridsum WD)
通过用户行为分析产品评测
- 国双可视化分析平台(GVP)
通过商务智能(BI)分析工具评测
- 数据集成、抽取、清洗、转换软件
通过数据集成工具评测
其中,国双并行数据仓库系统 (Gridsum ZETA PDW) 是唯一一个通过分布式分析型数据库性能评测的产品。特别是在Hadoop性能测试中,国双与多家参与单位在同等测试环境下,SQL性能测试勇夺第一名,在TB级数据量下部分SQL执行时间可低于10秒钟,海量数据检索速度领先。
作为此项目的技术团队负责人,国双技术总经理杨基彬表示,DCA大数据产品能力测评的认证也是国双自身技术迭代升级的一个标志。他认为,与其他厂商演进路线不同,别人是自下而上利用开源技术先做大数据平台,没有实际的业务场景。与之相反,国双先从行业应用场景开始,之后逐渐把能力沉淀到底层技术。因此在测评中遇到其他厂商引进的全新业务场景时,国双能够迅速且敏捷地进行产品优化和扩展。因此,国双代表的是行业领先的全站式解决方案的大数据能力。
此外,作为一家创新驱动的科技企业,国双也十分重视知识产权的保护工作,将企业的核心竞争力稳稳握在手心。截止11月末,国双已拥有专利申请多达2700+个,其中涉及大数据和人工智能的分别接近300件和600件。
掘金工业互联网,推动行业数字化、智能化转型
有了人才、技术之后,如何将其与商业来结合?,除了文章开头提到的司法大数据解决方案,还有商业解决方案、电子政务解决方案、融媒体解决方案和工业互联网解决方案等。
国双工业互联网事业部副总经理朴志民表示,近年来国双深耕产业人工智能,除了人工智能中的深度学习技术和算法以外,国双希望能够将技术与行业或者产业业务场景结合,整合行业专家、数据科学团队与技术团队,真正解决传统行业的痛点。
工业领域同司法领域一样,必须要有行业专家的投入,充分与技术专家融合,才能真正了解行业痛点,规划妥善的解决方案,在已经具备的信息化基础之上,推动行业智能化转型。目前国双分别有针对油气、新能源汽车、风电、节能减排领域的工业互联网解决方案,朴志民认为在面对不同业务场景的难题时,一定要有行业专家团队、数据科学团队和基础的技术平台。专家的作用是快速找出各环节的问题和缩小数据挖掘维度,数据科学团队将数据快速转变为模型和算法,最后将数据科学团队搭建的模型和地理参数与技术平台结合,便能为具体业务场景提供个性化的定制服务。
此外,除了原有技术平台,国双的知识图谱能力也起到助推作用。所谓“知识图谱”即“知识互联平台”,机器学习能根据设备运行状况,结合历史判断是否出现故障,但是只能判断不能处理故障。知识图谱既能判断又能给出解决方案,通过把行业内的一些结构化、非结构化的数据(论文、著作、专家观点)以图谱的方式进行沉淀。
例如,某一设备有五种故障的可能性,知识图谱能根据历史数据能够判断出是哪一种故障和障碍,并智能化推送与之对应的解决方案。
据了解,由于业务场景的复杂程度不同,国双的工业互联网解决方案从驻场开始到整个项目交付,项目实施周期可能会比较长。打造一个工业互联网平台需要如此投入,投产比值吗?未来拓展其他领域的话,也需要付出如此高的成本?刘激扬的回答是肯定的。
“进入新领域不是一拍脑袋决定的,需要长期的市场分析和业务分析,分析新行业是不是有经济价值、社会价值和技术价值。比如油气行业的价值空间是巨大的,他们每年在设备维护方面的预算就有几百亿,如果国双把行业头部客户服务好,帮助其提效、增收、降本,提升内部治理能效,行业内的其他客户自然会认识到像国双这样的大数据企业的价值,进而可以一起合作,共同迎接数字化转型的智能时代。”刘激扬说。
在“2018亿欧创新者年会·企业智能服务创新者论坛”演讲时, 刘激扬曾提到:“国双能从三个方面为企业创造价值,第一是生产,涉及产品的研发和生产过程,第二是企业经营管理,第三是企业营销、销售和服务,从多环节着手,坚持利用大数据和人工智能能力为企业和政府机构的数字化、智能化转型赋能。”
其实,无论是产业人工智能还是工业互联网等行业的智能解决方案,都是助力传统行业数字化转型的载体,关注点应放在提高企业自动化水平、生产效率、增强竞争力和创造价值上,从这一点来看,恰与国双倡导的理念相符,相信当越来越多像国双这样的科技企业下沉到行业中时,定会迎来国内数字化转型的高峰期。
【注】数据中心联盟(Data Center Alliance,以下简称“DCA”)作为大数据领域重要的行业平台,一直致力于推进大数据产品评测,“DCA大数据产品评测”评审委员会由中国信息通信研究院、清华大学、中国科学院、北京邮电大学、中移信息、国电投、以及所有参与评测产品企业专家组成,经过4年的发展,“DCA大数据产品评测”已成为国内外极具权威的评测体系,已成为厂商产品研发和用户采购选型的风向标。