【ITBEAR】Google Research近日发布了一项名为InkSight的前沿人工智能技术,该技术能够直接提取手写文字图片中的数字文本,无需任何中转设备,为手写文字识别带来了革命性的进步。
与传统的依赖光学字符识别(OCR)技术相比,InkSight在处理含有复杂背景、模糊或光线不足的手写文字时展现出更高的性能。该技术采用了一种模拟人类学习阅读的方法,通过反复重写文本来掌握单词的外观和意义。
特别InkSight在应对复杂场景下的手写文字识别时表现尤为出色。即便文本部分被遮挡或存在背景干扰,它也能精准地识别出手写内容。研究结果显示,人们阅读由InkSight生成的文本描摹时,准确率高达87%,且其中三分之二的描摹与真实手写极为相似,难以区分。
对于喜爱手写的人群而言,InkSight技术无疑具有巨大的应用潜力。用户只需拍摄手写笔记的照片,便可迅速将其转换成可搜索的数字文本。即便是对于字迹潦草的内容,InkSight也能实现清晰、精确的打印文本转换。
然而,在手写识别AI技术领域,谷歌并非孤军奋战。亚马逊的Kindle Scribe电子阅读器以及数字笔记应用Goodnotes等也已推出类似功能,旨在将手写文字转换成可编辑的数字文本,共同推动这一领域的发展。