谷歌本周三宣布它已经收购了卡耐基梅隆大学剥离出来的ReCAPTCHA公司,其目的是为了在数字化图书的时候减少网站上的诈骗。ReCAPTCHA提供简单的词谜语,要求用户在网站注册或者完成在线购物的时候必须要解开这个谜语。计算机不能识别扭曲的字母和数字,从而保证操作简单的是真正的人,而不是计算机程序。
然而,与其它字谜不同,ReCAPTCHA的文本来自于实际的图书,让这个系统在这个过程中创建一个数字化的版本。
这笔收购交易的条款没有披露。谷歌称,ReCAPTCHA工具将继续提供给任何网站使用。
谷歌已经在支持一个数字化图书并且在线提供这些图书的大项目。谷歌主要通过扫描和使用光学字符识别技术使这些文本成为可以搜索的内容。但是,光学字符识别技术对于比较老的、褪色的或者扭曲的字符不是很有效。在这种情况下,唯一有效的数字化作品的方式就是人工输入。
ReCAPTCHA提供了一种替代的方法。计算机不能识别的片断拆分为单独的词,用于在所有的互联网网站进行人类测试。ReCAPTCHA系统根据这些回答重新组合这本书的文本。
开发这个工具并且在2008年创建ReCAPTCHA公司的卡耐基梅隆大学计算机科学教授Luis von Ahn说,谷歌是最适合reCAPTCHA的。人们一开始就认为这个项目与谷歌有关系。因此,reCAPTCHA最终在谷歌找到一个家是有意义的。