去年12月,微软推出了Hotmail的最新过滤灰色邮件功能,所谓灰色邮件是一些网站的邮件列表,它们并非垃圾邮件,有些时候还有用,但数量庞大给用户造成不少困扰,Hotmail可以通过算法将其归类,从而不影响用户阅读正常邮件。今天微软Live博客透露了SmartScreen过滤功能是如何识别这些灰色邮件的。
微软发现,真正“人对人”的电子邮件仅占所有邮件的14%,而除去垃圾邮件的庞大数量,灰色邮件竟然高达82%。
因此微软通过自己的算法识别出不同的零售商,俱乐部,社团,学校,或优惠信息,交易记录报告等信息,将其归类到一个类别。
具体的算法可以从邮件内容中统计取样而获得,例如列表退订信息,发送电子邮件地址以及其特定的用户群,甚至引入了语语义识别的算法来更有效率地过滤掉类似于金融对账单等信息。