滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

个性化阅读的过去、现在和未来

时间：2011-04-15 12:41:08 来源：互联网编辑：星辉 发表评论无障碍通道

以前曾经撰文讲过Topic Engine的过去、现在和未来。Topic Engine是一个生生不息的应用方向，因为从News Group、邮件列表、聊天室、论坛、Google News、博客圈子、群组。。。，人们一直因话题(有人也叫主题，英文为Topic)而聚集而交友，话题一直在生生不息层出不穷，组织形式在不断变异。

现在再讲讲个性化阅读的过去、现在和未来，也算是这个话题的延续。

一、概念定义

泛泛地说，只要是根据用户的历史行为(发言、标签等数据，点击流、分享、收藏、推荐、跳过等动作)，动态决定哪些资讯内容(论坛帖子、新闻资讯、博客、微博、等)呈现给用户，都叫个性化阅读。

二、历史阶段 2005年～2007年：

这个阶段还没有Social数据，所以：

首先需要用户选定对哪些分类频道感兴趣，比如历史、人文、明星、体育等。稍微聪明一点的做法，不让用户选分类，而是问用户几个问题，然后就大致匹配出用户的兴趣点。

其次，系统决定给用户展现哪些分类的资讯。

随着用户点击，资讯实时不断变化，点击越多，系统越了解用户的阅读喜好。

这阶段的问题是：

1、利用成熟的协同过滤算法，但由于都在追求实时计算，运算量较大，有一定技术门槛;

2、对用户背景还是不够了解，仅仅通过用户点击流终究太浅。

3、普遍存在冷启动问题。

2008年～2010年：

有了Twitter，有了Facebook，有了Social Graph，个性化阅读器纷纷利用Twitter/Facebook帐号登录，展现的资讯是用户自己好友的Timeline聚合，主要是合并那些被诸多好友推荐的热点链接、图片和视频。不过，这波潮过去之后，像http://thoora.com/ 、http://twittertim.es/等都没有找到足够的用户群，还没有像2005年杀出来的TechMeme那么成功。

这阶段的问题是：

1、依赖于Twitter/Facebook的Social Graph，依赖于好友推送，可供阅读的数据过少，可供计算的数据过少，限制了自身应用的发展;

2、除非与Twitter保持良好的关系，能拿到 Streaming Firehose 接口，提前积累用户数据，否则用户Timeline信息需要积累一段时间，造成大量用户登录后没有可阅读的数据。

2010年：

FlipBoard杀出重围，自动排版技术独步天下。

2011年：

随着国内新浪微博、豆瓣等拥有Interest Graph(兴趣图谱)+Social Graph(社交图谱)海量数据的网站崛起，成为主流数据源，如何把2005年到2010年这些探索择其优点都整合起来，成为一个大课题。

Zite的横空出世，被众人热捧为“Flipboard Killer”，强调的是基于社会化关系的个性化推荐阅读方式。而Flipboard目前的战略重点主要还是集成各种社会化应用及内容源，并以其创造性的阅读体验方式展现出来。国内已经有几家也在Zite的方向上，尤其是iPad应用上，动了起来。

三、热门?还是个性化?

在2009年SXSW大会上，SheGeeks 直言不讳：『

热门内容(Popularity)已经过时了，某种程度上令人讨厌。

我不想知道什么是最流行的，Techmeme已经帮我做到了。我想知道什么东西和我相关。我们需要更多“相关性过滤服务”。』

此时，会有几种做法：

1、以热点资讯为主(先有蛋)，以社交图谱为辅(后引入鸡)：将社交图谱引入热点资讯阅读中，像Quora(或中国的知乎)一样按人来隔离不同话题(不同热点)的讨论。Zite的方式类似于此。

2、以社交图谱为主：组织一度好友和二度好友的数据，做好数据挖掘。曾经有人在很久远的年代说过，“建立一个Social Network，每一个用户都推荐出自己喜欢的内容，那么被推荐得最多的，就一定是大多数人最受欢迎的内容。如果把这些推荐内容的用户区分成不同的群体，就会得到特定群体欢迎的内容。Digg的想法就源于此。不过，这需要用户有足够的动力去推荐自己喜欢的内容，否则，Network也无法形成”。

3、以人为阅读中心：有人很多年前说过“许多人的blog阅读体验和阅读闲谈专栏是相似的，他们选择读什么不读什么的判断依据不是话题，而是作者，因为只有这样才能保证阅读到的内容的质量”。

4、以Topic为中心：用户定义或发掘用户感兴趣的Topic，只要是一篇文章谈及了用户关注的某一个主题，那么就推送给他。或者来自于不同人的文章集中地探讨某个话题，那么把这些文章自动聚合为一个Dialogue(虚拟对话)，推送给用户。

除了第一种做法之外，我曾经尝试过其他三种做法。在中国的大环境下，要么数据过少，要么数据质量不高，都不能很好地做到有“发现、探索”、“新鲜、有趣”的冲击力。

当Social能完整地提供三重元素时： 1、你的身份标识(Indentity)：Who you are; 2、你的联系人或圈子(Contacts)：Who you know; 3、你的网际行为(Activities)：What you do 。

那么，Social Graph，Interrest Graph，再联合热点资讯，揉入2005年以来的协同过滤算法，至少能做到make something people want吧。

四、Interest Graph的变化

以前，郑昀针对不同人群做的信息聚合，单纯从内容分类(也就是靠自然语言处理的自动分类算法)做，属于从信息本身下手。这种方式有一个问题：

某一类人群，虽然有一些集中的阅读点，但还有边缘的共同兴趣。举例，如IT人群，虽然共享和推荐的大多数是IT科技文章，但也涌现出很多受欢迎的兴趣点，如韩寒的文章，如冷笑话，如创意趣味产品。

这也就是为何基于 Tag 方式的阅读模式，以及基于指定主题的追踪模式，都不容易持久耐用的原因。一个人群的阅读兴趣点是比较模糊的。对于一个人来说，如果一个信息过滤器供应点科技，供应点娱乐，适当补充些人文历史，就能保证一定的粘度。

所以，郑昀后来觉得从内容分类，由于不引入人工，只靠比较大条的自然语言处理分类，对于博文、微博、论坛帖子等文字质量不稳定的信息会分得很粗糙，所以改变思路，从人群分类开始做。

也就是，划分出目标人群，依靠人群来挑拣信息，NLP算法为辅。这样有一个额外的好处，人群的兴趣点在动态变，短期地变，长期地变，但由于锁定人群，所以筛选出来的信息也在变。而相比之下，自动分类做出的信息，隔几个月或半年后，就要重新训练机器，因为往往信息包含的语言特征变了。

这也是信息聚合中的一个实际考虑点。

现在，中国也有了自己的Interest Graph，比如新浪微博，它的数据天然就表明一个人的兴趣喜好，以及连续波动，都可以跟踪和挖掘出来。以前依靠遍历Twitter、Google Reader、FriendFeed的好友所得到的社群分离，现在通过新浪微博等Social Graph都可以得到类似的。

五、人员配比

一般我对这个领域(Topic Engine啦、个性化阅读啦、Meme Tracker啦)，研发人员配比是这么建议的：

爬虫2人，文本挖掘4人(新词发现+分词+分类一个人，实体识别与发现+情感趋势分析一个人，事件识别与发现一个人，User Interest Profile一个人)，数据挖掘和分析2人， Web前端展现(包括手持设备)3人，产品经理1人， 12人是一个比较不错的开局。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

黄金牛市下，赤峰黄金何以领跑A股金企？

2022-2024年，央行购金连续三年购金超1000吨，占总需求量20%以上，对金价的影响更大了。本轮黄金股显著落后金价涨幅，于今年初才开始启动大周期，主升浪确认源于赤峰黄金、招金矿业为首的龙头在4月11日…

04-18

湖北黄冈5.44亿液晶产业投资基金正式启动！

04-18

天翼云HBlock：教育考试院存储架构革新，数据存储痛点迎刃而解！

04-18

慧算账十年磨一剑，AI引领财税服务智能升级新航程

04-18

REDMI Turbo 4 Pro下周来袭！搭载骁龙8s，直面2.5K档竞品

04-18

小天鹅技术创新引领品牌飞跃，荣获三项行业大奖彰显实力

04-18

木星遭“氨冰雹”暴雨袭击，或改写气态行星研究篇章

04-18

霸王茶姬创始人商业布局揭秘：名下竟关联16家企业！

04-18

恒安集团创始人许连捷离世，留下生活用纸龙头与超十亿公益捐赠

04-18

关注公众号免费领取AI资料

内容是ITBEAR官方公益提供，没有任何套路，不收取任何费用！！！关注以上公众号，回复数字1，免费领取！（非微信打开，可先截图，然后在微信扫一扫里，选择相册里的截图扫码）以下是部分内容截图，内容持续更新AI已经是职场人的必备技能，不懂AI的人，会逐步被社会淘汰

04-18

安卓16新变化：勿扰模式快捷开关重磅回归！

04-18

罗博特科并购案现对赌协议，信息披露不足遭深交所警示

交易所认为，该消息对投资者作出投资者决策有影响，但罗博特科并未在重组报告中及时披露，直到落实函明确问询时公司才披露，所以，罗博特科、元颉昇、罗博特科实控人戴军、董事王宏军、董事会秘书李良玉未能保证申请文件和…

04-18

恒安集团创始人许连捷逝世，商界巨擘的传奇人生落幕

04-18

REDMI Turbo 4 Pro下周来袭，骁龙8s首秀，能否撼动2.5K档市场？

04-18

复古情怀价不菲！Windows 95“画图”挂镜售价2880元

04-18

点击查看更多 +

全站最新

宇宙生命新线索：太阳系外“化学指纹”开启技术软实力探索新篇章

星际访客闯太阳系：地球安全无忧，木星将成关键“守门员”？

《坎巴拉太空计划》：在欢笑与试错中，你也能成为航天英雄

木星“氨冰雹”暴雨成真，或改写气态巨行星研究篇章

太阳系外行星K2-18b：生命存在的“最强有力证据”现身？

湖北黄冈5.44亿液晶产业投资基金正式启动！

热门内容

本栏最新

湖北黄冈5.44亿液晶产业投资基金正式启动！

REDMI Turbo 4 Pro下周来袭！搭载骁龙8s，直面2.5K档竞品

小天鹅技术创新引领品牌飞跃，荣获三项行业大奖彰显实力

木星遭“氨冰雹”暴雨袭击，或改写气态行星研究篇章

霸王茶姬创始人商业布局揭秘：名下竟关联16家企业！

恒安集团创始人许连捷离世，留下生活用纸龙头与超十亿公益捐赠

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.