计算广告学是一个新兴的学科,由工业界驱动,逐步形成一个学科体系。近期互联网巨头在大学开设这样的课程,进一步推动了计算广告学的逐步完善,比如Yahoo在斯坦福开设了计算广告学的课程。国内百度在清华、北邮、南大等学校讲授了类似课程。
计算广告学,顾名思义是计算驱动广告的学科,这是相对传统的广告而言的。在传统广告中如电视广告,广告主不清楚受众是谁,什么年龄层,看完广告之后什么感受。甚至是电视的收视率都无法精确统计,就更谈不上广告的投放效果了。而计算广告就表现出更多的智能:广告主可以了解目标客户在哪,谁看了广告,广告的效果等等,这些都可以粗略计算出来。针对计算广告学目前还没有一个相对官方的定义。我们看到斯坦福大学对它的描述是:“计算广告学是一个综合学科,涉及大规模搜索、文本分析、信息检索、统计建模、机器学习、分类、优化和微观经济学。计算广告的核心问题是要找到在给定的环境下,用户与广告的最佳匹配。”这里的环境可以指代用户在搜索引擎中输入一个查询语句,或者用户阅读网页,或者是用户在便携式设备上观看电影。
总体而言,计算广告学要优化整个广告系统,平衡广告主、服务提供商(可以是搜索引擎,或者新闻门户)以及用户的利益,使其达到最大化。因此针对广告的效果而言,是需要可以计算的。比如网络广告里面的点击率、转换率等等,广告主可以通过计算广告学看到直接量化的广告投放效果,计算准确ROI。
对用户而言,他们大多数情况下只希望看到自己感兴趣的地广告。那么网络服务商首先要知道用户是谁,这个要通过用户的使用行为,日志数据挖掘,构建用户特征以及兴趣模型。当然这往往是一个很粗略的挖掘,并且用户的兴趣还会出现动态变化。所以有时候会需要对用户的网络使用行为进行实时计算,并即时调整,比如用户的搜索点击行为,就可以作为一个参考数据。如果用户对搜索第一页呈现的广告没有点击,就说明可能广告匹配没有做好;那么在翻到第二页的时候就可以根据之前的行为调整广告。当然这种技术对实时计算要求比较高。
其次是广告主与服务提供商之间的合作,这里面有博弈论、拍卖机制等相关科学问题。毕竟从产业生态系统的角度来看,每个角色获得足够的利益才可以使整个产业链繁荣,每个角色如果获得过多的利益而损害了合作伙伴,最终都会影响到整个产业,也包括自己。比如搜索引擎的竞价排名,对竞价的机制要进行科学的设计,根据博弈论的理论来说,没有机制约束的选择肯定不是最优的。在搜索竞价排名中,假设没有机制约束,排名第二的广告主希望略高于第三名的竞价,可以减少预算,同时也不会改变其展示的名次。以此类推第一名希望略高于第二名,第三名希望率高于第四名,那最终的结果就是大家的竞价趋近于0,这实际上就破坏了竞价排名的商业模式,对整个产业造成伤害。因此,竞价排名的机制设计至关重要,要充分平衡双方的利益。
此外,计算广告学还要涉及自然语言处理、机器学习等相关学科。比如利用自然语言处理,才可以更好地识别网页的内容,理解上下文,这样才可以结合用户特征展示“最匹配“的广告。而机器学习更多的时候是在帮助完善这一匹配,不断调优系统。
从根本上来说,计算广告学之所以能够兴起,主要原因也来自于互联网公司的大数据能力。大数据解决了几个计算广告学相关的关键问题:
² 海量用户数据的挖掘
² 实时大数据计算(流计算)
² 用户与广告特征提取与匹配
² 语义网络的构建
百度之所以在国内开展计算广告学相关课程,一方面百度搜索引擎每天几十亿的搜索,强大的“凤巢”推广系统;另一方面百度网盟联合了24个行业、30万家网站,每天都要将大量的客户推广信息以文字、图片、动画等多种形式展现在目标人群浏览的网页上。一方面积累的大量的商业推广经验,同时也积累了以大数据挖掘、自然语言处理、机器学习等相关技术。如果将这些技术汇聚形成计算广告学,并向高校传播,这将是一个造福整个数字时代的事情:让有需求的客户找到商家,商家也可以更准确、更节约投放广告。并让更多的科技工作者加入这一领域,完善这个复杂的过程。计算广告将逐步取代传统广告粗放式的广播模式,减少信息的不平衡性并减少视觉污染,将成为未来数字商业的基石。