2011年3月6日星期日

2011推荐系统高峰论坛――参后感

最近家事繁多,好久没更新Blog了。
今天参加
http://www.resysforum.org/
2011推荐系统高峰论坛,说来小有周折。消息刚放出来不久,同事zhangyifei就组织我们几个FreeWheeler报名了,结果被拒了。然后前几天我忽然收到resys内部人士邀请,让我去了。猜着可能是看在我是resys第一次线下活动的speaker之一的面子上吧。总之作为已经成为resys领域outer的我很是喜出望外,今天一大早,就背着小板凳去了。想必像我这样"走后门"进去的,顶多是张站票罢。不料竟然还有地方坐,让我很是Happy。在我之后进来的一些人,站在会场后面,让我很如坐针毡,很想把小板凳掏出来给他们,可是给谁不给谁呢,都不认识,再招他们互相谦让得打起架来就不好了,而且做小板凳上恐怕就看不见大屏幕了。算了,还是悄悄坐在我自己的位子上吧。


据谷文栋说,今天地大这场是resys第五次线下活动了,有1000多人报名,而第一次活动只有30来个人。第一次绝大多数是热心搞算法的草根或学生。这次,世界顶级学者、搞工程的、搞产品设计的、搞系统运维的,"啥都有"。

Koren介绍了Y!的一些最新研究,是今天最好的一个lecture。
分析了一下Netflix样本方差来源,超过一半无法用模型解释,可解释的成分中,"公认怎么样+个体打分松紧程度"占了一大部分。
推荐系统现在的发展,越来越多的和用户研究掺和在一起了。User Research原本是一个独立的功能机构,一提它,大多数人的第一反应是眼动仪和心理学专家。现在推荐系统揉进去,不仅多了一些统计学习的东西,而且日益工程化了。
用户研究,很直接的一个手段就是问卷调查。如果受某些限制只能问K个形如"你喜欢item i吗"这样问题,那么这K个item如何选取?Koren给出了一个cost function,使得给定的推荐算法在这组item上均方根误差最小,也就是说,当前模型能够较为准确刻画这组item,这样问用户,才能较为准确的理解用户的喜好。
另一个方法是决策树,它每次只问用户一个选择题,等用户选择完以后,根据用户的回答再问第二个问题,这样更为有效。
这两个办法都无法回避的问题是:用户可以回答"没听说过",这样你就没办法知道用户的喜不喜欢,就白问了。所以不能轻易问太小众的item。
推荐系统应用到"问答社区",就是把好问题推送给能高质量回答它的人。
另外,它提出置信度作为评价推荐系统的一个指标,可以改善推荐质量,例如可以对置信度低的预测点给予一定的"高斯模糊"。而置信度的计算,其实每一种模型都有给出,可惜人们往往无视他存在的意义。


淘宝作为spnsor有两场lecture,第一场比较概括,有三点引起了我的思考。
1、淘宝在推自动化数据运行,逐步替代人肉管理商品目录。随着广告市场的发展,我认为以后ad trafficker也有自动化的趋势,一些智能工具的价值将得到凸显。
2、数据可视化和交互是数据挖掘的重要手段。我认为,他不仅是数据探索的工具,更是结果表示的方法。
3、淘宝今年成立了研究院。没搜到,不知为何物,关注中。

淘宝第二场
1、推荐与广告的关系:掐。推荐系统是营销部做的,旨在提高更多long tail卖家的关注度,改善消费者的购物流程,优化整站生态。广告是广告部做的,是拿卖家钱,就要像狗一样给卖家效力,处处为给钱的人着想。
2、用户在不同阶段有不同的推荐需求,按时间顺序是发散、收敛、再发散的过程
四处闲逛阶段:各种大跨度的试探性推荐,揣测闲逛者的消费意图
精益求精阶段:发现用户开始货比三家,猎物相似了,那就要把推荐的范围逐渐缩小了,加速消费者下订单、支付的进程,说,嗨哥们儿别犹豫了,就它了!这时候再给他推荐一些天马行空的东西,没准人家一走神点走了,就不买这个了,去东逛逛西逛逛,一拍大腿啊呀三个小时过去了,人家说我得干点正事了,得,把浏览器关了。
意犹未尽阶段:这时候再开展你"啤酒=>尿布"的数据挖掘伎俩,推荐些哪怕看似不想关,却在统计数字上有关联的商品,即使推荐的莫名其妙,也无伤大雅,反正最坏情况就是就此打住,没准弄好了还能神奇的再下一城。
3、实时训练与预测。在燕莎、在双安、在大悦城,好的导购能通过消费者嘴角一个0.13秒的翕动,在0.013秒内判断其消费意图并推荐合适的商品,电子商务的推荐算法必须要向这样的导购一样。慢了,消费者就把tab关了,或者已经买完走了玩别的去了。

百度,大纲级
很适合我的口味,讲了很多我很有兴趣的学术界研究的课题,比如Learning to Rank。
演讲者高屋建瓴地将机器学习的问题归为三个:回归、分类和密度估计。听着很像统计学习的口吻,不知道工业界搞商业智能的兄弟们知不知道密度估计有什么应用,反正孤陋寡闻的我是闻所未闻。
五个成分:数据、机器表示、目标函数、cost function和evaluator
现实世界中的学习,几乎都是PU learning(partial learning),大量数据缺失,大量未标定数据。
一个我不太熟悉的模型:Prob Latent Topic。好像是十年前特别火的一个模型,读研时看文献综述的时候一坨一坨这玩意儿,但是在netflix price中表现很差,也可能是我当时实现的不好,又没机器去没日没夜的调参。总之,玩不转。三个方法:EM/Gibbs Sampling/梯度下降。
Learning to Rank三个方法:SVM、Boost和NN。可惜因为空间复杂度太高,没什么工业应用。
一个观点:ReSys以后将成为互联网应用的基础设施。哇塞,太牛了,听的让我热血沸腾,我以前只听说有人争论推荐系统究竟是个feature还是个product。基础设施是什么?在我脑海中就是磁盘阵列、路由器之类能被会计算作固定资产的东西。以后推荐系统也是,太牛了。
好的推荐系统的四要素:UI/UX占40%(难怪PM有饭吃),Data占30%,领域知识占20%,算法占10%。听的在坐的学生们心灰意冷,纷纷微博上墙感慨人生。
推荐系统研究的未来发展方向:领域专家系统、迁移学习和Temporal-bias。
还提到了Behavior Targeting:把恰当的广告推荐给对他最有用的用户。在我刚踏出校门的时候,我觉得这简直太美妙了。现在的我觉得,这想法太前卫了。

前Google研究员
将MapReduce在机器学习中的应用,比较工程。对于一个C++程序员来说,听的非常实在,没有一句话是飘在空中的,都是code。
学到一点:用BDB的B+树做外排,太毁硬盘了,因为要频繁读写一个Block。应该用内排加外部merge sort。

Hulu
这个之前聊过,很多都听过了。只记了一些新鲜的。
Hulu没有Live Sport。
内容分两种,On air show和lib show,On air show在Hulu上只能放最近5集,因为之后DVD上市,要是还在Hulu上能看到,谁还去买?
Seasonality是时间序列分析的重要话题,Hulu的Seasonality特征鲜明:暑期、圣诞是On air show的两个波谷。连续剧每周出一集。
Catch-up效应:show的日访问量关于days after release基本上是负指数曲线。
广告效果评估:Brand recall。奇怪FreeWheel研发这边怎么没人提过这个,估计美国那边在弄吧。
预测匿名流量的Demograph info,用于Demographic targeting。
Demographic targeting是广告主最容易接受的targeting方式,其次是Geo, daypart, category。。。
Behavior targeting的逻辑:请第三方来证明Hulu存在用户群A,具有购买商品P的习惯。然后Hulu通过某种方式,将用户群A具象化到一个形式化的targeting范围T里。向商品P的卖家或品牌广告商推荐:将广告targeting在T上吧!
在场有人质疑:品牌广告商需要支付更高的CPM来通过Behavior targeting保持现有用户群吗?以我对广告商的理解,是需要的,因为以他们的非理性程度和对人性深刻的把握,足以做出任何在常人看来是蠢事的事。





1 条评论:

正鸿 说...

great!
总结真是详细