这个比赛分3个赛季
比赛的官网:
第一、二 赛季官网:http://102.alibaba.com/competition/addDiscovery/index.htm
第三赛季官网http://tianchi.alibaba.com/
由于奖品丰厚,且能有入职阿里的机会,且能亲身见识阿里的分布是处理平台ODPS。比赛有各大高校的团队,国内top20的大学基本上每个大学都有好多支队伍,竞争非常激烈,是我参加的所有比赛中竞争最激烈的。
主要就是 机器学习+分布式处理
第一、二赛季问题描述 官网上都有,第三赛季问题不同之处是每个用户推荐的brand的个数是一个确定的数,例如30;
所用语言主要是 java,sql,python,需要熟练使用阿里自己的分布式处理平台ODPS,以及mapreduce框架,第三季使用了阿里自己的图框架实现boosting的一些算法
使用的模型:Logistic regression,gbdt,Random forest,BP,是分类问题
第三赛季我们几个人用阿里内部的图框架实现了lambdaMART,因为我们当时认为这是一个learning to rank的问题。
同时使用了 itemCF,但itemCF的公式和代码都重新自己设计了。
机器学习的各种算法和适用场合的掌握很重要;