课外天地 李树青学生专栏南财信息技术实验室 → 2013届毕业生马健在阿里巴巴大数据竞赛天猫双11算法竞赛中获胜


  共有17129人关注过本帖平板打印复制链接

主题:2013届毕业生马健在阿里巴巴大数据竞赛天猫双11算法竞赛中获胜

帅哥哟,离线,有人找我吗?
admin
  1楼 博客 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信 管理员
等级:管理员 帖子:1939 积分:26594 威望:0 精华:34 注册:2003/12/30 16:34:32
马健关于比赛信息的回复  发帖心情 Post By:2014/11/23 22:32:18 [只看该作者]

这个比赛分3个赛季
比赛的官网:
第一、二 赛季官网:http://102.alibaba.com/competition/addDiscovery/index.htm
第三赛季官网http://tianchi.alibaba.com/
由于奖品丰厚,且能有入职阿里的机会,且能亲身见识阿里的分布是处理平台ODPS。比赛有各大高校的团队,国内top20的大学基本上每个大学都有好多支队伍,竞争非常激烈,是我参加的所有比赛中竞争最激烈的。
主要就是 机器学习+分布式处理
第一、二赛季问题描述 官网上都有,第三赛季问题不同之处是每个用户推荐的brand的个数是一个确定的数,例如30;
所用语言主要是  java,sql,python,需要熟练使用阿里自己的分布式处理平台ODPS,以及mapreduce框架,第三季使用了阿里自己的图框架实现boosting的一些算法
使用的模型:Logistic regression,gbdt,Random forest,BP,是分类问题
第三赛季我们几个人用阿里内部的图框架实现了lambdaMART,因为我们当时认为这是一个learning to rank的问题。
同时使用了  itemCF,但itemCF的公式和代码都重新自己设计了。

机器学习的各种算法和适用场合的掌握很重要;

 回到顶部