课外天地 李树青学生专栏南财信息技术实验室 → 2013届毕业生马健在阿里巴巴大数据竞赛天猫双11算法竞赛中获胜


  共有18468人关注过本帖树形打印复制链接

主题:2013届毕业生马健在阿里巴巴大数据竞赛天猫双11算法竞赛中获胜

帅哥哟,离线,有人找我吗?
admin
  1楼 博客 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信 管理员
等级:管理员 帖子:1945 积分:26736 威望:0 精华:34 注册:2003/12/30 16:34:32
2013届毕业生马健在阿里巴巴大数据竞赛天猫双11算法竞赛中获胜  发帖心情 Post By:2014/11/22 19:11:37 [只看该作者]

11月11日,在天猫“双十一”购物节完美收官的同时,第一届阿里巴巴大数据竞赛的竞赛结果也最终出炉。我校信息工程学院2013届毕业生马健同其他五人一起达成竞赛目标,获得本届阿里巴巴大数据竞赛优胜,共享百万奖金。

马健是我校信息工程学院2013届优秀毕业生。在校读书期间,马健就利用大量时间对编程语言、数据结构等科目进行深入钻研探究,力求掌握更高级的知识。在计算机编程、数据分析渐渐展露的他在校期间便展现出惊人的学术水平:竞赛方面,他曾获得过全国大学生数据建模大赛、全国大学生数学竞赛、全国大学生程序设计等国家级比赛一等奖;项目方面,申请个性化推荐方面的校级立项,所做网站被我校图书馆使用,并在核心期刊上以第一作者发表论文;申请教室图像无线远程监视系统的省级立项,现已获得实用新型专利授权。追求全面发展,综合素质水平较高的马健在2010年11月大二时即获得了“国家奖学金”荣誉。2013年从我校毕业后,马健同学顺利进入南京大学读研深造。

此次大赛是第一届阿里巴巴大数据竞赛,共有来自全球7276支团队共1万多人参加。马健算法团队,根据消费者的购物特征,包括消费周期、搭配购买等,为数百万的消费者提供个性化的服务与体验。经测算,在11月11日当天,马健团队算法的效果在原有推荐算法的技术上又优化15%,出色地完成了竞赛任务。马健团队在解决了长尾品牌的推荐问题的同时,也共同分享了百万元的奖金。

目前,大数据在近几年云时代的背景下已成为备受瞩目的焦点之一,也是各行业都在研究的战略话题,简而言之是将人群的意识和行为趋向通过数据反应,使之具备预测未来的能力。大数据最核心的价值就是在于对于海量数据进行存储和分析。相比起现有的其他技术而言,大数据的“廉价、迅速、优化”这三方面的综合成本是最优的。


 回到顶部
帅哥哟,离线,有人找我吗?
admin
  2楼 博客 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信 管理员
等级:管理员 帖子:1945 积分:26736 威望:0 精华:34 注册:2003/12/30 16:34:32
马健关于比赛信息的回复  发帖心情 Post By:2014/11/23 22:32:18 [只看该作者]

这个比赛分3个赛季
比赛的官网:
第一、二 赛季官网:http://102.alibaba.com/competition/addDiscovery/index.htm
第三赛季官网http://tianchi.alibaba.com/
由于奖品丰厚,且能有入职阿里的机会,且能亲身见识阿里的分布是处理平台ODPS。比赛有各大高校的团队,国内top20的大学基本上每个大学都有好多支队伍,竞争非常激烈,是我参加的所有比赛中竞争最激烈的。
主要就是 机器学习+分布式处理
第一、二赛季问题描述 官网上都有,第三赛季问题不同之处是每个用户推荐的brand的个数是一个确定的数,例如30;
所用语言主要是  java,sql,python,需要熟练使用阿里自己的分布式处理平台ODPS,以及mapreduce框架,第三季使用了阿里自己的图框架实现boosting的一些算法
使用的模型:Logistic regression,gbdt,Random forest,BP,是分类问题
第三赛季我们几个人用阿里内部的图框架实现了lambdaMART,因为我们当时认为这是一个learning to rank的问题。
同时使用了  itemCF,但itemCF的公式和代码都重新自己设计了。

机器学习的各种算法和适用场合的掌握很重要;

 回到顶部