课外天地 李树青学习天地推荐系统原理课件 → [转帖]工业学术界用户画像 User Profile实用知识资料全集


  共有7816人关注过本帖树形打印复制链接

主题:[转帖]工业学术界用户画像 User Profile实用知识资料全集

帅哥哟,离线,有人找我吗?
admin
  1楼 博客 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信 管理员
等级:管理员 帖子:1843 积分:24846 威望:0 精华:34 注册:2003/12/30 16:34:32
[转帖]工业学术界用户画像 User Profile实用知识资料全集  发帖心情 Post By:2017/11/13 12:07:39 [只看该作者]

【导读】主题荟萃知识是专知的核心功能之一,为用户提供AI领域系统性的知识学习服务。主题荟萃为用户提供全网关于该主题的精华(Awesome)知识资料收录整理,使得AI从业者便捷学习和解决工作问题!在专知人工智能主题知识树基础上,主题荟萃由专业人工编辑和算法工具辅助协作完成,并保持动态更新!另外欢迎对此创作主题荟萃感兴趣的同学,请加入我们专知AI创作者计划,共创共赢! 今天专知为大家呈送第十三篇专知主题荟萃-用户画像知识资料大全集荟萃 (入门/进阶/竞赛/论文/PPT等),请大家查看!专知访问www.zhuanzhi.ai,  或关注微信公众号后台回复" 专知"进入专知,搜索主题“用户画像”查看。此外,我们也提供该文网页桌面手机端(www.zhuanzhi.ai)完整访问,可直接点击访问收录链接地址,以及pdf版下载链接,请文章末尾查看!此为初始版本,请大家指正补充,欢迎在后台留言!欢迎大家分享转发~

用户画像——专知荟萃
基础入门
进阶文章
竞赛
Papers
视频教程
PPT

基础入门

架构师特刊:用户画像实践 by infoq
http://www.infoq.com/cn/minibooks/profile-in-practice
luckydogzzy 用户画像学习日记
https://www.gitbook.com/@luckydogzzy
用户画像学习日记: https://www.gitbook.com/book/luckydogzzy/-/details
用户画像文章整理(一):https://www.gitbook.com/book/luckydogzzy/yhhxzl1/details
用户画像文章整理(二):https://www.gitbook.com/book/luckydogzzy/-yhhxzl2/details
用户画像从入门到挖坑 by xrzs
https://my.oschina.net/leejun2005/blog/906225
浅谈用户画像在电商领域的现状和发展
http://www.woshipm.com/user-research/673939.html
永洪BI:手把手教您搞定用户画像
http://news.yesky.com/prnews/280/85552280.shtml
基于大数据的用户画像构建(理论篇)by 简书
http://www.jianshu.com/p/0d77238771ef
知乎问题:什么是用户画像呢?一般用户画像的作用是什么? by
Alex Chu的回答 - 知乎 https://www.zhihu.com/question/19853605/answer/73136157
Tristan的回答 - 知乎 https://www.zhihu.com/question/19853605/answer/105450827
关于用户画像那些事,看这一文章就够了
https://mp.weixin.qq.com/s/w1b4tHx10ZJAbXD4OoPI6w
看完后,别再说自己不懂用户画像了
https://mp.weixin.qq.com/s/ac7z7OolNQjlPKFZtxjstA
用户画像,找到为你产品买单的那群人
https://mp.weixin.qq.com/s/fVtsBB6XBbHmer5nMBE67A
内部课程|巧用“用户画像”进行个性化运营
http://mp.weixin.qq.com/s/ZDXKSLAj3KnZP--0AV9z5A
【干货】浅谈“用户画像”方法
http://mp.weixin.qq.com/s/4TthBAMe8PeV-8iAoC_WAw\

进阶文章

深度学习在用户画像标签模型中的应用
https://neway6655.github.io/deep%20learning/2017/07/24/deep-learning-in-user-profile-practice.html
腾讯防刷负责人:基于用户画像大数据的电商防刷架构
https://mp.weixin.qq.com/s/E3AsKqWDDgVbqHHr1itW6Q
用户画像系统实践 by 1号店精准化部架构师
http://7xnz4l.com1.z0.glb.clouddn.com/Arch043.pdf
外卖O2O的用户画像实践 by 美团点评技术团队
https://tech.meituan.com/waimai-ups.html
数据驱动精准化营销在大众点评的实践 by 美团点评技术团队
https://tech.meituan.com/dp-growth-hacker.html
基于内容和用户画像的个性化推荐
http://www.rowkey.me/blog/2016/04/07/up-recommend/
基于知识图谱的用户理解 肖仰华 复旦大学
https://mp.weixin.qq.com/s/8rujPmAy7q35kiJ7QVTABw
基于知识图谱的用户画像关键技术 肖仰华 复旦大学
https://pan.baidu.com/s/1hsKSoyK
大数据背后的360度用户画像,助力11.11新零售
http://www.pmcaff.com/article/index/1009814922629248?from=label&pmc_param%5Blabel_name%5D=

竞赛

2016CCF 大数据精准营销中搜狗用户画像挖掘 代码
一等奖 https://github.com/hengchao0248/ccf2016_sougou
二等奖 https://github.com/AbnerYang/2016CCF-SouGou
第五名 https://github.com/dhdsjy/2016_CCFsougou2
https://github.com/xmojiao/CCF-Competition_Sogou
SMP 2016 技术评测
新浪微博数据(包括用户个人信息、用户微博文本以及用户粉丝列表,详见数据描述部分),进行微博用户画像
http://www.cips-smp.org/smp2016/public/cup.html
第五名 https://github.com/scaufengyang/smpcup2016/tree/master/code
https://github.com/aprilvkuo/user_profiling_competition
SMP 2017 CSDN用户画像技术评测
https://biendata.com/competition/smpcup2017/

Papers

App2Vec: Vector Modeling of Mobile Apps and Applications
http://paul.rutgers.edu/~qma/research/ma_app2vec.pdf
Personalizing search via automated analysis of interests and activities
J Teevan, ST Dumais, E Horvitz - … of the 28th annual international ACM …, 2005
https://dl.acm.org/citation.cfm?doid=1076034.1076111
Automatic identification of user interest for personalized search 2006
https://dl.acm.org/citation.cfm?id=1135883
Implicit user modeling for personalized search X Shen, B Tan, CX Zhai  CIKM 2005
https://dl.acm.org/citation.cfm?id=1099747
User profiles for personalized information access S Gauch, M Speretta, A Chandramouli, A Micarelli 2007
https://link.springer.com/chapter/10.1007%2F978-3-540-72079-9_2?LI=true
Interest-based personalized search Z Ma, G Pant, ORL Sheng - ACM Transactions on Information Systems …, 2007 https://dl.acm.org/citation.cfm?id=1198301
Mining long-term search history to improve search accuracy B Tan, X Shen, CX Zhai  KDD 2006
https://dl.acm.org/citation.cfm?id=1150493
Potential for personalization J Teevan, ST Dumais, E Horvitz 2010
https://www.researchgate.net/publication/220286342_Potential_for_Personalization
Towards TV recommender system: experiments with user modeling M Bjelica - IEEE Transactions on Consumer Electronics, 2010
https://www.researchgate.net/publication/224184101_Towards_TV_Recommender_System_Experiments_with_User_Modeling
Modeling user posting behavior on social media Z Xu, Y Zhang, Y Wu, Q Yang SIGIR 2012
https://dl.acm.org/citation.cfm?id=2348358
Extracting multilayered Communities of Interest from semantic user profiles: Application to group modeling and hybrid recommendations I Cantador, P Castells  2011
https://dl.acm.org/citation.cfm?id=1982988
U-sem: Semantic enrichment, user modeling and mining of usage data on the social web F Abel, I Celik, C Hauff, L Hollink 2011
https://arxiv.org/abs/1104.0126v1
Weakly Supervised User Profile Extraction from Twitter. 2014
http://www.stanford.edu/~jiweil/ppt/attribute.pdf
Harvesting multiple sources for user profile learning: a big data study
A Farseev, L Nie, M Akbari, TS Chua 2015
https://dl.acm.org/citation.cfm?id=2749381
Improving user profile with personality traits predicted from social media content R Gao, B Hao, S Bai, L Li, A Li, T Zhu 2013
https://dl.acm.org/citation.cfm?id=2507219

视频教程

电商大数据应用之用户画像, 慕课网
[http://www.imooc.com/learn/460]
专访阿里交互数据师:如何通过数据挖掘用户画像
http://meia.me/course/169353
腾讯高级产品经理:如何做好用户画像、用户研究、竞品分析?
http://v.youku.com/v_show/id_XMTU0ODU3NTkzMg==.html?spm=a2h0k.8191407.0.0&from=s1.8-1-1.2\
用户画像、性格分析与聊天机器人 by 微软亚洲研究院研究员 谢幸
http://v.youku.com/v_show/id_XMjY1OTkzMzYzNg==.html?spm=a2h0k.8191407.0.0&from=s1.8-1-1.2\

PPT

用户画像的构建及应用 BY 百分点
https://wenku.baidu.com/view/3d5fb37a6f1aff00bed51eeb.html
基于Spark的实时用户画像分析系统-汪飞-1027
https://wenku.baidu.com/view/ff3676d752d380eb63946d24.html
【分享31页PPT】基于用户画像的大数据挖掘实践
https://wenku.baidu.com/view/684129ba0b1c59eef9c7b443.html
【业界实战】小米大数据总监司马云瑞详解小米用户画像的演进及应用解读(附报告pdf下载)
https://mp.weixin.qq.com/s/95Zklj8ovheQV3Gnc-2h-Q

 回到顶部
帅哥哟,离线,有人找我吗?
admin
  2楼 博客 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信 管理员
等级:管理员 帖子:1843 积分:24846 威望:0 精华:34 注册:2003/12/30 16:34:32
为什么科学家的研究兴趣老变?  发帖心情 Post By:2017/12/9 19:03:06 [只看该作者]

研究和理解科学家研究兴趣的转移与演化具有重要意义。Nature Human Behaviour上近期的一篇论文用“海滩游走”(seashore walk)模型解释其内在的演化规律与特性。


步一 / Indiana University


注:图片来源于参考文献中的论文


科学家像『海边捡贝壳的孩子


牛顿说:在我的科学生涯中,我就像一个在海滩上玩的孩子一样,找啊找,最终找到了更美丽的贝壳。科学家研究兴趣的变化也大致如此。


科学家的研究兴趣并非一成不变的,而是随着社会变迁、技术进步、文化兴起而不断变化。例如,十年前,科学家的研究兴趣并不包括人工智能、大数据等。科学计量学中科学家“研究领域”的测度,主要使用以下几种方式:

  • 使用文献关键词、题名、摘要或者全文进行自然语言分析;

  • 使用主题建模方法;

  • 使用数据库提供的分类号。


尽管以往存在一些研究,对于科学家研究兴趣的转移进行了一定的定量描述,但极少有文章使用大规模数据,以物理建模和拟合的方式,对科学家研究兴趣演化机制进行探讨。今年,Tao Jia教授等人在Nature Human Behaviour上发表了一篇论文在这一领域做了尝试。


科学家的职业生涯与研究兴趣


Tao Jia教授等人使用了美国物理学会(APSAmericanPhysical Society)中含有物理学与天文学分类号的数据集。数据集包含了1976-2009年间发表的物理学领域的论文;这些论文的作者姓名已经由前人进行了消歧。


科学家在数据集中第一篇文章的发文年份被视为该科学家职业生涯的起点,而在数据集中最后一篇文章的发文年份则被定义为终点。作者首先选取了所有科学家职业生涯最开始的两篇和最末的两篇文章(m=2),然后获取这四篇文章在数据集中的分类号(同一篇文章可能被标记多个不同的分类号);作者用分类号的前两位代表论文所在的大类。随后,作者使用余弦相似度计算每位科学家职业生涯开始和结束时期的话题相似度。为了得到更具有鲁棒性的结果,作者尝试选取了不同的m值进行同样的计算,得到了类似的结果。这表明m值的选取对于实证结果整体影响不大。


科学家研究兴趣的变化


作者随后提出三种不同的特性来理解科学家职业生涯中研究兴趣的转移。

  • 异质性(heterogeneity)强调,科学家在其职业生涯中发表的论文可能在研究话题上有所重复,但有些可能只出现一次。

  • 新近效应(recency)则假设,科学家在研究过程中会尽量避免回到之前研究过的话题中,这导致他们倾向于探索更新的研究话题。

  • 主题相近性(subject proximity)则认为,当科学家准备变换其研究话题时,他/她更可能选择和之前研究话题类似(但不是相同)的研究话题。


为了更好地探索这三种特性是否会潜在影响科学家研究领域的转移,作者使用了三种不同的方式建立了三种不同的对照模型。研究发现,这三种特性都影响着科学家研究兴趣的转移。其中,异质性和主题相近性起到了对现有研究领域深度挖掘和探索的作用,但新近效应则相反,它驱使科学家探索新的研究领域。

 

用『海滩游走』模型解释『为什么科学家的研究兴趣老变』


科学家寻找研究兴趣的过程与牛顿在海滩建筑贝壳的过程相似。因此,作者使用上图中的“海滩游走”(seashore walk)模型来解释科学家的研究兴趣的演化。在这一模型中,“海滩”上有某一数量的点,某些点上存在一定数量的贝壳,存在多种类型的贝壳,每种类型代表一种研究话题,贝壳数量在各点上的概率分布为P(q),有可能某些点上不存在任何种类的贝壳。科学家随机从“海滩”上选择一个点,然后向左或者向右随机行走,向左和向右的概率均为0.5;他(她)有可能在某些点上经过两次或两次以上;走到的点如果有贝壳,则代表发表了一篇某种研究话题的论文。科学家每走一步代表着一个单位的时间过去,他(她)所走的总步数等于其科学职业生涯包含的总时间(即数据集内最后一篇他的论文与最先一篇他的论文的时间之差)。作者成功拟合了实际数据。



 

参考文献


Jia, T., Wang, D., & Szymanski, B. K.(2017). Quantifying patterns of research-interest evolution. Nature Human Behaviour, 1, 0078.

[此贴子已经被作者于2017-12-09 19:03:25编辑过]

 回到顶部