天池新闻推荐
目标: 为不同用户(测试为5万)分别推荐top5的新闻文章(总数36万)
标签:不同用户在不同时间的点击新闻
特征:
整体框架也是:多路召回+排序
召回
1 | # 定义一个多路召回的字典,将各路召回的结果都保存在这个字典当中 |
基于itemcf计算的item之间的相似度sim进行的召回
基于embedding搜索得到的item之间的相似度进行的召回
- YoutubeDNN召回
- YoutubeDNN得到的user之间的相似度进行的召回
- 基于冷启动策略的召回
排序
排序
- LGB的排序模型
- LGB的分类模型
- 深度学习的分类模型DIN
模型集成
- 输出结果加权融合
- Staking