天池新闻推荐

目标: 为不同用户(测试为5万)分别推荐top5的新闻文章(总数36万)

标签:不同用户在不同时间的点击新闻

特征:

整体框架也是:多路召回+排序

召回

1
2
3
4
5
6
# 定义一个多路召回的字典,将各路召回的结果都保存在这个字典当中
user_multi_recall_dict = {'itemcf_sim_itemcf_recall': {},
'embedding_sim_item_recall': {},
'youtubednn_recall': {},
'youtubednn_usercf_recall': {},
'cold_start_recall': {}}
  1. 基于itemcf计算的item之间的相似度sim进行的召回

  2. 基于embedding搜索得到的item之间的相似度进行的召回

  3. YoutubeDNN召回
  4. YoutubeDNN得到的user之间的相似度进行的召回
  5. 基于冷启动策略的召回

排序

排序

  1. LGB的排序模型
  2. LGB的分类模型
  3. 深度学习的分类模型DIN

模型集成

  1. 输出结果加权融合
  2. Staking

参考

https://tianchi.aliyun.com/notebook-ai/detail

Author

Lavine Hu

Posted on

2022-06-09

Updated on

2022-06-09

Licensed under

# Related Post
  1.冷启动
  2.youtubednn
  3.推荐系统评价指标
  4.推荐系统
Comments

:D 一言句子获取中...