微软新闻推荐数据集
文件列表(压缩包大小 51.47M)
免费
概述
本新闻推荐的数据集是从Microsoft新闻网站的匿名行为日志收集的,从2019年10月12日至11月22日的6周内随机抽样了100万用户,这些用户每人至少点击了5次新闻。 数据集中仅包含训练集和验证集,训练和验证数据都是一个zip压缩文件夹,其中包含四个不同的文件: behaviors.tsv:用户的点击历史和印象日志 news.tsv:新闻文章的信息 entity_embedding.vec:知识图中新闻的实体嵌入 lation_embedding.vec:知识图中实体间的关系的嵌入 behaviors.tsv: Impression ID:展示的ID User ID:用户的匿名ID Time:时间,格式为 "MM/DD/YYYY HH:MM:SS AM/PM" History:该用户的新闻点击历史,按时间排序 Impressions:此新闻列表中用户的点击行为(1-点击,0-非点击) news.tsv: News ID:新闻ID Category:类别 SubCategory:子类别 Title:题目 Abstract:摘要 URL Title Entities (entities contained in the title of this news):标题实体 Abstract Entities (entites contained in the abstract of this news):摘要实体
如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈
评论(0)