电子邮件分类数据集
数据集介绍: 本数据集可以作为一个基础的文本分类项目。 数据由电子邮件正文和用于文本分类的标签组成。 1)邮件正文 2)标签 文件中还有其他NLP数据。 本数据集转载自: https://www.kaggle.com/datatattle/email-classification-nlp
8559 位酷友已加入
计算机圈子中包含常用的技术文档、源代码、模型、数据集、学习教程、技术报告等干货资料,加入圈子可以上传、下载资料,也可以使用提问来寻求资料或分享你认为有价值的站外链接~
数据集介绍: 本数据集可以作为一个基础的文本分类项目。 数据由电子邮件正文和用于文本分类的标签组成。 1)邮件正文 2)标签 文件中还有其他NLP数据。 本数据集转载自: https://www.kaggle.com/datatattle/email-classification-nlp
数据集介绍: 每个.txt文件都包含一个说唱歌手发行歌曲的歌词。 下面是一段代码示例: 本数据集转载自: https://www.kaggle.com/rikdifos/rap-lyrics
数据集介绍: 表情符号在表达情感中起着至关重要的作用,本数据集可以直接用于表情符号的自然语言处理和情感分析。 下面是一段代码示例: 本数据集转载自: https://www.kaggle.com/divyansh22/emoji-dictionary-1
该数据集由有缺陷的电子换向器的图像构成,在电换向器中的塑料嵌入物的表面上观察到微观部分或裂缝,在八个不重叠的图像中捕获每个换向器的表面积,在受控环境中捕获图像。 数据集包括: 50个实物物品(变形的电子换向器) 每个项目8个表面 总共399张图片: 52张可见缺陷图像 347张图像没有任何缺陷 原始图片尺寸: 宽度:500像素 高度:从1240至1270像素 为了进行培训和评估,应将图像调整为512 x 1408像素 引用数据集时,使用以下引用:
现代艺术博物馆(MoMA)致力于帮助每个人理解,享受和使用我们的收藏。博物馆的网站上有来自20,956位艺术家的72,706件艺术品。艺术品数据集包含130,262条记录,代表已加入MoMA藏品并已在我们数据库中分类的所有作品。它包括每件作品的基本元数据,包括博物馆获得的标题,艺术家,日期,媒介,尺寸和日期。这些记录中有一些记录的信息不完整,被称为“未经馆长批准”。艺术家数据集包含15,091条记录,代表着所有在MoMA收藏中工作并且已在我们的数据库中进行分类的艺术家。它包括每个艺术家的基本元数据,包括姓名,国籍,性别,出生年月和死亡年。 数据集来自https://www.kaggle.com/momanyc/museum-collection