计算机

计算机 · 圈子

8559 位酷友已加入

计算机圈子中包含常用的技术文档、源代码、模型、数据集、学习教程、技术报告等干货资料,加入圈子可以上传、下载资料,也可以使用提问来寻求资料或分享你认为有价值的站外链接~

关注推荐最新

热门标签

计算机

计算机·圈子   首发

Lisa 更新了
资源

文本情感检测数据集

文本情感检测数据集 介绍 文本情感检测是自然语言处理中的一个难点,其原因是标记数据集的不可用性和问题的多类性。 人类有各种各样的情绪,很难收集到每一种情绪足够的记录,因此出现了阶级失衡的问题。 这是可用于情绪检测的带有标记的数据集,目的是建立一个有效的模型来检测文本中表达出的人类情绪。 内容 这些数据基本上来源于社交网络的推文,每一个都标注了推文背后的情绪。 数据集有三个列:推文ID、情感和内容。 本数据集包含13种不同的情绪,共有40000个记录。 数据集转载自 https://www.kaggle.com/pashupatigupta/emotion-detection-from-text

计算机

计算机·圈子   首发

Lisa 更新了
资源

垃圾邮件数据集

垃圾邮件数据集 介绍 由来自 Spam Assassin(垃圾邮件杀手)的电子邮件所创建的模型,可以帮助收件人的邮箱区分垃圾邮件和非垃圾邮件。 内容 所有文件都可由Python电子邮件库读取。 数据集包含以下三个特征: 垃圾邮件常用的词语 垃圾邮件中链接 垃圾邮件的主题 数据集转载自 https://www.kaggle.com/veleon/ham-and-spam-dataset

计算机

计算机·圈子   首发

anna 更新了
资源

心跳声音数据集

该数据集是针对机器学习来对心跳声音进行分类的。 数据来自两个来源:(A)通过iStethoscope Pro iPhone应用程序获得,以及(B)从使用数字听诊器DigiScope的医院临床试验中获得。 内容 数据集分为两个来源:A和B: set_a.csv-通过iPhone应用程序从公众那里收集的心跳的标签和元数据 setatiming.csv -从A集收录的含有标准时序信息的表示“正常”的录音 set_b.csv-使用数字听诊器从医院的临床试验中收集的心跳的标签和元数据 音频文件-长度不等,介于1秒到30秒之间。(已被裁剪以减少过多的噪音并提供声音的显著片段)。 用途 (1)从音频中识别心音的位置 (2)将心音分类为几种类别(正常与各种非正常心跳声音) via:https://www.kaggle.com/kinguistics/heartbeat-sounds?select=set_b.csv

问答

可不可以直接在R上读取Stata13文件?

有没有办法在R中读取Stata版本13数据集文件? 结果如下: 有什么好的解决办法吗?

资源

数据分析师职位数据集

一、简介 寻找数据分析师工作?也许此数据集可以为您提供帮助。 目前形势来看,许多没有工作的人,有了这个数据集,可以优化求职过程。该数据集由picklesueat创建,包含2000多个数据分析员职位,具有以下功能:薪金估算;位置;公司评级 职位描述。 二、如何使用 通过薪水和公司评级找到最佳工作 探索职位描述中所需的技能 根据行业,地区,公司收入预测薪资 (例:数据工程师职位、业务分析师职位、数据科学家职位) via:https://www.kaggle.com/andrewmvd/data-analyst-jobs

计算机

计算机·圈子   首发

anna 更新了
资源

蛋白质结构数据集

这是从结构生物信息学(RCSB)蛋白质数据库(PDB)研究中所检索到的蛋白质数据集。 PDB档案库是描述蛋白质和其他重要生物大分子的信息的存储库。结构生物学家使用诸如X射线,NMR光谱和低温电子显微镜等方法来确定每个原子在分子中相对于彼此的位置。然后,他们存储此信息,由wwPDB对其进行批注并公开发布到存档中。 PDB的数据在不断增加,这反映了全世界的实验室都在进行此项研究。这使得在研究和教育中使用数据库既令人兴奋又充满挑战。 生命过程中涉及的许多蛋白质和核酸都有可用的结构,因此你可以到PDB档案中查找核糖体,癌基因,药物靶标甚至整个病毒的结构。 但是,由于PDB归档了许多不同的结构,因此找到所需信息可能是一个挑战。你通常会发现给定分子有多个结构,已从其天然形式被修饰或失活的结构。 内容 有两个数据文件,都在“ structureId”: pdb数据no_dups.csv包含蛋白质元数据,其中包括有关蛋白质分类,提取方法等的详细信息。 data_seq.csv包含> 400,000个蛋白质结构序列。 致谢 从http://www.rcsb.org/pdb/下载的原始数据集 用途 蛋白质数据库帮助生命科学界研究各种疾病,研究有助于人类生存的新药和解决方案。 via:https://www.kaggle.com/shahir/protein-data-set?select=pdb_data_seq.csv

计算机

计算机·圈子   首发

anna 更新了
资源

MNIST时尚数据集

Fashion-MNIST是Zalando图片的数据集。包含60,000张图片的训练集和10,000张图片的测试集。每张图片都是一个28x28灰度图像,分别代表10个类别的标签。Zalando打算将Fashion-MNIST替代MNIST原始数据集。 每个训练和测试图像都分配给以下标签之一: 0T恤/上衣 1裤子 2套头衫 3礼服 4外套 5凉鞋 6衬衫 7运动鞋 8袋 9踝靴 via:https://github.com/zalandoresearch/fashion-mnist

计算机

计算机·圈子   首发

karry 更新了
资源

MNIST中文手写数字数据集

中国MNIST数据集使用在纽卡斯尔大学的项目中收集的数据。 项目描述 一百名中国人参加了数据收集。每个参与者用标准的黑色墨水笔在一张白色A4纸上绘制的表格中的15个指定区域书写所有15个数字。每个参与者重复此过程10次。每张纸都以300x300的分辨率进行扫描。 得到一个包含15000张图像的数据集,每个图像代表一组15个字符中的一个字符。 数据集包含以下内容: 索引文件 chinese_mnist.csv 包含15,000张jpg图像的文件夹,尺寸为64 x64。有关详细信息,请参见images文件夹说明。 via:https://www.kaggle.com/gpreda/chinese-mnist

  • 1
  • 123
  • 124
  • 125
  • 168
前往