计算机 · 圈子

8578 位酷友已加入

计算机圈子中包含常用的技术文档、源代码、模型、数据集、学习教程、技术报告等干货资料，加入圈子可以上传、下载资料，也可以使用提问来寻求资料或分享你认为有价值的站外链接~

提问或寻求资源

PDF分享

资料包分享

站外资源

关注推荐最新

热门标签

文本情感检测数据集介绍文本情感检测是自然语言处理中的一个难点，其原因是标记数据集的不可用性和问题的多类性。人类有各种各样的情绪，很难收集到每一种情绪足够的记录，因此出现了阶级失衡的问题。这是可用于情绪检测的带有标记的数据集，目的是建立一个有效的模型来检测文本中表达出的人类情绪。内容这些数据基本上来源于社交网络的推文，每一个都标注了推文背后的情绪。数据集有三个列：推文ID、情感和内容。本数据集包含13种不同的情绪，共有40000个记录。数据集转载自 https://www.kaggle.com/pashupatigupta/emotion-detection-from-text

计算机·圈子首发

Lisa 更新了

资源

垃圾邮件数据集

垃圾邮件数据集介绍由来自 Spam Assassin（垃圾邮件杀手）的电子邮件所创建的模型，可以帮助收件人的邮箱区分垃圾邮件和非垃圾邮件。内容所有文件都可由Python电子邮件库读取。数据集包含以下三个特征：垃圾邮件常用的词语垃圾邮件中链接垃圾邮件的主题数据集转载自 https://www.kaggle.com/veleon/ham-and-spam-dataset

计算机·圈子首发

anna 更新了

资源

心跳声音数据集

该数据集是针对机器学习来对心跳声音进行分类的。数据来自两个来源：（A）通过iStethoscope Pro iPhone应用程序获得，以及（B）从使用数字听诊器DigiScope的医院临床试验中获得。内容数据集分为两个来源：A和B： set_a.csv-通过iPhone应用程序从公众那里收集的心跳的标签和元数据 setatiming.csv -从A集收录的含有标准时序信息的表示“正常”的录音 set_b.csv-使用数字听诊器从医院的临床试验中收集的心跳的标签和元数据音频文件-长度不等，介于1秒到30秒之间。（已被裁剪以减少过多的噪音并提供声音的显著片段）。用途（1）从音频中识别心音的位置（2）将心音分类为几种类别（正常与各种非正常心跳声音） via:https://www.kaggle.com/kinguistics/heartbeat-sounds?select=set_b.csv

计算机·圈子首发

天明发布了

问答

为什么U-net或自动编码器类型的网络会成为图像分割任务的主流选择？

计算机·圈子首发

🍊小桔子发布了

问答

什么是SegNet神经网络？它为什么如此重要？

计算机·圈子首发

玩手机的豆浆发布了

问答

可不可以直接在R上读取Stata13文件？

有没有办法在R中读取Stata版本13数据集文件？结果如下：有什么好的解决办法吗？

计算机·圈子首发

玩手机的豆浆更新了

资源

数据分析师职位数据集

一、简介寻找数据分析师工作？也许此数据集可以为您提供帮助。目前形势来看，许多没有工作的人，有了这个数据集，可以优化求职过程。该数据集由picklesueat创建，包含2000多个数据分析员职位，具有以下功能：薪金估算；位置；公司评级职位描述。二、如何使用通过薪水和公司评级找到最佳工作探索职位描述中所需的技能根据行业，地区，公司收入预测薪资（例：数据工程师职位、业务分析师职位、数据科学家职位） via：https://www.kaggle.com/andrewmvd/data-analyst-jobs

计算机·圈子首发

🍊小桔子发布了

问答

反卷积、上采样、非池化和卷积稀疏编码有什么区别?

计算机·圈子首发

anna 更新了

资源

蛋白质结构数据集

这是从结构生物信息学（RCSB）蛋白质数据库（PDB）研究中所检索到的蛋白质数据集。 PDB档案库是描述蛋白质和其他重要生物大分子的信息的存储库。结构生物学家使用诸如X射线，NMR光谱和低温电子显微镜等方法来确定每个原子在分子中相对于彼此的位置。然后，他们存储此信息，由wwPDB对其进行批注并公开发布到存档中。 PDB的数据在不断增加，这反映了全世界的实验室都在进行此项研究。这使得在研究和教育中使用数据库既令人兴奋又充满挑战。生命过程中涉及的许多蛋白质和核酸都有可用的结构，因此你可以到PDB档案中查找核糖体，癌基因，药物靶标甚至整个病毒的结构。但是，由于PDB归档了许多不同的结构，因此找到所需信息可能是一个挑战。你通常会发现给定分子有多个结构，已从其天然形式被修饰或失活的结构。内容有两个数据文件，都在“ structureId”： pdb数据no_dups.csv包含蛋白质元数据，其中包括有关蛋白质分类，提取方法等的详细信息。 data_seq.csv包含> 400,000个蛋白质结构序列。致谢从http://www.rcsb.org/pdb/下载的原始数据集用途蛋白质数据库帮助生命科学界研究各种疾病，研究有助于人类生存的新药和解决方案。 via:https://www.kaggle.com/shahir/protein-data-set?select=pdb_data_seq.csv

计算机·圈子首发

天明发布了

问答

在卷积神经网络的背景下，AlexNet、GoogleNet和VGG有什么区别?

计算机·圈子首发

anna 更新了

资源

MNIST时尚数据集

Fashion-MNIST是Zalando图片的数据集。包含60,000张图片的训练集和10,000张图片的测试集。每张图片都是一个28x28灰度图像，分别代表10个类别的标签。Zalando打算将Fashion-MNIST替代MNIST原始数据集。每个训练和测试图像都分配给以下标签之一： 0T恤/上衣 1裤子 2套头衫 3礼服 4外套 5凉鞋 6衬衫 7运动鞋 8袋 9踝靴 via:https://github.com/zalandoresearch/fashion-mnist

计算机·圈子首发

karry 更新了

资源

MNIST中文手写数字数据集

中国MNIST数据集使用在纽卡斯尔大学的项目中收集的数据。项目描述一百名中国人参加了数据收集。每个参与者用标准的黑色墨水笔在一张白色A4纸上绘制的表格中的15个指定区域书写所有15个数字。每个参与者重复此过程10次。每张纸都以300x300的分辨率进行扫描。得到一个包含15000张图像的数据集，每个图像代表一组15个字符中的一个字符。数据集包含以下内容：索引文件 chinese_mnist.csv 包含15,000张jpg图像的文件夹，尺寸为64 x64。有关详细信息，请参见images文件夹说明。 via:https://www.kaggle.com/gpreda/chinese-mnist

前往

页

前一页 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 后一页

理工酷

首页

圈子

资源下载

计算机 · 圈子

计算机·圈子首发

文本情感检测数据集

计算机·圈子首发

垃圾邮件数据集

计算机·圈子首发

心跳声音数据集

计算机·圈子首发

为什么U-net或自动编码器类型的网络会成为图像分割任务的主流选择？

计算机·圈子首发

什么是SegNet神经网络？它为什么如此重要？

计算机·圈子首发

可不可以直接在R上读取Stata13文件？

计算机·圈子首发

数据分析师职位数据集

计算机·圈子首发

反卷积、上采样、非池化和卷积稀疏编码有什么区别?

计算机·圈子首发

蛋白质结构数据集

计算机·圈子首发

在卷积神经网络的背景下，AlexNet、GoogleNet和VGG有什么区别?

计算机·圈子首发

MNIST时尚数据集

计算机·圈子首发

MNIST中文手写数字数据集

理工酷

首页

圈子

资源下载

站外资源

问答

网址导航

计算机 · 圈子

计算机·圈子 首发

文本情感检测数据集

计算机·圈子 首发

垃圾邮件数据集

计算机·圈子 首发

心跳声音数据集

计算机·圈子 首发

为什么U-net或自动编码器类型的网络会成为图像分割任务的主流选择？

计算机·圈子 首发

什么是SegNet神经网络？它为什么如此重要？

计算机·圈子 首发

可不可以直接在R上读取Stata13文件？

计算机·圈子 首发

数据分析师职位数据集

计算机·圈子 首发

反卷积、上采样、非池化和卷积稀疏编码有什么区别?

计算机·圈子 首发

蛋白质结构数据集

计算机·圈子 首发

在卷积神经网络的背景下，AlexNet、GoogleNet和VGG有什么区别?

计算机·圈子 首发

MNIST时尚数据集

计算机·圈子 首发

MNIST中文手写数字数据集

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发

计算机·圈子首发