8557 位酷友已加入
计算机圈子中包含常用的技术文档、源代码、模型、数据集、学习教程、技术报告等干货资料,加入圈子可以上传、下载资料,也可以使用提问来寻求资料或分享你认为有价值的站外链接~
Numpy中array()和asarray()函数之间有什么区别?什么时候应该使用一个而不是另一个?好像我能想到的所有输入他们都会生成相同的输出。
有没有一种好的方法?我想制作缩略图。
1.关联规则 市场购物篮分析是大型零售商用来发现商品之间关联的关键技术之一, 广泛用于对购物篮或交易数据的分析。它通过查找在交易中经常出现的项目组合进行分析。换句话说,它允许零售商识别人们购买的商品之间存在的一些联系。 2.数据的详细信息 该数据集具有来自杂货店的人们的38765笔采购订单。可以使用Apriori等算法和Market Basket Analysis来分析这些订单并生成关联规则。 Apriori是一种用于频繁进行项目集挖掘和通过关系数据库进行关联规则学习的算法。它可以识别数据库中频繁出现的单个项目并将它们扩展到越来越大的项目集(只要这些项目集在数据库中足够频繁地出现)。由Apriori确定的频繁项目集可用于确定突出显示数据库总体趋势的关联规则:这在市场上述的篮子分析等领域中都有应用。 关联规则举例: 假设有100位客户,其中10位购买了牛奶,8位购买了黄油,6位两种商品都够买了。。 购买牛奶=>购买黄油 支持= P(牛奶和黄油)= 6/100 = 0.06 置信度=支持/ P(黄油)= 0.06 / 0.08 = 0.75 提升=置信度/ P(牛奶)= 0.75 / 0.10 = 7.5(支持:这表示项集的受欢迎程度,以项集出现的交易比例衡量。 支持:这表示项集的受欢迎程度,以项集出现的交易比例衡量。 置信度:这表示购买商品X时购买商品Y的可能性,表示为{X-> Y}。这是通过与X项(其中也出现Y项)的交易比例来衡量的。 提升度:表示购买商品X时购买商品Y的可能性,同时控制商品Y的受欢迎程度。) 注意:此示例数据非常小。在实践中,一条规则要有几百个数据,才能被认为具有统计意义,而数据集通常包含成千上万个数据。 三、数据集原链接 https://www.kaggle.com/heeraldedhia/groceries-dataset 据kaggle显示该数据集的易用性为10.0
区块链上用户如何达成共识。
我定期对一种事物进行拍照,看图片有时看起来几乎是一样的,我想有某种方法可以量化这种差异,因为我必须凭借经验来确定一个阈值。 我使用python。
不是纯学术研究,请大佬们发一些趣味性较强的应用型选题,谢谢。
我需要一种简单快速的方法来比较两个图像的相似性,它们仅是背景略有不同,有什么方法可以获得较精确的值吗?
机器学习、深度学习和神经网络有哪些不同的使用领域?深度学习之后的下一步会是什么?
SQuAD 2.0 数据集 介绍 斯坦福问答数据集(SQuAD)是一种阅读理解数据集,由人文工作人员基于一组Wikipedia文章上提出的问题组成,其中每个问题的答案对应阅读的文章的一段文本或跨越文本的几段文本,也可能没有答案。 SQuAD 2.0 将 SQuAD 1.1 中的100,000个问题与超过50,000个无法回答的问题结合,其中,这50,000个问题是由工作者编写成看起来类似于可回答的问题。 为了在SQuAD2.0上表现出色,系统不仅必须在可能的情况下回答问题,而且还必须确定该段落何时不支持任何回答并放弃回答。 内容 包含两个文件 dev-v2.0.json train-v2.0.json 转载https://rajpurkar.github.io/SQuAD-explorer/
FaceScrub数据集 具有530人的超过100,000张面部图像的数据集 大型面部数据集对于推进面部识别研究很重要,但构建起来却很繁琐,因为清理大量的原始数据需要进行大量工作。为了简化此任务,我们开发了一种构建面部数据集的方法,该方法可检测互联网上搜索公共人物后返回的图像中的面部,然后自动丢弃不属于每个被查询者的面部。 使用这种方法创建了FaceScrub数据集,然后手动检查并清洗结果。它总共包含106,863张男女530位名人的面部图像,每人约200张图像。因此,它是最大的公众数据库之一。 这些图像是从Internet上检索的,并且是在实际情况下(不受控制的条件)拍摄的。包括面部的名称和性别注释。 FaceScrub Male Female Total people 265 265 530 images 55,306 51,557 106,863 该数据集是在知识共享许可下发布的。请注意,由于我们不拥有内容(自述文件中的更多详细信息),因此只能提供图像的URL(以及注释)。 转载http://vintage.winklerbros.net/facescrub.html
内容: 该数据集包含2,624个300x300像素的8位功能和有缺陷太阳能电池的8位灰度图像样本,具有从44个不同太阳能模块中提取的不同程度的退化。带注释的图像中的缺陷是内部或外部类型的缺陷,已知会降低太阳能模块的功率效率。 所有图像的大小和透视图均已标准化。另外,在提取太阳能电池之前,消除了由用于捕获EL图像的相机镜头引起的任何失真。 可用于机器学习发现损坏的太阳能电池板的共同特征,帮助监控在使用的太阳能电池板是否存在问题。 引用数据集时,请标注以下引用; 转载:https://lme.tf.fau.de/person/deitsch/