2 有用
22 下载

杂货数据集

文件列表(压缩包大小 1.05M)

免费

概述

1.关联规则 市场购物篮分析是大型零售商用来发现商品之间关联的关键技术之一, 广泛用于对购物篮或交易数据的分析。它通过查找在交易中经常出现的项目组合进行分析。换句话说,它允许零售商识别人们购买的商品之间存在的一些联系。 2.数据的详细信息 该数据集具有来自杂货店的人们的38765笔采购订单。可以使用Apriori等算法和Market Basket Analysis来分析这些订单并生成关联规则。 Apriori是一种用于频繁进行项目集挖掘和通过关系数据库进行关联规则学习的算法。它可以识别数据库中频繁出现的单个项目并将它们扩展到越来越大的项目集(只要这些项目集在数据库中足够频繁地出现)。由Apriori确定的频繁项目集可用于确定突出显示数据库总体趋势的关联规则:这在市场上述的篮子分析等领域中都有应用。 关联规则举例: 假设有100位客户,其中10位购买了牛奶,8位购买了黄油,6位两种商品都够买了。。 购买牛奶=>购买黄油 支持= P(牛奶和黄油)= 6/100 = 0.06 置信度=支持/ P(黄油)= 0.06 / 0.08 = 0.75 提升=置信度/ P(牛奶)= 0.75 / 0.10 = 7.5(支持:这表示项集的受欢迎程度,以项集出现的交易比例衡量。

支持:这表示项集的受欢迎程度,以项集出现的交易比例衡量。 置信度:这表示购买商品X时购买商品Y的可能性,表示为{X-> Y}。这是通过与X项(其中也出现Y项)的交易比例来衡量的。 提升度:表示购买商品X时购买商品Y的可能性,同时控制商品Y的受欢迎程度。)

注意:此示例数据非常小。在实践中,一条规则要有几百个数据,才能被认为具有统计意义,而数据集通常包含成千上万个数据。

三、数据集原链接 https://www.kaggle.com/heeraldedhia/groceries-dataset 据kaggle显示该数据集的易用性为10.0

理工酷提示:

如果遇到文件不能下载或其他产品问题,请添加管理员微信:ligongku001,并备注:产品反馈

评论(0)

0/250