零售购物篮分析

零售购物篮分析
零售购物篮分析

零售购物篮关联规则挖掘

零售运营销售计划部副经理袁正伟

商家通过对消费者购物行为进行分析,通过购物小票发现顾客购物产生连带消费时具有一定的规律性,即很多顾客购买了A类商品的同时会考虑再购买B类商品。其实这种有趣的发现在数据挖掘领域被称作购物篮关联规则挖掘。商家运用挖掘规则对商品进行合理的摆放以及对商铺进行合理的布局, 使商场销售格局更符合消费者的消费行为与模式, 从而为商场提高销售业绩, 创造更多的利润, 也为消费者带来更多的方便. 这也正是美国零售业巨头沃尔玛创造的啤酒与尿布的成功案例给人们带来的启示.每一次购物篮处理得到的都是一位顾客的购物信息, 大多数零售企业只是将这些数据进行简单分类、分析单一的销量数据, 实际上并没有充分利用这些能反映所有顾客购物行为最有效的数据, 一些宝贵的数据资源就成了数据坟墓.

购物篮分析泛指对顾客购物篮里的商品组成进行分析。购物篮里的商品反映了商品间的相互依赖。这些商品间的依赖关系,对于零售市场商品的陈列摆放提供数据支持。目前的数据挖掘的关联规则技术则为购物篮分析提供了科学的依据。

下面我们一起来研究一下JL公司的销售小票,希望通过日常顾客的购物明细来挖掘隐藏的关联关系。

1、数据准备

一般来说,描述顾客购物数据包括:单据编号、货号、货品名称、系列、颜色、尺码、年份、品牌等等货品资料。在这里,考虑到购物数据的时效性,我们截取最近的半年数据,也就是2011年6月1日到2011年12月1日的所有购物明细数据。再通过对数据的清洗处理,我们共整理出857555条有效数据。以下就是通过整理后的部分数据截图:

图1:顾客购物篮部分数据截图

2、模型建立

顾客购物行为分析也就是关联规则挖掘,类似于模型X→Y的蕴涵式,也就是发掘购买了X后再购买Y的强规则。目前国际上普遍采用的是Apriori算法,在这里对于算法及程序实现我们暂不做介绍。

3、挖掘规则

通过对以上模型的构建及处理,我们发现通过货号关联,很难发现较为明显的规则,原因是货号过于明细,在识别规则的时候很难通过标识进行归类。因此,我们将考虑以中类或大类进行规则关联,这里我们采取以商品名称进行关联。得到部分强规则如下:

图2:部分购物规则

4、规则分析

从图2的部分结果展示我们可以看到,在2011年6月1日到2011年12月1日顾客所有的消费行为中,共有3139笔消费买了短袖POLO,同时又购买了短袖T恤。以此为例,我们便能清楚的发现以上图2所展示规则的含义。目前,经过笔者的调查发现,JL公司货品资料的统一性较差,数据质量并不是很高。例如,在系列分类中不同品牌的系列定义是不统一的,甚至出现相同品牌的系列定义也可能不一样。这样就会导致很多规则在项集归类时遗漏,影响规则的全面性和准确性。考虑到这种实际情况,保证结果的可靠性,笔者在实际建模时只能采取以商品名称为关联项集。而实际陈列时更多的是考虑系列搭配而并非商品名称。因此在数据整理时一定要保证数据的规范性,建立挖掘模型时合理选择输入项和预测项,这样才能获得有价值且实用的规则。

特别地在百货零售企业中,琳琅满目的商品如何合理摆放在货架上是每一个成功的经营者必须考虑的问题。商品摆放在不同位置的货架上可能直接决定了该商品的售卖周期,甚至商品间的摆放也直接影响了商品的受欢迎程度。因此,通过消费者购买习惯的研究,挖掘隐藏的购物规则,通过数据重现购物事实,对于陈列调整和商铺进行合理的布局,必定能提高连带销售率,既方便顾客也能使商家提升销售。

相关链接

啤酒与尿布的故事

在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:

在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

按常规思维,尿布与啤酒风马牛不相及,若不是借助数据挖掘技术对海量交易数据进行挖掘和分析,沃尔玛是不可能发现数据内在这一有价值的规律的。

超市购物篮设计分析

人 因 工 程 论 文 超市购物篮设计 指导教师 孙林岩 班 级 工硕51

学 号 05083005 姓 名 刘民婷 日 期 2007年11月17日 超市购物篮的设计问题及改进 摘要: 如今,超市已经成为了人们生活中重要的一部分,越来越多的人选择到超市购买家庭必需用品,而超市里的购物篮则是人们在购物时的主要工具。人们在使用现在超市普遍提供的购物篮时是否感到舒适呢?本文对超市普遍提供的购物篮进行了一些分析,同时对其从适合消费者使用的方面做些改进,提出一些方案。 关键词:超市购物篮 正文 一、 超市购物篮的简要介绍 随着我国经济的发展,“超市”这一种模式自引进后,成为了人们生活中重要的一部分,人们已经习惯于到超市中选购自己需要的各种生活用品。在购物过程中,购物篮则成为了大家必不可少的工具。尤其是家庭主妇,到超市购物已经成为了她们当中很多人的“固定工作”。 然而,在多次使用过程中,我发现不同超市所提供的购物篮在样式上都差不多,就如以下几幅图所展示的:

从上图我们可以看出,大部分的超市都喜欢选用这种体积较大、形状近似长方体的购物篮。或许这是从成本以及消费者的购物数量角度来考虑的:这样的购物篮能装入比较多的商品,两个提手的设计,使消费者在提的时候购物篮不容易摇晃。 二、 超市购物篮存在的问题 现在超市提供的购物篮虽然在很大程度上方便了消费者,但仍然存在一些问题: 1、很多购物篮的提手比较细,手掌受压较大,如果消费者购买比较多的商品,提着就会觉得手掌疼。 2、购物篮的体积比较大,消费者在提的时候为了避免购物篮磕着腿,总得把手伸出一段距离,手臂会很累。并且,手腕必须向外旋转一定的角度,才能抓稳购物篮的提手。如下图所示: 3、消费者购物的时候往往购买不同的商品,比如食品、日用品等等,而购物篮里没有分格,这些东西往往都得放在一起。一些消费者买了现做的食物,往往会弄脏别的东西。有的消费者则不喜欢将食品和别的东西混在一起,觉得不太卫生。 基于购物篮存在的上述问题,我根据人手的结构等相关知识,对其从以上三个方面进行了一些改进。 三、 改进原则及原理 (一) 改进原则 根据以上存在的问题,在对购物篮进行改进的时候,应该以消费者使用时感到舒适为基本原则。 1、尽量使使用者手掌在抓提手的时候手掌和手指感到舒服。 2、尽量使使用者的手在提购物篮的时候保持自然的姿势,即手臂不需要往外伸出比较大的距离,手腕不需要向外旋转比较大的角度。否则在提购物篮时间过久的时候,容易造成

大型超市“购物篮”分析资料报告

题 目 大型超市“购物篮”分析 摘 要 本文根据顾客购买记录,通过“购物篮”分析,运用多种模型得出结果,并给出促销方案。 问题一要求构建能表达多种商品关联程度的数学模型。根据4717个顾客对999中商品的购买记录,先用Matlab 对数据进行预处理,将其转化为0-1模型,然后求出购买j 商品的集合j s 和购买k 商品的集合k s ,考虑到同时购买两种商品占购买人数的频率,即相关性,存在购买人数少但相关性大的缺陷。在改进的模型中,因为存在购买商品数少但也会使相关性大的情况,所以对两种情况进行综合考虑,得出最优模型: j k i k i k s s s s p n s s ??=?? 用Matlab 求解0-1矩阵,求出两商品间关联系数较大的前八位,有相关系数的值在0-1围之,与所得模型函数的围一致,可知,该模型是准确可靠的。 问题二要求出有效方法来找出最频繁被购买的商品记录,且越多越好。根据问题一所得0-1矩阵,将其代入Excel 运用Aprior 模型,先算出单项商品的频繁项集,将支持度较小的数据剔除后,最后选取被购买次数最多的前18个商品,其中最畅销的为368号商品。根据这18个畅销品,运用同样方法将其转化为两两商品的组合,得到被同时购买次数200次以上的商品;根据此算法依次迭代,得到同时购买3种商品和同时购买4种商品的数据,更多商品被同时购买次数较少因此不予考虑,最后得出:两件商品被同时购买次数最高的是368和529号;三件商品被同时购买次数最高的是368、489和682;四件商品被同时购买次数最高的是68、937、895和413。 问题三要求给出方案使效益最大。根据问题一中0-1模型和问题二中Aprior 模型,将得到的购买次数最多的商品信息和题中所给利润表相比较,将利润小数量多的商品作为赠品和利润大数量多的商品一同销售;将共同购买次数多且利润大的两商品组合作为促销品进行销售,以进一步提高超市的综合效益。 关键词 0-1模型 Aprior 模型 数据预处理 相关系数

购物篮分析

购物篮分析 说起关联问题,可能要从“啤酒和尿布”说起了。有人说啤酒和尿布是沃尔玛超市的一个经典案例,也有人说,是为了宣传数据挖掘/数据仓库而编造出来的虚构的“托”。不管如何,“啤酒和尿布”给了我们一个启示:世界上的万事万物都有着千丝万缕的联系,我们要善于发现这种关联。 关联分析要解决的主要问题是:一群用户购买了很多产品之后,哪些产品同时购买的几率比较高?买了A产品的同时买哪个产品的几率比较高?可能是由于最初关联分析主要是在超市应用比较广泛,所以又叫“购物篮分析”,英文简称为MBA,当然此MBA非彼MBA,意为Market Basket Analysis。 如果在研究的问题中,一个用户购买的所有产品假定是同时一次性购买的,分析的重点就是所有用户购买的产品之间关联性;如果假定一个用户购买的产品的时间是不同的,而且分析时需要突出时间先后上的关联,如先买了什么,然后后买什么?那么这类问题称之为序列问题,它是关联问题的一种特殊情况。从某种意义上来说,序列问题也可以按照关联问题来操作。 关联分析有三个非常重要的概念,那就是“三度”:支持度、可信度、提升度。假设有10000个人购买了产品,其中购买A产品的人是1000个,购买B产品的人是2000个,AB同时购买的人是800个。支持度指的是关联的产品(假定A产品和B产品关联)同时购买的人数占总人数的比例,即800/10000=8%,有8%的用户同时购买了A和B两个产品;可信度指的是在购买了一个产品之后购买另外一个产品的可能性,例如购买了A产品之后购买B 产品的可信度=800/1000=80%,即80%的用户在购买了A产品之后会购买B产品;提升度就是在购买A产品这个条件下购买B产品的可能性与没有这个条件下购买B产品的可能性之比,没有任何条件下购买B产品可能性=2000/10000=20%,那么提升度=80%/20%=4。

超级市场零售商品的购物篮分析

超级市场零售商品的购物篮分析 王汉生1 、江明华1 、曹丽娜2 、金英1 1 北京大学光华管理学院,2 中央电视台广告部 摘要 本文利用国内某中型城市中,处于垄断地位的一个大型超市的26天的销售流水数据对消费者的购物篮中商品的相关性进行了探索性研究。具体地说,我们首先介绍了一个基于0-1变量的聚类方法,可以被用来做典型的菜篮子分析;然后,我们用此方法详细分析某中等城市的一个大型连锁超市数据。对消费者购物篮中商品的相关心进行了探索性的研究。 关键词:消费者行为、购物篮分析、0-1变量、聚类分析 0问题提出 首先,现代零售商品种类极端丰富,消费者需要处理的信息量急剧增加。消费者平均要以每秒33件的速度从5万件商品中挑选出17件商品。Phillips (2005)的研究表明,当消费者面对种类繁多的商品时,并不会应为可选择的丰富多样性而得到满足。但是,消费者却能够因为超市对其商品选择的引导而感到满意。超市引导的一个办法就是通过商品的布货,也即,哪些商品可以摆放在一起,而哪些商品又应当分别摆放。问题是,超市进行布货的依据是什么? 其次,我们可以观察到商场和超市经常进行各种促销,其中最常见的促销方式是打折,而且,常常是全场打折。这样的打折往往不是超市最优的选择。因为,消费者在购买某些商品的时候,会同时购买另一些商品,而不管它们是否是在打折。在这种情况下,只要这两种商品之一处于打折状态,往往会刺激消费者购买两种商品。这样,超市只需要对一种商品打折就可以达到促销两种商品的目的,从而可以大大提高超市的效益。问题是,超市安排商品打折的依据是什么? 因此,基于上述原因,了解消费者究竟如何在多商品类目间进行同时选择(Simultaneous Selection )对于超市如何有效地引导消费者和提高效益意义重大。所以,本文的目的有二。第一、介绍一个简单而有效的数量方法,可以被用来做典型的菜篮子分析;第二、用此方法详细分析某中等城市的一个大型连锁超市数据,从而探索大陆消费者的相关行为特征。 以下章节如下安排。下一节,详细介绍一个基于0-1变量的聚类方法。基于此方法的实际数据分析将在第三节中展开。最后是总结与讨论。 1文献研究 在过去的研究中,Fader 和Lodish (1990)研究表明某些消费者特征(如Household Penetration 和购买频率)对零售商品定价和促销环境具有一定的解释能力。Narasimhan 等人(1996)的进一步研究发现,一类商品的促销弹性部分取决于该类商品的品类结构和相关消费者特征。Raju (1992)研究了不同类商品销量差异性,并建立了它同品类特征和营销组和变量的关系。Hoch 等人(1995)则研究了各类商品的商店价格弹性(Store-Level Price Elasticities )和所在商圈消费者人口统计特征的关系。Manchanda 等人(1999 )则进一步

关联分析—购物篮分析

9 Objectives ?Conduct an association analysis and interpret the results. ?Distinguish between association analysis and sequence analysis. ?Conduct a sequence analysis and interpret the results. 考虑下面的情形,一个商店想对客户数据库进行分析,了解在购物时哪些商品会一起购 买。为此,商店选择了对客户数据库样本进行购物篮分析。 使用的数据集合:SAMPSIO.ASSOCS ASSOCS中的变量列表 数据集合ASSOCS包含了1001个客户所购买的食品,其中20种见下表:Code Product

1001个客户中,每个客户均购买了7个物品,因而总共有7007行。数据集中每一行也就代表了客户所购产品的一个组合。在大多数数据集合中,并不是所有客户都购买了相同数量的产品。 创建初始流 按下图样式建立流程图: a.设置输入数据源(Input Data Source)节点 1 打开输入数据源Input Data Source)节点。 2 从文件夹SAMPSIO中选择数据集合ASSOCS。 3 点击变量(Variables)标签。 4 设置变量CUSTOMER的模型角色为身份(Id) 5 设置变量PRODUCT的模型角色为目标变量(target)。 6 设置变量TIME的模型角色序列(sequence)。 注:变量TIME用于识别购买食品的先后次序。此例中所有商品均在同时购买,因此在这儿的次序只表明商品在购买时的登记先后次序。当考虑这种先后次序时,关联分析就是所谓的序列分析。 7 关闭输入数据源(Input Data Source)节点并保存所做改变。 b.设置关联(Association)节点

大型超市购物篮分析

题目大型超市“购物篮”问题分析 摘要 本文对于大超市商品的关联度以及商品最频繁同时购买问题进行分析,构建合理的数学模型,并给出可操作的商品销售方案。 问题一要求统计处理4717个顾客对999中商品的购买记录数据,建立数学模型,定量表达超市中多种商品间的关联关系的密切程度。首先建立遗传算法,利用SPSS统计得出各个商品购买数量,并计算出标准差。再对影响关联度的另一度量指标进行分析,将数据分类利用Matlab处理数据,得出商品间的欧氏距离。最后加上实际影响因素,建立模型: 综合以上分析可以得出,五种商品的购买组合中商品413,商品424,商品538,商品572,商品797,购买次数最高,102次,组合利润最高1485.399,总利润最高151510.698。因此,将这组商品作为最优组合。 问题三要求根据问题1、问题2中建立的模型,对附件2中999种商品的利润进行分析,给出一种初步的促销方案。对数据运用Matlab进行拟合,得出商品利润与商品之间的关联度符合线性关系。对附件2中利润数据分类,分别计算结果。最后,给出促销方案。

关键词遗传算法欧氏距离关联度贪婪算法 一、问题背景和重述 1.1问题背景 超市购物属于日常生活,而每天来超市购物的顾客和购买的商品都具有不稳定性。商品的销量会因顾客的喜好或时间的影响不断变化,又因商品购买存在随机性、多元性等特点,必须估测好每种商品的需求量。如处理不当,很可能造成仓库囤积量增多,甚至造成超市利润损失过大。 商品购买是不确定的,但某种或某些商品会获得大多数人的认可,被顾客频繁购买。在大型超市中,商品繁多、复杂,正确分析并估算顾客对某种或某些商品的喜好,将为超市经理合理设计进货方案、处理仓库、获得最大利润、搞推销、促销活动和购物赠送活动等提供理论依据。 商品市场分析和顾客购物习惯分析,作为超市一项基础性任务,不仅可以确定超市进货合理模式及合理促销方式,还可以为各大型超市确定今后整体规划、超市规模、商品购买后评估等提供更为科学的理论依据。 1.2问题重述 现给出超市进一个星期的所有顾客购买物品的清单和相应商品的价格,分析所给数据,研究以下问题,并建立合理的数学模型: 1、附件 1 中的表格数据显示了该超市在一个星期内的4717 个顾客对999 种商品的

大型超市购物篮分析

题目 大型超市“购物篮”问题分析 摘要 本文对于大超市商品的关联度以及商品最频繁同时购买问题进行分析,构建合理的数学模型,并给出可操作的商品销售方案。 问题一要求统计处理4717个顾客对999中商品的购买记录数据,建立数学模型,定量表达超市中多种商品间的关联关系的密切程度。首先建立遗传算法,利用SPSS 统计得出各个商品购买数量,并计算出标准差。再对影响关联度的另一度量指标进行分析,将数据分类利用Matlab 处理数据,得出商品间的欧氏距离。最后加上实际影响因素,建立模型: 9991 n n I I n C P C ==∑ 利用Excel 进行统计与描述,可以得出共有623种商品关联度为0.1888,299种商品间关联度为0.0705,88种商品间关联度为0.0245,33种商品间的关联度为0.0074,11种商品间的关联度为0.0022,5种商品间的关联度为0.0020。 问题二要求分析说明哪些商品是最频繁被同时购买的,并在问题一的基础上,用一种快速有效的方法计算。已知问题1的结果,将商品进行分类,运用贪婪算法逐步得出被同时购买的商品数,利用Matlab 得出结果。 综合以上分析可以得出,五种商品的购买组合中商品413,商品424,商品538,商品572,商品797,购买次数最高,102次,组合利润最高1485.399,总利润最高151510.698。因此,将这组商品作为最优组合。 问题三要求根据问题1、问题2中建立的模型,对附件2中999种商品的利润进行分析,给出一种初步的促销方案。对数据运用Matlab 进行拟合,得出商品利润与商品之间的关联度符合线性关系。对附件2中利润数据分类,分别计算结果。最后,给出促销方案。 关键词 遗传算法 欧氏距离 关联度 贪婪算法

大型超市购物篮分析数学建模

大型超市“购物篮”分析 摘要 本文通过对大型超市“购物篮”的分析,运用Apriori算法的思想,做出相应的改进,利用支持度和置信度的大小进行一定程度的筛选,结合商品的利润大小,引入促销系数,通过促销系数的比较,得到科学的商品组合情况,设计一定的商品促销手段,实现超市效益的进一步增大。 对于问题一,我们参考了一种最有影响的挖掘布尔关联规则频繁项集的算法——Apriori算法。用matlab编程,得到每两个商品同时出现的个数,并求得它们的支持度和相互的置信度,设定最低支持度为5%,得到符合的两种商品组合数为17组。设定最低置信度为20%,对17组数据进行筛选,得到12组商品组合。最后通过关联密切系数的大小,得到了12组商品组合彼此关联关系的密切程度。 对于问题二,仅考虑商品支持度的大小,求得在一定最小支持度下被频繁地同时购买的商品组合。用matlab编程,设置最小支持度为2.12%,筛选两个商品组合时,我们得到了1391种组合方式,在此基础上筛选三个商品组合时,我们得到了40种组合方式;再继续筛选四个商品组合得到35种,最后筛选五个商品得到一种组合,六个商品组合时则没有出现大于最小支持度的组合方式。因此,我们得到了尽可能多的商品被频繁同时购买的信息。 对于问题三,在结合商品利润的条件下,引入促销系数H,考虑1391个两种商品组合中各商品的利润、支持度和置信度,分别计算出三者的乘积之和进行比较。选取促销系数H较高的组合商品采取就近摆放、打折促销、消费送礼等捆绑销售方式得到一种促销方案,使得超市的效益进一步增大。 关键词:购物篮分析、Apriori算法、促销系数

一、问题重述 作为超市的经理,经常关心的问题是顾客的购物习惯。他们想知道:“什么商品组或集合顾客多半会在一次购物时同时购买?”。现在假设你们是某超市的市场分析员,已经掌握了该超市近一个星期的所有顾客购买物品的清单和相应商品的价格,需要你们给超市经理一个合理的“购物篮”分析报告,并提供一个促销计划的初步方案。 问题一:附件1中的表格数据显示了该超市在一个星期内的4717个顾客对999种商品的购买记录,对数据进行分析,试建立一种数学模型,使该模型能定量表达超市中多种商品间的关联关系的密切程度。 问题二:根据问题1建立的模型,通过一种快速有效的方法从附件1中的购买记录中分析出哪些商品是最频繁被同时购买的,找到的最频繁被同时购买的商品数量越多越好。 问题三:附件2给出了这999中商品的对应的利润,根据在问题1、问题2中建立的模型,设定一种初步的促销方案,使超市的效益进一步增大。 二、模型的假设 1、假设各个商品的利润保持不变。 2、假设表格中的数据能真实地反映当地消费者的购物情况。 3、假设短时间内商品的销售情况维持稳定,不会出现大幅波动。 三、符号说明 符号解释说明 s i组合i的支持度 c(A=>B)规则A=>B的置信度 c(B=>A)规则B=>A的置信度 c i组合i的平均置信度 s min最小支持度 c min最小置信度 μ关联密切系数 H促销系数

沃尔玛的购物篮分析现状

沃尔玛的购物篮分析现状 沃尔玛的购物篮分析在运营体系中占据了非常重要的地位.购物篮分析的结果不仅为门店的商品陈列/促销提供了有力的依据,更重要的是,沃尔玛充分了解了客户的真实需求,并帮助供应商开发了很多新的产品(这一点日本7-11便利店也做得很出色) 1. 沃尔玛的购物篮分析应用领域 *商品配置分析:哪些商品可以一起购买,关联商品如何陈列/促销 *客户需求分析:分析顾客的购买习惯/顾客购买商品的时间/地点等 *销售趋势分析:利用数据仓库对品种和库存的趋势进行分析,选定需要补充的商品,研究顾客购买趋势,分析季节性购买模式,确定降价商品 *帮助供应商改进老产品及开发新品:通过购物篮分析,根据客户的需求,开发新的产品/改进老产品及产品包装 2.沃尔玛对于关联商品及二次陈列的管理 购物篮分析的结果会对商品在卖场中的陈列产生重大的影响,由于很多具有相关性的商 品属于不同的部门管理,因此必然会产生商品的交叉陈列问题(即商品跨部门陈列或称为二次陈列)

在出现二次陈列时,必然会打破商品的归属,为此沃尔玛会设置专门的商品交叉关联委 员会,一般由非食品主管直接管理.这个组由一名交叉陈列主管和一到两名员工组成,负责门店所有交叉商品的陈列规划,管理和协商各个部门(尤其是出现二次陈列的情况),组织这些商品的订货/补货/上架,陈列,对交叉商品的销售进行统计对比分析. 交叉陈列主管也同时肩负促销主管的职责(说明在沃尔玛的二次陈列都是针对促销),负责监督促销/追踪促销信息是否及时有效地输入到计算机系统中,协调卖场是否达到陈列标准,销售贡献度是否达到公司预期. 根据沃尔玛的经验,交叉中以使商品单品的销售额提升几倍甚至几十倍,对低毛利商品与高毛利的商品进行交叉陈列,可以提升商店的整体毛利率. 沃尔玛利用购物篮分析获得丰厚收益的故事很多,我们在这里简单介绍几个. 沃尔玛的采购人员在对一种礼品包装的婴儿护肤品购物篮分析时发现,该礼品的购买者基本都是一些商务卡客户,进一步了解才知道,商品都是作为礼品买来送人的,而不是原先预想的”母亲”客户买给自己的孩子.因此该商品的购买目的才得以明确,这样的购买目的的信息对于商品的进一步改进提供极大的帮助.

零售购物篮分析

零售购物篮关联规则挖掘 零售运营销售计划部副经理袁正伟 商家通过对消费者购物行为进行分析,通过购物小票发现顾客购物产生连带消费时具有一定的规律性,即很多顾客购买了A类商品的同时会考虑再购买B类商品。其实这种有趣的发现在数据挖掘领域被称作购物篮关联规则挖掘。商家运用挖掘规则对商品进行合理的摆放以及对商铺进行合理的布局, 使商场销售格局更符合消费者的消费行为与模式, 从而为商场提高销售业绩, 创造更多的利润, 也为消费者带来更多的方便. 这也正是美国零售业巨头沃尔玛创造的啤酒与尿布的成功案例给人们带来的启示.每一次购物篮处理得到的都是一位顾客的购物信息, 大多数零售企业只是将这些数据进行简单分类、分析单一的销量数据, 实际上并没有充分利用这些能反映所有顾客购物行为最有效的数据, 一些宝贵的数据资源就成了数据坟墓. 购物篮分析泛指对顾客购物篮里的商品组成进行分析。购物篮里的商品反映了商品间的相互依赖。这些商品间的依赖关系,对于零售市场商品的陈列摆放提供数据支持。目前的数据挖掘的关联规则技术则为购物篮分析提供了科学的依据。 下面我们一起来研究一下JL公司的销售小票,希望通过日常顾客的购物明细来挖掘隐藏的关联关系。 1、数据准备 一般来说,描述顾客购物数据包括:单据编号、货号、货品名称、系列、颜色、尺码、年份、品牌等等货品资料。在这里,考虑到购物数据的时效性,我们截取最近的半年数据,也就是2011年6月1日到2011年12月1日的所有购物明细数据。再通过对数据的清洗处理,我们共整理出857555条有效数据。以下就是通过整理后的部分数据截图: 图1:顾客购物篮部分数据截图 2、模型建立 顾客购物行为分析也就是关联规则挖掘,类似于模型X→Y的蕴涵式,也就是发掘购买了X后再购买Y的强规则。目前国际上普遍采用的是Apriori算法,在这里对于算法及程序实现我们暂不做介绍。 3、挖掘规则 通过对以上模型的构建及处理,我们发现通过货号关联,很难发现较为明显的规则,原因是货号过于明细,在识别规则的时候很难通过标识进行归类。因此,我们将考虑以中类或大类进行规则关联,这里我们采取以商品名称进行关联。得到部分强规则如下:

相关文档
最新文档