关键词:商品;数据挖掘;模型;应用
摘 要:数据挖掘在销售管理中的应用是当前较活跃的研究内容之一,销售管理是企业经营管理中的一个重要环节,针对销售管理活动的特点,建立销售管理的数据挖掘系统模型,通过实例,销售管理中商品销售数据的挖掘过程,使企业获取有助于销售决策的大量有价值的信息,并能及时、准确掌握客户需求及变化趋势,提高服务水平,从而获得竞争优势。
中图分类号:f724.6
文献标识码:a
文章编号:1672-4755(2007)02-0093-02
一、数据挖掘过程
数据挖掘是一个包含了许多不同步骤的一个过程,这个过程的输入是数据,而过程的输出是用户期望的有用信息。
数据挖掘过程一般由五个步骤组成:一是选择,数据挖掘过程所需要的数据可能从不同的异构数据源获取,因此,第一步就是从各种数据库、数据仓库、文件和非电子数据源中获取数据。二是预处理,初始数据中可能会有一些错误的或者缺失的数据。由于数据源、数据类型以及度量的多样性,可能会有一些不规则数据,还会有一些同时实施的不同操作。错误的数据可以修正或删除,但缺失的数据必须补充或者预测。三是变换,为便于挖掘,从不同数据源获取的数据必须转换成统一的数据格式。一些数据可能需要编码或者变换成更容易使用的格式。四是数据挖掘,基于所执行的数据挖掘任务,这一步骤就是对变换后的数据应用所建立的模型(算法)来产生所期望的挖掘结果。五是解释/评价,数据挖掘的结果如何提交给用户是一个非常重要的问题,这是因为数据挖掘结果的有用性主要取决于这一步。通常使用各种可视化工具和图形用户界面来展现结果。
根据前面的五个数据挖掘步骤,可建立如下销售管理数据挖掘模型见图1。在数据仓库的基础上,还可根据需要进一步对数据细分,形成数据集市,如商品集市、客户集市、市场集市等,细节的颗粒越粗,那么算法的工作量就越小;细节的颗粒越细,那么结果的可实施性就越好。然后利用数据挖掘技术,建立销售部门的描述模型和预测性模型,通过对模型结果的评价分析,发现客户的消费模式,购买习惯,预测客户的消费行为,最终将结果以可视化方式提交用户,为决策部门提供有效的管理和决策信息。
二、关联规则
关联规则是数据挖掘中的重要技术之一。关联分析的目的是寻找给定数据记录集中数据项之间隐藏的关联关系,描述数据之间的密切度。关联规则是通过量化的数字描述行为x的出现对行为y的出现有多大的影响。关联规则虽然来源于pos中,但是可以应用于很多领域。只要一个客户在同一个时间里买了多样东西,或者在一段时间了做了好几样事情就可能是一个潜在的应用。
图1 销售管理的数据挖掘模型
三、数据挖掘在销售管理中的应用实例
数据挖掘在营销中的主要应用有:关联分析即市场篮子分析,用于了解顾客的购买习惯和偏好,有助于决定市场商品的摆放和产品的捆绑销售策略;序列模式与市场篮子分析相似,不过是用某时间点发现的产品购买或其他行为模式来预测将来购买产品或服务类别的概率;聚类用于市场细分,将顾客按其行为或特征模式的相似性划分为若干细分市场,以采取有针对性的营销策略;分类用于预测哪些人会对邮寄广告和产品目录、赠券等促销手段有反应,还可用于顾客定级、破产预测等。
下面给出一个某超市顾客购买商品的事务数据库中的数据,说明关联规则对商品销售数据的挖掘过程,通过挖掘发现顾客的购买习惯和偏好。
某超市对一定时期内顾客购买商品的数据收集如下:
数据挖掘过程如下:
第一步,计算出表中每种商品的关联规则支持度,根据定义一,计算出
support(a)=3/5=0.6=60%
support(b)=4/5=0.8=80%
support(c)=4/5=0.8=80%
support(d)=2/5=0.4=40%
support(e)=1/5=0.2=20%
第二步,根据设定的最小支持度阀值,将大于或等于最小支持度阀值的商品挑选出来,设最小支持度阀值为0.3,可挑选出商品a、b、c及d。
第三步,计算商品的关联规则置信度。
根据定义二,计算出a、b、c及d四种商品的置信度。
为简便计,其余数据通过表格表示如下:
第五步,根据上述关联规则,可以发现超市顾客的购买习惯和偏好,销售管理人员可采取如下措施:一是调整货架,将商品b、c、d统一放置在一起,便于顾客选购,甚至可考虑将商品b和d、商品c和d捆绑销售;二是在顾客选购a商品后,促销人员可适时向顾客推荐b商品或c商品;三是在进货或仓储方面,可考虑将关联商品统购统存;四是印发关联商品的促销广告,提高商品的支持度和置信度;五是在企业网络销售中,应将关联商品放在同一页面或增加关联商品间的链接。在采取以上措施后,超市可以扩大销售额,提高了服务水平,顾客可以扩大交叉购买,增加消费。
通常关联规则挖掘普遍使用“支持度-置信度”度量机制,但需要注意的是,在实际应用中,不加额外的限制条件会产生大量的规则。这些规则并不是对用户都是有用的或感兴趣的。衡量关联规则挖掘结果的有效性应该从多种综合角度来考虑。一是准确性:挖掘出的规则必须反映数据的实际情况。尽管规则不可能是100%适用。二是实用性:挖掘出的规则必须是简洁可用的,而且是针对挖掘目标的。不能是有100条规则,其中50条与商业目标无关,30条用户无法理解。三是新颖性:挖掘出的规则可以为用户提供新的有价值信息。但如果它们是用户事先知道的,那么这样的规则即使再正确也是毫无价值的。
四、结论
上述销售管理的数据挖掘,可应用于商品批零业和大型超市等商业企业中。为更好地满足客户需求,通过对商品数据的挖掘,发现商品之间的关联特征,在有效利用企业有限资源的基础上,采取相应的销售策略,既能够提高企业的服务水平,提高客户满意度,又能够节约企业资源,利用最小的投入,获得到较大的收益。在信息时代,对提高企业的竞争力,更好地应对机遇和挑战具有重要作用和意义。
参考文献:
[1][美]margaret h.dunham. 数据挖掘教程[m].北京:清华大学出版社,2005.
[2]毛国君,段立娟.数据挖掘原理与算法[m].北京:清华大学出版社,2005.
责任编辑:迈夫
“本文中所涉及到的图表、注解、公式等内容请以pdf格式阅读原文”