(论文)题目基于关联规则的超市营销策略研究与分析一、课题来源、研究的目的和意义、国内外研究现状及分析课题来源题目自拟研究的目的和意义当前,随着数据库技术的迅速发展以及数据管理系统的广泛应用,积累数据越来越多。在这些海量的数据中,往往蕴含着丰富的、对零售业购物篮分析有指导意义的知识。因此,零售业购物篮分析继续一种能从海量信息中发现潜在知识的“工具”,以解决“数据爆炸和知识贫乏”的矛盾。数据挖掘技术最突出的特点便是从海量数据中挖掘出更有价值的信息,这一特点正好迎合零售业购物篮分析数量大的现状。正是这种背景下,将关联规则挖掘技术应用到超市决策中,建立基于数据挖掘的超市决策管理系统,从而在超市的海量数据中得到有价值的信息,为管理层提供经营支持,将是很有必要深入研究的课题。从大量的零售事物记录中发现有趣的关联规则可以帮助许多零售商制定决策,如促销分析、交叉购物、分类设计等。在零售业购物篮分析对顾客的购买行为进行关联规则分析,就有可能发现顾客的购买习惯,如果商家充分利用顾客的购买习惯,将销售商品进行合理的摆放,可以增加商品的销售量,从而提高商品的利润。最后,在企业决策过程中往往存在着种种不同的目标和约束,如利润和商品等因素,过去数据挖掘领域对这方面的研究不多,因此,合理的降关联规则应用在零售业购物篮(超市营销)分析中,产生有意义的信息,并将这些信息归纳作为企业决策时的参考,最终是企业具有更强大的竞争优势,这将会是一份有重要意义和富有挑战性的工作。国内外研究现状及分析近几年,对数据挖掘中关联规则的研究是一个非常热门的领域,关联规则是有Agrawal等人首先提出来的一个重要的KDD研究课题,它反映了大量数据中项集之间有趣的关联或相关联系,发现频繁项目集是关联规则挖掘应用中的关键技术和步骤。关联规则挖掘有许多扩展,包括序列模式挖掘,空间关联规则挖掘,事物间关联规则挖掘,正关联规则挖掘和负关联规则挖掘,目前这些方面的研究都比较热门。国际数据挖掘知名学者、加拿大SinmonFraster大学的教授、关联规则中FP-Growth算法提出者HanJiaWei,他领导的课题组开发了数据挖掘原型系统DB-Minerls。这是一个交互式、多层次的挖掘,可从数据库中挖掘不同层次的知识,国外很多计算机公司非常重视数据挖掘的开发应用,另外对度量的研究有所突破,Chen,Han,Brin和Moani等人提出了强关联规则的兴趣度问题,这方面的讨论受到重视,评估关联规则兴趣度的支持度-置信度框架的其他替代方法,促进现有度量方法的完善。这方面的研究和讨论被Sliverstevein推广到相关的算法中。其他方面的研究有:多层关联规的有效增量更新问题:使用量化属性的静态离散化,数据立方体的研究和并行分布关联规则的挖掘等。在国外,关联规则挖掘已经投入应用领域,SGIMineest软件、SAS公司的EnternriesMnier软件已经被光放应用在各个商业领域中,其中传统的零售行业运用最为光泛,营销挖掘、购物篮分析和分类设计等都是零售业数据挖掘的只要内容。与国外相比,国内对数据挖掘的研究稍晚,没有形成整体力量,直到近年来国家自然科学基金支持该领域的研究项目,并且目前进行的大多数研究项目是由政府资助进行的,如863计划等,从事数据挖掘的人员主要在大学,也有部分在研究所或公司。研究所设计的领域很多,一般集中于学习算法的研究,如发现频繁项目集的算法诸如DEelat,Eclat以及DMFI等,这些现金的算法追求的目的就是采用多种搜索策略,尽可能早地对项目集进行修剪,减少每次匹配比较的次数和I/O操作;又如2005年,邓丰义,刘震宇等人提出一种基于向量的FP-Growth改进算法,该算法利用向量表示法使得FP-tree的构造只需扫描数据库一次吗,减小了开销,在支持度变化和有新增数据时也有一定的改进效果。数据挖掘的实际应用以及数据挖掘理论方面的研究,如北京系统工程研究所对模糊方法在知识范县中的应用进行了较深入的研究;北京大学也在开展对数据立方体代数的研究;华中科技大学、中国科技大学、中科院等单位开展了对关联规则挖掘算法的优化和改造;上海交通大学、电子科技大学等单位探讨和研究了非结构化数据的知识发现以及Web数据挖掘。但是到目前位置没有真正意义上的上虞工具问世,二项复旦大学设计的基于关联规则的数据挖掘工具ARMiner等也只是处于实验阶段。在购物篮分析领域,国外对消费者同时购买行为最深如的研究,应该属于Manchanda,Ansari,以及Gupta。他们提出的一个基于随机效用函数(RandonUtilityTheory)的多种类同时购买决策(MulticategoryPurchaseIncidenceDecision)模型。该模型通过贝叶斯多维Probit模型(BayesianMultivariateProbitModel),惊喜地刻画了哥哥消费者的同时购买行为特征,并同时考虑到了消费性质的影响。国内对于购物篮的研究才刚刚起步,范围并不广泛。杜海涛、陈定方等人提出了基于关联规则分析的“购物篮分析”模型的研究,薛红、聂桂华提出了一种基于关联规则的超市购物篮分析方法。黄嘉满在其书中根据规则和兴趣度推出商品竞争模型、商品利润模型和商品推荐模型。大部分都是从外部效益方面进行研究,得出的商品知识结果也只是依靠支持度、置信度和兴趣度的信息。目前,关联规则挖掘与购物篮分析在超市的应用在超市的应用是被普遍关注的一个问题,在相关领域已经有了一定的应用和发展。国内外研究者这在销售什么样的商品?采用什么样的促销策略?商品在货架上如何摆放?了解顾客的购买习惯和偏爱等方面做了相当的理论探讨和模型计算。上述的从零售业的强关联规则,利润最大化的商品销售、商品推荐都做出较好的理论分析和实现。文献[10]也在零售业商品的销售预测和商品之间关联方面做了一定的探讨。二、主要研究内容关联规则挖掘算法在商业领域尤其超市营销方面已经取得了成功。在此领域中,关联挖掘技术也是相当的成熟。本课题的研究内容如下:熟悉掌握关联规则中的集中重要的算法和改进方法,Apriori算法、并行挖掘算法、多层次关联规则挖掘、数量关联挖掘等;熟悉关联规则算法在超市营销领域的实际应用,如客户管理,商品营销,设计实现相对应的数据库系统,进行数据处理,算法分析,图表可视化。在数据挖掘系统上进行实验,内容采用购物篮子分析为例。通过对超市在一段时期内大量顾客的购买信息,经数据处理(数据特征探索、分析与预处理),数据分析(问题明确化、数据调整等技术的选择),建立数据模型,给出结果书记以及以图表形式展示出来,从而能从大量的数据中挖掘出有利于超市营销的数据提供给超市决策层。三、实验方案、实验方法及预期达到的目标1.实验方案描述与可视化2.实验方法在系统上进行仿真实验。用系统与数据库连接,将搜集的准备数据从excel表中导入数据库中。选择关联规则算法,在选择不同的支持度、置信度和兴趣度,让系统自动计算出商品之间的频繁项集。将计算得出的数据结果存在数据库中,以数据或图表的形式显示 在系统界面上。 3.预期达到的目标 数据能简单,明显,生动的显示出来四、完成课题所需的条件、主要困难及解决办法 1.所需条件 PC机一台,有一定的配置 WindowsXP 操作系统,并装有数据库Microsoft SQL Server 2005,Micro office,Eclipse 大量实验数据2.主要困难 数据的描述与可视化3.解决方法 利用接下来的时间学习相关知识,掌握语言与算法,并收集实验数据。可通过上网查 询,书籍查询,生活实际调查等。 五、参考文献 (参考文献书写顺序:[序号] 作者.文章名.学术刊物名.年,卷(期):引用起止页) JiaweiHan, Micheline Kamber. 数据挖掘概念与技术[M]. 北京: 机械工业出版社. 2001 关联规则采掘综述[J].计算机应用研究. 2000, 17(1): 1-5 数据挖掘中关联规则算法的研究[J].计算机工程与科学, 2007(12):111-116 [美]迈克尔JA贝里,戈登S利诺夫. 数据挖掘——客户关系管理科学与艺术[M]. 中国财政经济出版社.2004 基于关联规则挖掘的入侵检测技术研究[D].硕士学位论文. 重庆大学, 2007 刘小平.基于概念和Apriori 的关联规则挖掘算法分析[J]. 合肥工业大学 学报(自然学科版). 2006, 29(6): 69-702 基于关联规则的超市购物篮分析方[J].湖北工业大学学报 2008, 23(4):15-18 基于关联规则分析的购物篮分析模型研究[J].北京贡山大学学报. 2008, 23(4):15-18 面向零售业的关联规则挖掘的研究与实现[D].硕士学位论文. 上海交通大学, 2007 [10] 基于零售业的数据挖掘技术和关联规则算法的改进研究[D].硕士学位论文, 北工业大学.2006 [11] 数据挖掘技术在商业决策中的应用.全国税务系统第一期高级信息管理人才 研修班信息管理课程讲义[Z]. 清华大学经管学院. 2000 起止日期 论文工作进度(主要内容、完成要求) 2011.12.08~2011.12.28 学习掌握相关理论知识、开发技术等 2011.12.08~2011.12.28 完成开题报告 2012.01.01~2012.01.20 系统初步设计 2012.01.21~2012.03.10 系统的实现,处理分析数据,得出理论 2012.03.11~2012.05.01 系统的实现,处理分析数据,得出理论,撰写毕业论文 2012.05.02~2012.05.31 论文修改、完善、定稿