本发明属于信息抽取与数据分析领域。具体来讲,涉及一种推送系统中减少重复推荐的方法。
背景技术:
随着电子商务规模不断扩大,导致信息过载问题的出现,在此背景下推荐系统随之产生并被逐渐应用。目前,对于推荐没有公认的分类标准,一种常用分类为:基于内容推荐、协同过滤推荐、混合推荐和流行度推荐。
研究发现,以上相关推荐方法在用户网购整个过程中均有应用。首先,用户通过购物门户网站浏览或搜索信息,系统获取并提取用户行为信息;继而输入推荐运算模块进行一系列运算,最后获得用户当下推荐信息。计算中,多侧重于发现相似用户或相似项目信息,利用统计知识和群智思想形成最后推荐。
从上述分析可知,目前推荐技术缺乏对用户需求状态的跟踪,利用的是“尽可能多推”的策略,“盲目”进行多次重复推荐,从而来刺激用户消费。长此以往,会导致用户的流失,并对用户形成骚扰,这是一种短见的策略。
因此,如何减少盲目重复形成智能有效推荐,是推荐中的一个十分重要且亟待解决的问题,为此本发明提出一种推荐系统减少重复推荐的方法。
技术实现要素:
本发明的目的旨在于提供一种推荐系统减少重复推荐的方法,从而提升推荐系统的推荐质量,增加用户QoS和EOS,提高网站转化率。
为了解决背景技术中的问题,本发明提供了一种系统减少重复推荐方法包括:
首先,对获取的日志数据利用Spass和SQL sever工具编程进行清洗、变换和集成,然后在SQL server 2000中建表存储。
定义1浏览量(PV),某一页面或商品在一定时间段内被访问的次数,按时间长短分为:分钟浏览量、小时浏览量、天浏览量等。
定义2驻留时长(LoR),用户发起一个服务请求进入会话到离开或进入下一个会话的所花费的时间,刻画了用户对页面或商品信息的兴趣程度。
定义3购买率(BR),用户浏览物品有四种典型行为,即点击、收藏、加入购物车和购买,则可将购买率定义为BR=C1/(α1C2+α2C3+α3C4),其中Ci(i=1、2、3、4)分别对应四种用户行为,αi(i=1、2、3)分别表示不同行为对购买的贡献度。
定义4内容复杂度(CC)一次用户网购过程中,期间用户会建立若干会话,浏览若干种类的的商品,这反映了用户浏览行为复杂度和集中度。则可用单次会话用户访问的商品量与商品类的比值,即Cd=Vg/Vc,其中Vg和Vc分别表示用户访问的商品数目和商品类目数。
定义5路径复杂度(Pa_C)按时间序构成的URL序列记录了用户的访问路径,路径对应相应的页面和行为,则路径复杂度定义为行为-页面序列的改变频率。
一种推荐系统减少重复推荐的方法步骤如下:
第一步,首先进行问卷抽样调查实验,取得典型网购用户类的行为特征;然后利用SQL server查询分析器计算用户路径状态序列和各高可辨识特征,并构建用户特征向量空间模型。
第二步,引入时间情境,考虑用户记忆和行为时效性,并对用户数据按行程进行分割。所述方法选用牛顿冷却率度量这一过程,H=H0exp[-k(t2-t1)],其中H0为初始热度,k为热度冷却衰减率因子,t1和t2分别表示初始和当前时刻。当用户日志数据热度衰减至一阈值时,舍弃对应数据加入计算。利用K-means对用户特征进行聚类分类的到两个类库。
第三步,用户需求的判别发现,利用SQL server根据各特征计算法编程实现目标用户特征的分析,然后与典型用户类行为特征库匹配获取用户所述类型判断是否需求,并根据用户评分进一步验证确认判断需求。
第四步,由第三步确定当前用户需求状态,利用特征KNN法寻找用户K-近邻,然后根据K-近邻构建评分矩阵形成推荐表列,对用户进行需求驱动推荐。
第五步,进一步地,分析购后日志数据,利用所述第三步所述方法与购后类库比较,确定用户需求状态,然后利用第四步方法形成推荐表列,对推荐表列排序取热度升序top-N进行推荐。
附图说明
此处所说明的附图用来对本申请的进一步理解,构成本申请的一部分。本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为推荐系统减少重复推荐方法实现流程;
图2为典型用户特征及标志特征;
图3为方法需求发现跟踪示意图。
具体实施方式
以下将结合附图对本发明及实施例进行详尽的阐述,保证本发明的优点和特征能更加清晰易懂,籍此对本申请如何利用技术手段解决背景技术问题,并达成技术功效的实施过程能更好理解并据此施行。
本发明根本目的在于提供一种推荐系统减少重复推荐的方法,从而提升推荐系统的推荐质量,增加用户QoS和EOS,提高网站转化率。
本发明包括准备期的典型用户类行为特征库、购后典型用户类特征库,推荐实施中的需求发现跟踪法,如图1所示为本发明提供的一种推荐系统减少重复推荐方法的工作流程图。其步骤如下:
Step1:引入时间情境,利用问卷法和特征聚类法发掘得到典型用户特征库;
Step2:利用差异比较法和特征关键词法分析用户行为,得到可量化的路径复杂度、访问精度等高可辨识特征;
Step3:利用时间情境分割法,将购物行程分为购物前后购物后,利用需求判别法判断两分程需求状态;
Step4:根据需求状态和购物行程所在阶段,确定推荐方法和推荐物品表列。
进一步地,在发掘典型用户特征库过程中,通过挖掘用户访问数据发现用户事件存在明显的四类,即浏览、轻交互、重交互和交易四类;
进一步地,根据问卷抽样调查实验结果,结合用户特征向量空间模型聚类,进一步深入发掘发现用户聚集为五个类簇;根据五个类簇特征特点人工标记为五类用户,即犹豫型、理性型、追潮型、完美实用型和行动敏捷型,其特征行为和标志特征如图2所示。
进一步地,当用户发起一次购物时,网站日志系统收到会话请求,并创建相应的用户访问日志加以记录;方法计算模块获取到记录数据进行事务注入,然后调用方法中特征计算模块(对应SQL查询指令或处理程序函数)得到当前用户行为特征,紧接着时间情境分割行程状态获取对应典型用户类库信息判断用户需求状态,需求发现跟踪示意图如图3所示。
进一步地,当用户存在需求或需要刺激驱动时,利用KNN算法构建用户K-近邻(K的取值决定邻居容器大小),然后根据K-近邻构建评分矩阵形成推荐表列;
鉴于单独由K-近邻评分形成推荐存在焦点集中和长尾商品挖掘能力差的问题,引入物品热度度量整个过程中物品热度值,利用牛顿冷却率进行冷却。对推荐表列按热度升序排序,最后去top-N进行推荐。
以上实施例仅为本发明的示例性实施例。如前所述,应理解本发明并非局限于此,对于本技术领域的普通技术人员而言,在本发明所披露的技术范围内,对本发明做出改动和变换,都应在本发明的保护范围之内。
深圳SEO优化公司设备租赁网站优化惠州可信的免费网站优化衡水网站优化公司费用威海网站优化哪家好seo网站优seo优化推广遵义360网站优化如皋网站推广优化东门手机网站优化邯郸鹤壁网站优化石家庄百度快照网站优化哪家好喜茶网站的url优化网站优化按天收费怎样给网站做seo优化杨浦区网站搜索引擎优化教育网站优化网站搜索排名优化选任云速捷淄川博山网络推广网站优化济南网站建设优化开源网站优化关键词佛山seo网站如何优化湖北seo网站优化价格做优化的网站必须独立IP吗孝感外包网站优化公司怀化外贸网站优化推广百度网站网站排名优化软件泰安加盟网站优化网站搜索优化适合火25星推苏州网站优化推广工作室哪个网站可以优化到首页婚恋网站优化方案歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运