2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > 数据分析项目实战项目五:商品画像与产品关联分析体系实战

数据分析项目实战项目五:商品画像与产品关联分析体系实战

时间:2019-06-28 14:52:45

相关推荐

数据分析项目实战项目五:商品画像与产品关联分析体系实战

第一章:商品画像体系

1.1 什么是商品画像体系

商品画像可以简单理解成是海量数据的标签,根据商品不同属性的差异,将它们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名称、价格、类别等描述。

1.2 商品画像体系的数据来源

平台数据来源以亚马逊为例

“dress”相关商品除了曝光页,还有曝光商品数量,商品曝光详细信息,商品详情页数据包括变体数量信息,商品价格段位,商品排名信息,商品详情页,网址中的商品ASIN信息,五点描述与review文本信息,Q&A文本信息和A+图文宣传信息。

使用第三方数据工具获取商品画像数据()

1.3 商品画像体系的应用

进行数据筛选,有效清洗

结论:这个图可以得知大部分人在干啥,曝光价格并没有像之前所想,便宜的价格很多,而是价格在中间居多,14-35美元左右。

结论:趋势分析一般用累计平均数表示,这个图可以得知干得好的人在干啥,在搜索排序1-310,累计平均数30美元左右,卖得好的商品不会特别便宜,也不会特别贵,综合第一张图可以得出排名前300的商品价格在20-30美元,说明最佳的曝光价格在20-30美元。

结论:这个图可以得知0-0.1指很多都是新链接,0.9-1,1.4-1.5,1.9-2指商品出单,有差评,逐渐呈现正态分布,3.9-4最多,4分以上慢慢减少,4.9-5有刷评加刷单。

结论:这个图可以得知,review数量前面多,后面少,随着排序越来越多,数量越来越少。

结论:这个图可以得知,平均分布意味着标品,review数量与搜索排序没有什么关系,标品一般指带着强烈的目的进行购买比如电脑,五金制品等。

结论:这个图可以得知,前面是刷评加刷单,波动非常剧烈,后面逐渐稳定下来,后面一般是销量很大,稳扎稳打上去的评分。

结论:对“Clothing, Shoes & Jewelry”列数据取对数,这个图可以得知,一般ln可以做回归,更好的代表其趋势,排名越小,销量越好,大部分的ln值在14-15之间,意味着排名在3269017左右,如果在ln值10以内就是在22026,这是属于排名不错。

结论:这个图可以得知,在top100和所有排名对比dress,women’s占据的比例更小,说明在前100卖得好的里面卖家更擅长编写这个标题,更具有技巧性,同时他们不会出现with这个废词。但是出现sleeveless这个新词,这很可能是将来的服装的一种趋势。

第二章:购物篮分析与产品定位分析

2.1什么是产品关联度分析

关联分析是发现交易数据库中不同商品(项)之间的联系,主要应用于电商网站推荐、线下零售门店商品摆放等场景中。

关联规则:

支持度(support):数据集中包含某几个特定项的概率。比如在1000次的商品交易中同时出现了A和B的次数是50次,那么此关联的支持度为5%。

置信度(Confidence):在数据集中已经出现A时,B发生的概率,置信度的计算公式是 :A与B同时出现的概率/A出现的概率。

提升度就是在购买A产品这个条件下购买B产品的可能性与没有这个条件下购买B产品的可能性之比(置信度/无条件概率)。一般而言,提升度如果小于1,则该推荐规则不应该被使用。

2.2 什么是购物篮分析

业界一般将单个客户一次购买商品的总和称为一个购物篮,购物篮分析就是针对商品的相关性分析。因为最初这种关联分析主要是在超市应用广泛,所以也称为“购物篮分析”。

购物篮分析要点包括找到正确的物品组合,找到用户对应不同组合的购买时间,找到用户对应不同组合的购买顺序。

Apriori算法(先验算法)

Apriori是先验算法,假设子集S出现了k次,那么任何包含S的其它子集只会小于或等于k次. 反之如果S不满足最小的支持度,则任何包含S的子集也不会满足,这时包含S的子集就可以忽略计算了。

2.3 购物篮分析的应用

先输入商品零售数据,Apriori算法处理,是否满足条件:支持度≥最小支持度,置信度≥最小置信度(案例中最小支持度为0.02,最小置信度为0.35),输出关联规则,程序运行结束。

结论:这个图可以得知,比如,根茎类蔬菜到其他蔬菜,支持度0.04,置信度0.43,提升度2.24,说明用户大部分买了根茎类蔬菜还会买点别的蔬菜,酸牛奶到其他蔬菜,支持度0.028,置信度0.4,提升度2.24,说明用户买了酸牛奶一般会买其他蔬菜,按照常识推理,酸牛奶放在冷柜里面,蔬菜一般与冷柜挨着,所以这是符合用户行为逻辑。购买一种商品的顾客占全部顾客的比率,反映的是全品类的关联能力。行业参考值为40%,该值越小越好,越小说明关联能力越强。

2.4 产品定位分析

一般参考波士顿矩阵或者叫四象限分析法。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。