数据挖掘入门系列教程(一)之亲和性分析
教程为入门教程,为博主学习数据挖掘的学习路径步骤。教程为入门教程,从最简单的开始。使用的编程语言为 Python3.8.1,使用 JupyterNotebook 作为开发环境(使不使用 JupyterNotebook 都没有关系)。在学习本教程之前,你需要:有一点 python 编程基础会用百度 or 谷歌数学知识还是要一点的(但是要多少呢?我也不知道,我也是刚开始学)什么是数据挖掘, 相信点击进
教程为入门教程,为博主学习数据挖掘的学习路径步骤。教程为入门教程,从最简单的开始。使用的编程语言为 Python3.8.1,使用 JupyterNotebook 作为开发环境(使不使用 JupyterNotebook 都没有关系)。
在学习本教程之前,你需要:
有一点 python 编程基础
会用百度 or 谷歌
数学知识还是要一点的(但是要多少呢?我也不知道,我也是刚开始学)
什么是数据挖掘, 相信点击进入这篇博客的人都应该知道了吧。通俗的说就是挖掘数据所蕴含的含义,寻找数据之间的关系。
下面将以最简单的亲和性分析来开始吧。
亲和性分析
相信大家都听说过一个例子:
在美国的零售业有着这样一个传奇故事,沃尔玛百货将他们的纸尿裤和啤酒并排摆在一起销售,结果纸尿裤和啤酒的销量双双增长!
什么是亲和性分析呢?亲和性分析根据样本个体之间的关系,确定它们关系的亲疏。举一个简单的应用:顾客去超市买了一个苹果,那么他会不会很大的可能性去买香蕉呢?
首先,我们得有一个数据集:
这个是一个很简单的商品交易数据集,简单到它只有 100 条数据,尽管数据比较少,but 我们用来学习一下还是可以的。
完整资料进入【数字空间】查看——搜索"writebug"
WRITE-BUG研发团队衷心希望【WRITE-BUG数字空间】可以给每位同学一个属于自己的秘密空间,同时祝愿大家在“公开圈子”世界里,遇见志同道合的伙伴们,因为我们与大家一样,都曾孤独前行着。




更多推荐
所有评论(0)