数据挖掘入门系列教程(四点五)之 Apriori 算法
Apriori(先验)算法关联规则学习的经典算法之一,用来寻找出数据集中频繁出现的数据集合。WRITE-BUG研发团队衷心希望【WRITE-BUG数字空间】可以给每位同学一个属于自己的秘密空间,同时祝愿大家在“公开圈子”世界里,遇见志同道合的伙伴们,因为我们与大家一样,都曾孤独前行着。按照我们的想法,肯定是数据在数据集中出现次数的越多,则代表着这个数据出现的越频繁。值得注意的是:在这里的数据可以是
目录
数据挖掘入门系列教程(四点五)之 Apriori 算法
频繁(项集)数据的评判标准
支持度(support):
置信度(confidence):
提升度(Lift):
Apriori 算法流程
结尾
参考
数据挖掘入门系列教程(四点五)之 Apriori 算法
Apriori(先验)算法关联规则学习的经典算法之一,用来寻找出数据集中频繁出现的数据集合。如果看过以前的博客,是不是想到了这个跟数据挖掘入门系列教程(一)之亲和性分析这篇博客很相似?Yes,的确很相似,只不过在这篇博客中,我们会更加深入的分析如何寻找可靠有效的亲和性。并在下一篇博客中使用 Apriori 算法去分析电影中的亲和性。这篇主要是介绍 Apriori 算法的流程。
频繁(项集)数据的评判标准
这个在数据挖掘入门系列教程(一)之亲和性分析这篇博客曾经提过,但在这里再重新详细的说一下。
何如判断一个数据是否是频繁?按照我们的想法,肯定是数据在数据集中出现次数的越多,则代表着这个数据出现的越频繁。
值得注意的是:在这里的数据可以是一个数据,也可以是多个数据 (项集)。
完整资料进入【数字空间】查看——搜索"writebug"
WRITE-BUG研发团队衷心希望【WRITE-BUG数字空间】可以给每位同学一个属于自己的秘密空间,同时祝愿大家在“公开圈子”世界里,遇见志同道合的伙伴们,因为我们与大家一样,都曾孤独前行着。




更多推荐
所有评论(0)