数据分析思维 Data Analytical Thinking
简单介绍了数据分析思维的基本概念,常见且比较重要的数据分析的思维方法
目录
一、数据分析思维是什么?
数据分析思维是指通过对数据进行收集、清洗、分析和解释,从中发现规律和趋势,从而得出结论和决策的一种思维方式。它需要具备对数据的敏感性和分析能力,能够通过数据挖掘和可视化等手段,发现数据中的价值和洞见。
二、常见的数据分析思维
1、信度与效度思维
信度,是指数据或指标自身的可靠程度,包括准确性和稳定性;效度,是指数据或指标贴合它所要衡量的事物,即指标具有代表性。
数据分析通常是建立在原始数据和统计指标基础上的关系,趋势和结构等的洞察和预测,只有保证了数据或指标的信度和效度,才有可能得出符合事实的结论。因此,信度和效度思维也显得尤其重要。
2、分类思维
分类是指在一定维度上,把整体划分为若干个类,组或者簇,以便于更好的明确问题,发现规律,制定策略等。分类的主旨思想是让各个类内部的实例更具相似性,各个类之间则呈现出更明显的差异。分类思维应用于客户分群、产品归类、市场分级、绩效评价等诸多场景中。
3、矩阵化思维
矩阵思维是分类思维的发展,通常情况下,从用来描述对象的诸多指标中挑选出最具代表性的两个指标,或者把原始数据或指标压缩到2维空间,再借助坐标轴,把每个实例都映射在坐标轴的某个区间达到分类的目的。矩阵思维可以直观的把握整体的情况,可以从众多的数据中有效的了解实例的结构,对于深入分析和制定策略决策非常实用。颇具代表性的矩阵化思维框架有波士顿矩阵,FM矩阵等。
4、漏斗思维
漏斗思维是一种应用于量化销售各环节转化情况和用户的注册浏览转化等行为路径的数据分析思维。通过观察各个关键节点,或者关键行为流入到下一个节点或行为的数量变化,来发现和定位问题,优化策略,进行准确有效的干预,以改善最终的结果。漏斗思维的关键,是明确起始点和终点,准确定位到中间的关键节点。
5、相关思维
相关思维,通常是观察事物,变量之间的相关关系。就是特征或变量之间是否存在相同的增长趋势或逆增长趋势的关系,在统计学中对应的是相关性检验。在数据分析的过程中,经常需要处理几十个,或者几百个以上维度的数据,为了更有效的进行描述,可视化,数学建模等分析,对特征进行筛选,去除干扰,保留有效指标是非常关键的环节。结合业务经验,进行可视化或相关性检验等就显得非常重要。
6、逻辑树思维
逻辑树思维,简而言之就是数据分析中逻辑思维或者说逻辑判断结果的可视化展现,呈树状结果,故而称为逻辑树思维。一般说明逻辑树的分叉时,都会提到“分解”和“汇总”的概念,也可以理解为“下钻”和“上卷”。所谓下钻,就是在分析指标的变化时,按一定的维度不断的分解。比如,按地区维度,从大区到省份,从省份到城市,从省市到区。所谓上卷就是反过来。随着维度的下钻和上卷,数据会不断细分和汇总,在这个过程中,我们往往能找到问题的根源。下钻和上卷并不是局限于一个维度的,往往是多维组合的节点,进行分叉。逻辑树引申到算法领域就是决策树。有个关键便是何时做出决策(判断)。当进行分叉时,我们往往会选择差别最大的一个维度进行拆分,若差别不够大,则这个枝桠就不在细分。能够产生显著差别的节点会被保留,并继续细分,直到分不出差别为止。经过这个过程,我们就能找出影响指标变化的因素。
7、时间序列思维
时间序列思维是把分析对象放在时间线上进行观察,通常结合能够反映分析对象属性的指标,在不同时间节点或区间的观察值进行分析。
时间序列的思维有三个关键点:一是距今越近的时间点,越要重视;二是要做同比,指标往往存在某些周期性,需要在周期中的同一阶段进行对比,才有意义;三是异常值出现时,需要重视(比如出现了历史最低值或历史最高值,建议在时间序列作图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。
时间序列思维中有个重要的概念,就是“生命周期”。用户、产品、人事等无不有生命周期存在。生命周期衡量清楚,就能很方便地确定一些“阀值”问题,使产品和运营的节奏更明确。
8、闭环思维
闭环思维可以理解为用户行为,业务流程,问题解决等层面上的一种鸟瞰式思维。有助于理解和把握全局,以及各个节点或环节在全局中的位置和作用。闭环的概念可以引申到很多场景中,比如业务流程的闭环、用户生命周期闭环、产品功能使用闭环、市场推广策略闭环等等。
9、对比思维
对比思维典型的说法是AB test。在SEO,内容推送,活动效果分析等众多领域广泛应用。尤其是得到了大数据的基础支持,已然成为了数据决策必不可少的策略。在条件允许的情况下,决策前尽量做对比测试,参照组的选择尤为重要,参照组和试验组在预先设计的指标体系上的同期群对比结果,是决策的依据。
10、指数化思维
指数化思维可以称为是数据分析当中的简化思维,是指将衡量一个问题的多个因素分别量化后,组合成一个综合指数/指标(降维),来持续追踪的方式。在具体的操作中,涉及到“降维”的方法,即要把多个指标压缩为单个指标。
指数化的优势非常明显,一是减少了指标,使得管理者精力更为集中;二是指数化的指标往往都提高了数据的信度和效度;三是指数能长期使用且便于理解。
在设计综合指数的时候,有三个关键点:一是要遵循独立和穷尽的原则;二是要注意各指标的单位,尽量用标准化来消除单位的影响;三是权重和需要等于1。
总结
本文主要简单介绍了数据分析思维的基本概念,常见且比较重要的数据分析的思维方法,有助于在进行数据分析的过程中,更有效的定义业务问题,理清思路,找到对应的解决方案。这些只是数据分析思维当中的一部分概念,在解决实际的业务问题时,还需要结合具体的业务场景,进行扩展和总结。
更多推荐
所有评论(0)