最全利用Python进行数据分析(附详细案例)_python数据分析案例,面试抗压题
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。需要这份系统化学习资料的朋友,可以戳这里获取一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
一、Python所有方向的学习路线
Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件
工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、入门学习视频
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
#导入numpy包
import numpy as np
#导入pandas包
import pandas as pd
二、基础知识
2.1 一维数据分析:NumPy
2.2 一维数据结构:Pandas
2.3 二维数据分析:numpy对应array
2.4 二维数据分析:pandas对应数据框DateFrame
此处遇到一个问题:读取Excel文件报错。
解决方法:
1 查看Excel文件存放路径
具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。
2 将上面标红的两处合成文件的路径,
格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb
3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\)
最后的路径为F:\ann\Untitled1.ipynb
三、Python具体案例分析:药店销售数据

3.1 提出问题
分析指标:
月均消费次数
月均消费金额
客单件
消费趋势
3.2 理解数据
3.3 清洗数据
3.3.1 选择子集
3.3.2 列名重命名
3.3.3 缺失数据处理(dropna()函数)
Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。
- Python内置的None值;
- pandas中,将缺失值表示 为NA,表示不可用not available;
- 对应数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据;
None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。
3.3.4 数据类型转换
3.3.5 数据排序
3.3.6 异常值处理
3.4 构建模型
3.4.1 指标1:月均消费次数=总消费次数/月份数
3.4.2 指标2:月均消费金额=总消费金额/月份数
3.4.3 指标3:客单价=总消费金额/总消费次数
客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。
3.4.3 消费趋势
最后
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
更多推荐
所有评论(0)