【数据分析】seaborn的自带数据集
学习pandas时候如果没有合适的数据集,可以用一些自带的数据集做数据分析。seaborn是个非常好用的数据分析包,其中包含了非常多的自带数据集,这些数据集存放在线上github中,用户load时自动从网络中加载,返回pandas的dataframe对象。
·
学习pandas时候如果没有合适的数据集,可以用一些自带的数据集做数据分析。seaborn是个非常好用的数据分析包,其中包含了非常多的自带数据集,这些数据集存放在线上github中,用户load时自动从网络中加载,返回pandas的dataframe对象。
查看所有可用数据集
- 可使用命令:
# 查看数据集种类
import seaborn as sns
sns.get_dataset_names()
- 打开数据集网站
https://github.com/mwaskom/seaborn-data ,其中为所有自带数据集
数据集加载
通过load_dataset加载,name即数据集的名字。
titanic数据集加载示例:
import seaborn as sns
df = sns.load_dataset('titanic')
df.sample(5)

数据分析
基于所加载的数据集进行相应的数据分析工作
更多推荐
所有评论(0)