学习pandas时候如果没有合适的数据集,可以用一些自带的数据集做数据分析。seaborn是个非常好用的数据分析包,其中包含了非常多的自带数据集,这些数据集存放在线上github中,用户load时自动从网络中加载,返回pandas的dataframe对象。

查看所有可用数据集

  1. 可使用命令:
# 查看数据集种类
import seaborn as sns
sns.get_dataset_names()
  1. 打开数据集网站
    https://github.com/mwaskom/seaborn-data ,其中为所有自带数据集
    在这里插入图片描述

数据集加载

通过load_dataset加载,name即数据集的名字。
在这里插入图片描述

titanic数据集加载示例:

import seaborn as sns
df = sns.load_dataset('titanic')
df.sample(5)

在这里插入图片描述

数据分析

基于所加载的数据集进行相应的数据分析工作

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐