用python数据分析第三版_用Python玩转数据分析3

在MOOC上学习课程《用Python玩转数据分析》的学习笔记。datetime模块dir(datetime) 可以查看模块中所包含的内容help()可以查看具体内容timestamp时间戳，是指从1970年1月1日0时开始计算的秒数，全球电脑的时间戳都是一样的本地数据获取打开文件open(文件名, mode = 'r', buffering = -1, ...)mode中r可读的意思，w是写文件(

weixin_39601642

350人浏览 · 2020-12-06 04:11:49

weixin_39601642 · 2020-12-06 04:11:49 发布

在MOOC上学习课程《用Python玩转数据分析》的学习笔记。

datetime模块dir(datetime) 可以查看模块中所包含的内容

help()可以查看具体内容

timestamp时间戳，是指从1970年1月1日0时开始计算的秒数，全球电脑的时间戳都是一样的

本地数据获取打开文件

open(文件名, mode = 'r', buffering = -1, ...)

mode中r可读的意思，w是写文件(清空原来的内容)，a是在文件后面追加内容

buffering默认为-1，即使用系统默认的缓冲区大小，0表示不缓冲，大于0表示设置的缓冲区大小

对象名.方法名( )

如with open(文件地址) as f:

p1 = f.read() / f.write() / f.close()

f.read(2), 至多读出2字节数据

对象名.readlines() / writelines() 读入或写入多行内容

对象名.seek(offset, whence = 0)

在文件中移动文件指针，从whence(0表示文件头部，默认；1表示当前位置，2表示文件尾部)往后偏移offset个字节

网络数据获取Requests库--网页数据获取

以豆瓣网为例，http://www.douban.com/robots.txt，可以查看该网站关于爬虫的协议，其中有crawl-delay=5，表示抓取的延迟是五秒钟

r = request.get('要抓取的url')

r.status_code

(若返回200则状态正常)

r.text就可显示抓取的内容

request.json／request.content用来解码

网页数据解析

BeautifulSoup是HTML和XML的解析器，正则表达式模块用于更复杂的、细节网页数据提取。BeautifulSoup使用

from bs4 import BeautifulSoup

soup = BeautifulSoup(lxml格式的对象名,'lxml')

soup.b, soup.p就是里面的tag；soup.string可以取到里面非属性的字符串内容，即取到NavigableString

soup.find_all(标签名,属性内容)，find_all可以返回一个列表

正则模块使用

假如要找到一串网页内容后的一个数字

pattern_s = re.compile('一串网页内容')

p = re.findall(pattern_s,r.txt) 结果就可以返回一串列表p

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git