下载 bilibili 字幕文件

打开一个 bilibili 网页,鼠标右键,然后点击 “检查”
在这里插入图片描述
选项切换到 “Network”,然后重新打开此网页
在这里插入图片描述
在搜索栏中输入json 进行过滤,然后可以看到一个 后缀为.json 的文件,即为该视频对应的字幕文件。
在这里插入图片描述

提取字幕文件中的文本文字

首先将上述字幕文件下载到本地,然后执行如下代码,提取字幕文件中的文本内容。

import json
json_path = 'fb1fe3b8b5fce3b8fb8cb25b3d86e5dab8c98989.json'

# 读取 json 文件
with open(json_path, 'r', encoding='utf-8') as load_f:
    content = json.load(load_f)
    res = ''
    body = content['body']
    for data in body:
        res = res + data['content'] + ','
    print(res)
Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐