python爬取妹子图

就不整那些了，直接上代码，大家复制即可（记得点赞）把lxml库和requests库下了就可以复制直接运行，保存在"4k图片爬取"文件夹里#解析下载图片数据import requestsimport osfrom lxml import etree# 创建文件夹try:os.mkdir('./4k图片爬取')except Exception:print('文件已创建！')for i in range

小航冲冲冲

12578人浏览 · 2021-02-08 11:29:14

小航冲冲冲 · 2021-02-08 11:29:14 发布

就不整那些了，直接上代码，大家复制即可（记得点赞）

把lxml库和requests库下了就可以复制直接运行，保存在"4k图片爬取"文件夹里

#解析下载图片数据
import requests
import os
from lxml import etree

# 创建文件夹
try:
    os.mkdir('./4k图片爬取')
except Exception:
    print('文件已创建！')

for i in range(2,172):

    i = str(i)

    #目录页面
    ml_url = 'http://pic.netbian.com/4kmeinv/index_' + i + '.html'

    # UA伪装请求头
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chromeh/81.0.4044.138 Safari/537.36'
    }

    response = requests.get(url=ml_url,headers=header)

    #通用处理中文乱码的解决方法
    res=response.text.encode('iso-8859-1')

    treee = etree.HTML(res)

    t = treee.xpath('//div[@class="slist"]/ul/li')

    for tu in t:
        http = 'http://pic.netbian.com'
        #标题
        tit = tu.xpath('./a/img/@alt')[0]
        #地址
        tp = http + tu.xpath('./a/img/@src')[0]

        img = requests.get(url=tp,headers=header).content

        imgpath = './4k图片爬取/' + tit + '.jpg'

        with open(imgpath, 'wb') as fp:

            #传入二进制内容
            fp.write(img)

            print(tit,'下载成功！')

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

自动化提示词生成工具盘点

腾讯云开发者社区

AI 浪潮下的锚与帆：工程师文化的变与不变 | 架构师夜生活

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手