一.redis的安装

链接: https://github.com/search?q=redis
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
下载这两个压缩包之后就直接解压配置环境变量
在这里插入图片描述
在这里插入图片描述
打开cmd输入redis-server
在这里插入图片描述
看到这个界面说明redis服务已经启动成功了
在这里插入图片描述
再打开一个cmd窗口,就相当于第一个窗口是服务器,第二个窗口是客户端,在客户端输入"redis-cli"连接redis数据库

set name cat 就是设置一个key为name,value为cat的键值对
keys * 查找到所有的key值
flushdb 就是删除所有的数据

二.如何将scrapy中的数据保存到redis中去

首先在终端安装一下scrapy-redis库
pip install scrapy_redis

在spider文件中导入下面库
在这里插入图片描述

在settings.py文件中配置下列配置选项

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

连接redis后输入lpush key value "key"代表的是spider文件名 "value"代表网页的url
输入keys * 拿到redis中的数据项目
最后输入lrange value 0 -1 "value "代表spider文件名 0 -1 相当于查找到redis里面的所有数据

在这里插入图片描述

总结:

主要是学会将scrapy抓取下来的数据保存到redis数据库中,使用redis的原因是redis是一个基于内存的数据库所以这个数据库的用来保存数据的效率非常快

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐