redis数据库的安装,将scrapy的数据导入到redis数据库
主要是学会将scrapy抓取下来的数据保存到redis数据库中,使用redis的原因是redis是一个基于内存的数据库所以这个数据库的用来保存数据的效率非常快**
·
一.redis的安装
链接: https://github.com/search?q=redis
下载这两个压缩包之后就直接解压配置环境变量
打开cmd输入redis-server
看到这个界面说明redis服务已经启动成功了
再打开一个cmd窗口,就相当于第一个窗口是服务器,第二个窗口是客户端,在客户端输入"redis-cli"连接redis数据库
set name cat 就是设置一个key为name,value为cat的键值对
keys * 查找到所有的key值
flushdb 就是删除所有的数据
二.如何将scrapy中的数据保存到redis中去
首先在终端安装一下scrapy-redis库
pip install scrapy_redis
在spider文件中导入下面库
在settings.py文件中配置下列配置选项
连接redis后输入lpush key value "key"代表的是spider文件名 "value"代表网页的url
输入keys * 拿到redis中的数据项目
最后输入lrange value 0 -1 "value "代表spider文件名 0 -1 相当于查找到redis里面的所有数据
总结:
主要是学会将scrapy抓取下来的数据保存到redis数据库中,使用redis的原因是redis是一个基于内存的数据库所以这个数据库的用来保存数据的效率非常快
更多推荐
已为社区贡献1条内容
所有评论(0)