python爬虫怎么爬同一个网站的多页数据-Python爬虫，翻页数据怎么爬，URL不变

网址：http://quote.eastmoney.com/ce…我想爬所有页的名称数据，（这里只有两页），判断有没有下一页的条件该怎么写呢？代码：1234567891011121314151617from selenium import webdriverdriver=webdriver.PhantomJS()url='http://quote.eastmoney.com/center/list

weixin_37988176

1816人浏览 · 2020-11-01 11:53:42

weixin_37988176 · 2020-11-01 11:53:42 发布

网址：http://quote.eastmoney.com/ce…

我想爬所有页的名称数据，（这里只有两页），判断有没有下一页的条件该怎么写呢？

代码：

17from selenium import webdriver

driver=webdriver.PhantomJS()

url='http://quote.eastmoney.com/center/list.html#28003684_0_2'

driver.get(url)

usoup = BeautifulSoup(driver.page_source, 'xml')

n=[]

while True:

t=usoup.find('table',{'id':'fixed'})

utable=t.find_all('a',{'target':'_blank'})

for i in range(len(utable)):

if i % 6 ==1:

n.append(utable[i].text)

if #停止条件怎么写:

break

driver.find_element_by_xpath(r'//*@id="pagenav"]/a[2]').click()

usoup = BeautifulSoup(driver.page_source, 'xml')

后面这里就不会写了。。。

可以判断每一页的条目，每一页共20条，如果当前页不足20条的时候，说明此页是最后一页了，爬完当前页就该停止了

话说这个表格不是都有个jsonp的返回接口吗？为什么还要爬？

走的就是jsonp接口，直接拿就好了。

非要抓取的话，只能用selenium + phantomjs 之类的模拟页面去获取了。

http://nufm.dfcfw.com/EM_Fina…{rank:[(x)],pages:(pc)}&token=7bc05d0d4c3c22ef9fca8c2a912d779c&jsName=quote_123&_g=0.5385195357178545

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

自动化提示词生成工具盘点

腾讯云开发者社区

AI 浪潮下的锚与帆：工程师文化的变与不变 | 架构师夜生活

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手