接上一篇,我们根据第一页的链接爬取了第一页的博客,我们不难发现,每一页的链接就只有一处不同(页码序号),我们只要在上一篇的代码外面加一个循环,这样就可以爬取所有博客分页的博文,也就是所有博文了。
# -*- coding : -utf-8 -*-
import urllib
import time
url = [\’ \’]*350
page = 1
link = 1
while page
接上一篇,我们根据第一页的链接爬取了第一页的博客,我们不难发现,每一页的链接就只有一处不同(页码序号),我们只要在上一篇的代码外面加一个循环,这样就可以爬取所有博客分页的博文,也就是所有博文了。
# -*- coding : -utf-8 -*-
import urllib
import time
url = [\’ \’]*350
page = 1
link = 1
while page
还没有评论,来说两句吧...