Bob's Blog

Web开发、测试框架、自动化平台、APP开发、机器学习等

Python爬虫(三)解析网页内容

前一篇聊到了简单的请求和获取,这一篇会写关于网页内容的解析。

我们如果是爬取的html,那么内容就会有很多是我们不需要的,我们就需要解析html并抽取到自己需要的内容部分。

对于解析内容,有三种...


Python爬虫(一)基础准则和基本概念

爬虫、网络机器人、spider、crawler,都是一个东西,就是一些程序对目标进行有规律有目的性的自动的信息收集。当然实际上爬虫并不会真正去到目的地,但是会发送请求过去,并拿到回复,回复可能是空,也可能是html、json等。