一月 11, 2020

11. 数据提取-PyQuery

1. pyquery1.1 介绍 如果你对CSS选择器与Jquery有有所了解,那么还有个解析库可以适合你–Jqu...

一月 11, 2020

11. 数据提取-PyQuery

1. pyquery1.1 介绍 如果你对CSS选择器与Jquery有有所了解,那么还有个解析库可以适合你–Jquery 官网https://pyth...

一月 10, 2020

10. 数据提取-JsonPath

1. JSON与JsonPATHJSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和...

一月 09, 2020

09. 数据提取-XPath

1. 介绍 之前 BeautifulSoup 的用法,这个已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,...

一月 08, 2020

08. 数据提取-Beautiful Soup

1. Beautiful Soup的简介 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工...

一月 07, 2020

07. 数据提取-正则表达式

1. 提取数据在前面我们已经搞定了怎样获取页面的内容,不过还差一步,这么多杂乱的代码夹杂文字我们怎样把它提取出来整理呢?下面就开始介绍一个十分强大的工具,...

一月 06, 2020

06. Requests库的用法

1. 介绍 对了解一些爬虫的基本理念,掌握爬虫爬取的流程有所帮助。入门之后,我们就需要学习一些更加高级的内容和工具来方便我们的爬取。那么这一节来简单介绍一...

一月 05, 2020

05. URLError与Cookie

1. Cookie为什么要使用Cookie呢? Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密...

一月 04, 2020

04. urllib库的高级用法

1. 伪装自己有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作 1.1 设置请求头其中U...

一月 03, 2020

03. 爬取数据-urllib库

1. 小试牛刀怎样扒网页呢? 其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它...

一月 02, 2020

02. 工具的使用

1. 常用的工具 python pycharm 浏览器 chrome 火狐 fiddler 2 fiddler的使用2.1 操作界面 2.2 界面含...

加载更多