python爬虫要装什么库【Python教程】,python爬虫

进修Python收集爬虫都须要装置哪些库？

以下是Python爬虫触及的相干库

要求库，剖析库，存储库，东西库

1、要求库：urllib/re/requests

（1） urllib/re是python默许自带的库，能够经由过程以下敕令举行考证：

没有报错信息输出，申明环境一般

（2） requests装置

2.1 翻开CMD，输入 pip3 install requests

2.2 守候装置后，考证

（3） selenium装置（驱动浏览器举行网站接见行动）

3.1 翻开CMD，输入 pip3 install selenium

3.2 装置chromedriver

网址：https://npm.taobao.org/

把下载完成后的压缩包解压，把exe放到D:\Python3.6.0\Scripts\

这个途径只要在PATH变量中就能够

3.3 守候装置完成后，考证

回车后弹出chrome浏览器界面

3.4 装置其他浏览器

无界面浏览器phantomjs

下载网址：http://phantomjs.org/

下载完成后解压，把全部目次放到D:\Python3.6.0\Scripts\，把bin目次的途径添加到PATH变量

考证：

翻开CMD

2. 剖析库：

2.1 lxml (XPATH)

翻开CMD输入pip3 install lxml或许从https://pypi.python.org下载，比方，lxml-4.1.1-cp36-cp36m-win_amd64.whl (md5) ,先下载whl文件，敕令行实行pip3 install 文件名.whl

2.2 beautifulsoup

翻开CMD，须要先装置好lxml

pip3 install beautifulsoup4

2.3 pyquery（相似jquery语法）

翻开CMD，pip3 install pyquery

考证装置效果

3. 存储库

3.1 pymysql（操纵MySQL，关联型数据库）

装置：pip3 install pymysql，装置后测试：

3.2 pymongo（操纵MongoDB，key-value）

装置 pip3 install pymongo

考证

3.3 redis（分布式爬虫，保护爬取行列）装置：pip3 install redis

考证：

4.1Django（分布式爬虫保护体系）pip3 install django

4.2jupyter（运转在网页端的记事本，支撑markdown，能够在网页上运转代码）装置 pip3 install jupyter

考证：翻开CMD，jupyter notebook

以后就能够在网页直接建立记事本，代码块和Markdown块，支撑打印

以上就是python爬虫要装什么库的细致内容，更多请关注ki4网别的相干文章！

正文

python爬虫要装什么库【Python教程】,python爬虫

相关阅读

python数据类型有哪几种？_Python教程,python

python针对Excel表格的操作_Python教程,python,excel

详细分析之Python可变对象和不可变对象_Python教程,Python,可变对象,不可变对象

学习python 抓取知乎指定回答下视频的方法_Python教程,Python,抓取视频