Skip to content

Python爬虫手册

一、安装Python3

  1. Python官网:https://www.python.org/

  2. 前往下载页面:

    (1)Pyhthon-for-Windows下载页面:https://www.python.org/downloads/windows/

    注意:笔者在Windows的浏览器中,直接点解官网首页的下载按钮下载的是Python3.5的32位版本(笔者的使用的系统是64位的),所以为了和电脑配置相同,建议前往Windows的下载页面,以便选择合适的下载版本。

    (2)Python-for-Mac下载页面:https://www.python.org/downloads/mac-osx/

  3. 安装Python3

    注意:在使用可执行文件安装的时候勾选“Add Python to PATH”选项,如果没有选择,需要手动配置Python的安装目录到环境变量中。

二、安装Beautifulsoup4

  1. Beautifulsoup下载页面:https://pypi.python.org/pypi/beautifulsoup4

  2. 选择下载压缩包:beautifulsoup4-4.4.1.tar.gz

  3. 使用解压缩软件解压下载的beautifulsoup4.4.1到Python安装目录的根目录下。

  4. 进入解压的beautifulsoup4.4.1目录,按住“Shift”键,在目录中右击,选择“在此处打开命令窗口”,进入命令行。

  5. 在命令行执行

    shell
    python setup.py install

三、查看官方Beautifulsoup4.4使用文档(一定要是最新版的英文版)

  1. 官方文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/

    建议:直接查看原本英文文档,官方文档是最新的使用介绍,翻译过来的中文文档很难做到及时更新,另外,慢慢训练阅读英文文献的能力也是一项必要的技能。不过,如果有某些地方看不懂,可以再去看中文文档。

  2. Beautifulsoup的不同版本之间会有一些小的语法和使用方式的改变,尽量保持一致,以减少不必要的麻烦。

四、按照文档逐步学习

最好的参考资料就是官方文档!

上次更新于: