python3第三方爬虫库BeautifulSoup4安装教程

yipeiwu_com6年前Python爬虫

Python3安装第三方爬虫库BeautifulSoup4,供大家参考,具体内容如下

在做Python3爬虫练习时,从网上找到了一段代码如下:

#使用第三方库BeautifulSoup,用于从html或xml中提取数据
from bs4 import BeautifulSoup

自己实践后,发现出现了错误,如下所示:

  

以上错误提示是说没有发现名为“bs4”的模块。即“bs4”模块未安装。   

进入Python安装目录,以作者IDE为例,

 

  

控制台提示第三方库BeautifulSoup4安装成功!回到之前的程序中,会发现IntelJ已经检测到第三方库BS4的安装,已自更新项目,此时项目恢复正常,无错误提示。

常见问题

在做BS4爬虫练习时,新建的文件名为bs4.py,结果出现如下错误提示:

  

即ImportError: cannot import name BeautifulSoup一般有一下几种情况:   

1. 在python2.x下安装的BeautifulSoup在python3.x下运行会报这种错,可用pip3 install Beautifulsoup4 .   

2. 导入时指定bs4 像这样: from bs4 import BeautifulSoup.   

3. 太巧合,如果你测试的文件名正好命名为bs4.py,那怎么整都会报这个错,把名字改成其他的吧。

附:BS4官方文档

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python利用lxml模块爬取豆瓣读书排行榜的方法与分析

Python利用lxml模块爬取豆瓣读书排行榜的方法与分析

前言 上次使用了BeautifulSoup库爬取电影排行榜,爬取相对来说有点麻烦,爬取的速度也较慢。本次使用的lxml库,我个人是最喜欢的,爬取的语法很简单,爬取速度也快。 本次爬取的豆...

Python 多线程抓取图片效率对比

目的: 是学习python 多线程的工作原理,及通过抓取400张图片这种IO密集型应用来查看多线程效率对比 import requests import urlparse imp...

python中数据爬虫requests库使用方法详解

python中数据爬虫requests库使用方法详解

一、什么是Requests Requests 是Python语编写,基于urllib,采Apache2 Licensed开源协议的 HTTP 库。它urllib 更加方便,可以节约我们大...

python爬虫模拟浏览器的两种方法实例分析

python爬虫模拟浏览器的两种方法实例分析

本文实例讲述了python爬虫模拟浏览器的两种方法。分享给大家供大家参考,具体如下: 爬虫爬取网站出现403,因为站点做了防爬虫的设置 一、Herders 属性 爬取CSDN博客 i...

python抓取网页中图片并保存到本地

在上篇文章给大家分享PHP源码批量抓取远程网页图片并保存到本地的实现方法,感兴趣的朋友可以点击了解详情。 #-*-coding:utf-8-*- import os import...