Python 爬虫之超链接 url中含有中文出错及解决办法

yipeiwu_com6年前 (2020-03-06)Python爬虫

Python 爬虫之超链接 url中含有中文出错及解决办法

python3.5 爬虫错误：

UnicodeEncodeError: 'ascii' codec can't encode characters

这个错误是由于超链接中含有中文引起的，超链接默认是用ascii编码的，所以不能直接出现中文，若要出现中文，

解决方法如下：

import urllib 
from urllib.request import urlopen

link="http://list.jd.com/list.html?cat=9987,653,655&ev=exbrand%5F9420&trans=1&JL=3_品牌_金立（Gionee）"  #含有中文的超链接

# 需要用 urllib.parse.quote 转换
link=urllib.parse.quote(link)

html=urlopen(link).read() #就可以访问了，不会报异常

以上就是 Python 爬虫出现错误解决办法的详解，如有疑问请留言或者到本站的社区交流讨论，感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

使用Python的Scrapy框架十分钟爬取美女图

简介 scrapy 是一个 python 下面功能丰富、使用快捷方便的爬虫框架。用 scrapy 可以快速的开发一个简单的爬虫，官方给出的一个简单例子足以证明其强大：快速开发下面开...

Scrapy基于selenium结合爬取淘宝的实例讲解

在对于淘宝，京东这类网站爬取数据时，通常直接使用发送请求拿回response数据，在解析获取想要的数据时比较难的，因为数据只有在浏览网页的时候才会动态加载，所以要想爬取淘宝京东上的数据，...

Python实现抓取百度搜索结果页的网站标题信息

比如，你想采集标题中包含“58同城”的SERP结果，并过滤包含有“北京”或“厦门”等结果数据。该Python脚本主要是实现以上功能。其中，使用BeautifulSoup来解析HTM...

python爬虫模拟浏览器访问-User-Agent过程解析

这篇文章主要介绍了python爬虫模拟浏览器访问-User-Agent过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下模拟浏览...

Python实现周期性抓取网页内容的方法

本文实例讲述了Python实现周期性抓取网页内容的方法。分享给大家供大家参考，具体如下： 1.使用sched模块可以周期性地执行指定函数 2.在周期性执行指定函数中抓取指定网页，并解析出...

宜配屋

Python 爬虫之超链接 url中含有中文出错及解决办法

相关文章

使用Python的Scrapy框架十分钟爬取美女图

Scrapy基于selenium结合爬取淘宝的实例讲解

Python实现抓取百度搜索结果页的网站标题信息

python爬虫模拟浏览器访问-User-Agent过程解析

Python实现周期性抓取网页内容的方法

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python 爬虫之超链接 url中含有中文出错及解决办法

相关文章

使用Python的Scrapy框架十分钟爬取美女图

Scrapy基于selenium结合爬取淘宝的实例讲解

Python实现抓取百度搜索结果页的网站标题信息

python爬虫模拟浏览器访问-User-Agent过程解析

Python实现周期性抓取网页内容的方法

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号