Python 爬虫之超链接 url中含有中文出错及解决办法

yipeiwu_com6年前 (2020-03-06)Python爬虫

Python 爬虫之超链接 url中含有中文出错及解决办法

python3.5 爬虫错误：

UnicodeEncodeError: 'ascii' codec can't encode characters

这个错误是由于超链接中含有中文引起的，超链接默认是用ascii编码的，所以不能直接出现中文，若要出现中文，

解决方法如下：

import urllib 
from urllib.request import urlopen

link="http://list.jd.com/list.html?cat=9987,653,655&ev=exbrand%5F9420&trans=1&JL=3_品牌_金立（Gionee）"  #含有中文的超链接

# 需要用 urllib.parse.quote 转换
link=urllib.parse.quote(link)

html=urlopen(link).read() #就可以访问了，不会报异常

以上就是 Python 爬虫出现错误解决办法的详解，如有疑问请留言或者到本站的社区交流讨论，感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

python制作小说爬虫实录

纪念我的第一个爬虫程序，一共写了三个白天，其中有两个上午没有看，中途遇到了各种奇怪的问题，伴随着他们的解决，对于一些基本的操作也弄清楚了。果然，对于这些东西的最号的学习方式，就是在使用中...

python用BeautifulSoup库简单爬虫实例分析

会用到的功能的简单介绍 1、from bs4 import BeautifulSoup #导入库 2、请求头herders headers={'User-Agent': 'Mo...

一则python3的简单爬虫代码

不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。复制代码代码如下:#test rd...

python访问抓取网页常用命令总结

python访问抓取网页常用命令简单的抓取网页: import urllib.request url="http://google.cn/" response=urllib....

Python爬虫常用小技巧之设置代理IP

设置代理IP的原因我们在使用Python爬虫爬取一个网站时，通常会频繁访问该网站。假如一个网站它会检测某一段时间某个IP的访问次数，如果访问次数过多，它会禁止你的访问。所以你可以设置...

宜配屋

Python 爬虫之超链接 url中含有中文出错及解决办法

相关文章

python制作小说爬虫实录

python用BeautifulSoup库简单爬虫实例分析

一则python3的简单爬虫代码

python访问抓取网页常用命令总结

Python爬虫常用小技巧之设置代理IP

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

Python 爬虫之超链接 url中含有中文出错及解决办法

相关文章

python制作小说爬虫实录

python用BeautifulSoup库简单爬虫实例分析

一则python3的简单爬虫代码

python访问抓取网页常用命令总结

Python爬虫常用小技巧之设置代理IP

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号