python抓取网页内容示例分享

yipeiwu_com6年前 (2020-03-06)Python爬虫

import socket
def open_tcp_socket(remotehost,servicename):
    s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
    portnumber=socket.getservbyname(servicename,'tcp')
    s.connect((remotehost,portnumber))
    return s
mysocket=open_tcp_socket('www.taobao.com','http')
mysocket.send('hello')
while(1):
    data=mysocket.recv(1024)
    if(data):
        print data.decode('gbk').encode('utf-8')#对于gbk编码网页必须这样转化一下
    else:
        break
mysocket.close()

返回列表

上一篇：Python字符转换

下一篇：PHP生成静态页面详解

Phantomjs抓取渲染JS后的网页（Python代码）

最近需要爬取某网站，无奈页面都是JS渲染后生成的，普通的爬虫框架搞不定，于是想到用Phantomjs搭一个代理。 Python调用Phantomjs貌似没有现成的第三方库（如果有，请告知...

Python爬取个人微信朋友信息操作示例

本文实例讲述了Python爬取个人微信朋友信息操作。分享给大家供大家参考，具体如下：利用Python的itchat包爬取个人微信号的朋友信息，并将信息保存在本地文本中思路要点： 1....

python3第三方爬虫库BeautifulSoup4安装教程

Python3安装第三方爬虫库BeautifulSoup4，供大家参考，具体内容如下在做Python3爬虫练习时，从网上找到了一段代码如下： #使用第三方库BeautifulSou...

基于python实现的抓取腾讯视频所有电影的爬虫

我搜集了国内10几个电影网站的数据，里面近几十W条记录，用文本没法存，mongodb学习成本非常低，安装、下载、运行起来不会花你5分钟时间。 # -*- coding: utf-8...

Python实现的爬取百度贴吧图片功能完整示例

本文实例讲述了Python实现的爬取百度贴吧图片功能。分享给大家供大家参考，具体如下： #coding:utf-8 import requests import urllib2 im...

宜配屋

python抓取网页内容示例分享

相关文章

Phantomjs抓取渲染JS后的网页（Python代码）

Python爬取个人微信朋友信息操作示例

python3第三方爬虫库BeautifulSoup4安装教程

基于python实现的抓取腾讯视频所有电影的爬虫

Python实现的爬取百度贴吧图片功能完整示例

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python抓取网页内容示例分享

相关文章

Phantomjs抓取渲染JS后的网页（Python代码）

Python爬取个人微信朋友信息操作示例

python3第三方爬虫库BeautifulSoup4安装教程

基于python实现的抓取腾讯视频所有电影的爬虫

Python实现的爬取百度贴吧图片功能完整示例

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号