用pandas按列合并两个文件的实例

yipeiwu_com5年前Python基础

直接上图,图文并茂,相信你很快就知道要干什么。

A文件:

B文件:

可以发现,A文件中“汉字井号”这一列和B文件中“WELL”这一列的属性相同,以这一列为主键,把B文件中“TIME”这一列数据添加到A文件中,如果B文件缺少某些行,则空着,最后A文件的行数不变,效果如下:

代码如下:

# -*- coding: utf-8 -*-
"""
Created on Wed Nov 29 16:02:05 2017
@author: wq
"""
import pandas as pd
df1 = pd.read_csv(u'input.csv', encoding='gbk')
df2 = pd.read_csv('input1.csv', encoding='gbk')
outfile = pd.merge(df1, df2, how='left', left_on=u'汉字井号',right_on='WELL')
outfile.to_csv('outfile.csv', index=False, encoding='gbk')

以上这篇用pandas按列合并两个文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python中异常重试的解决方案详解

前言 大家在做数据抓取的时候,经常遇到由于网络问题导致的程序保存,先前只是记录了错误内容,并对错误内容进行后期处理。 原先的流程: def crawl_page(url): pa...

Python使用稀疏矩阵节省内存实例

推荐系统中经常需要处理类似user_id, item_id, rating这样的数据,其实就是数学里面的稀疏矩阵,scipy中提供了sparse模块来解决这个问题,但scipy.spar...

Python break语句详解

Python break语句详解

Python break语句,就像在C语言中,打破了最小封闭for或while循环。break语句用来终止循环语句,即循环条件没有False条件或者序列还没被完全递归完,也会停止执行循环...

在Python中关于中文编码问题的处理建议

字符串是Python中最常用的数据类型,而且很多时候你会用到一些不属于标准ASCII字符集的字符,这时候代码就很可能抛出UnicodeDecodeError: 'ascii' codec...

Python中GeoJson和bokeh-1的使用讲解

Python中GeoJson和bokeh-1的使用讲解

GeoJson 文档 { "type": "FeatureCollection", "features": [ { "geometry": { "type":...