python二进制文件的转译详解
首先导入所需的包:import struct
struct有以下几个主要的函数:
# 按照给定的格式(fmt),把数据封装成字符串(实际上是类似于c结构体的字节流) pack(fmt, v1, v2, ...) # 按照给定的格式(fmt)解析字节流string,返回解析出来的tuple unpack(fmt, string) # 计算给定的格式(fmt)占用多少字节的内存 calcsize(fmt)
例如:我需要读取一个名为filename,存放着形状为[100,1025]的浮点数的文件。可以采用以下办法
import numpy as np import struct # 加载测试数据 f = open('filename','rb') # 102500为文档中包含的数字个数,而一个浮点数占4个字节 data_raw = struct.unpack('f'*102500,f.read(4*102500)) f.close() verify_data = np.asarray(verify_data_raw).reshape(-1,1025)
同理如果想转把二进制转成double型:
import numpy as np import struct f = open('data8.dat','rb') d_str = f.read() f.close() d_len = len(d_str) d_len2 = d_len//8 #有时还需考虑字节顺序,如为big-endian,则以上语句改为 data = struct.unpack('>'+str(d_len/4)+'f',d_str) data = struct.unpack(d_len2*'d',d_str)
注意:fmt前的数字必须为int型,即int*'d' 否则会报‘can't multiply sequence by non-int of type 'float'' 的错误
具体函数细节请查询 struct官方文档
下面提供了了fmt表示方法
FORMAT | PYTHON TYPE | STANDARD SIZE |
x | no value | |
c | string of length 1 | 1 |
b | integer | 1 |
B | integer | 1 |
? | bool | 1 |
h | integer | 2 |
H | integer | 2 |
i | integer | 4 |
I | integer | 4 |
l | integer | 4 |
L | integer | 4 |
q | integer | 8 |
Q | integer | 8 |
f | float | 4 |
d | float | 8 |
s | string | |
p | string | |
P | integer |
为了同c中的结构体交换数据,还要考虑有的c或c++编译器使用了字节对齐,通常是以4个字节为单位的32位系统,故而struct根据本地机器字节顺序转换.可以用格式中的第一个字符来改变对齐方式.定义如下:
CHARACTER | BYTE ORDER | SIZE | ALIGNMENT |
@ | native | native | native |
= | native | standard | none |
< | little-endian | standard | none |
> | big-endian | standard | none |
! | network (= big-endian) | standard | none |
< : Little-Endian就是低位字节排放在内存的低地址端(栈顶),高位字节排放在内存的高地址端(栈底)
>:Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
!: 网络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。