Python3读取UTF-8文件及统计文件行数的方法

yipeiwu_com6年前Python基础

本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下:

''''' 
Created on Dec 21, 2012 
Python 读取UTF-8文件 
统计文件的行数目 
@author: liury_lab 
''' 
# -*- coding: utf-8 -*- 
import codecs 
# 对较小的文件,最简单的方法是将文件读入一个行列表中,
# 然后计算列表的长度即可 
count = len(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8').readlines())
print(count) 
# 对较大的文件,可循环计数 
count = -1 
for count, line in enumerate(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8')):
  pass 
count += 1 
print(count) 
# 对于像windows结束标记有'\n'的,还可以有如下办法: 
count = 0 
the_file = codecs.open('d:/FreakOut.cpp', 'rb', 'utf-8') 
while (True): 
  buffer = the_file.read(8192*1024) 
  if not buffer: 
    break 
  count += buffer.count('\n') 
count += 1 
the_file.close() 
print(count) 

希望本文所述对大家的Python程序设计有所帮助。

相关文章

基于Django统计博客文章阅读量

如何精确地记录一篇文章的阅读量是一个比较复杂的问题,不过对于我们的博客来说,没有必要记录的那么精确。因此我们使用一种简单但有效的方式来记录博客文章的阅读量:文章每被浏览一次,则其阅读量...

剖析Python的Tornado框架中session支持的实现代码

tornado 里面没有 session?不,当然有~我知道 github 上肯定有人帮我写好了~ O(∩_∩)O~       于是乎...

基于python的ini配置文件操作工具类

本文实例为大家分享了python的ini配置文件操作工具类的具体代码,供大家参考,具体内容如下 #!/usr/bin/env python # -*- coding: utf-8 -...

用十张图详解TensorFlow数据读取机制(附代码)

用十张图详解TensorFlow数据读取机制(附代码)

在学习TensorFlow的过程中,有很多小伙伴反映读取数据这一块很难理解。确实这一块官方的教程比较简略,网上也找不到什么合适的学习材料。今天这篇文章就以图片的形式,用最简单的语言,为大...

python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法

python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法 前言:     &nb...