python用字典统计单词或汉字词个数示例

yipeiwu_com5年前Python基础

有如下格式的文本文件

复制代码 代码如下:

/“/请/!/”/“/请/!/”/两名/剑士/各自/倒转/剑尖/,/右手/握/剑柄/,
/左手/搭于/右手/手背/,/躬身行礼/。/两/人/身子/尚未/站/直/,
/突然/间/白光闪/动/,/跟着/铮的/一/声响/,
/双剑相/交/,/两/人/各/退一步/。
/旁/观众/人/都/是/“/咦/”/的/一声/轻呼/。/青衣/剑士/连/劈/三/剑/

将这段话进行词频统计,结果是  词—词数  的形式,比如  请  2  ,并把结果放到txt文件中。

这样的问题利用词或单词作为字典的key,循环判断有不有这个key,没有新增一个,有的话,将这个key对应的value加1

复制代码 代码如下:

#coding:utf-8
word_lst = []
word_dict = {}

with open("中文.txt","r") as f1 ,open("词次数.txt",'w') as f2:
   for line in f1:
       word_lst.append(line.split('/'))

   for item in word_lst:
       for item2 in item:
           if item2.strip() not in ",!。“”" :
               if   item2 not in word_dict:
                   word_dict[item2] = 1
               else :
                   word_dict[item2] += 1

   for key in word_dict:
       print key,word_dict[key]
       f2.write(key+' '+str(word_dict[key]))

相关文章

Django的models模型的具体使用

model的常用字段 V=models.CharField(max_length=None[, **options])    #varchar V=models.EmailFiel...

Python编写一个优美的下载器

Python编写一个优美的下载器

本文实例为大家分享了Python编写下载器的具体代码,供大家参考,具体内容如下 #!/bin/python3 # author: lidawei # create: 2016-...

使用python将时间转换为指定的格式方法

时间处理是在进行数据挖掘时很重要的一个方面,在参加比赛的时候很多比赛训练集给的时间和你最终要提交的时间格式是不同的。 我把我遇到的一种情况总结如下: 首先,题目给的格式是2016-09-...

Python Sql数据库增删改查操作简单封装

本文实例为大家分享了如何利用Python对数据库的增删改查进行简单的封装,供大家参考,具体内容如下 1.insert     import...

Python挑选文件夹里宽大于300图片的方法

本文实例讲述了Python挑选文件夹里宽大于300图片的方法。分享给大家供大家参考。具体分析如下: 这段代码需要用到PIL库。代码如下所示: import sys import os...