python加载自定义词典实例

yipeiwu_com6年前Python基础

如下所示:

#加载词典
def load_dict_from_file(filepath):
  _dict = {}
  try:
    with io.open(filepath, 'r',encoding='utf-8') as dict_file:
      for line in dict_file:
        (key, value) = line.strip().split(' ') #将原本用空格分开的键和值用冒号分开来,存放在字典中
        _dict[key] = value
  except IOError as ioerr:
    print("文件 %s 不存在" % (filepath))
  return _dict
#加载停用词词典
def stopwordslist(filepath):
  stopwords = {}
  fstop = io.open(filepath, 'r',encoding='utf-8')
  for line in fstop:
    stopwords[line.strip()]=line.strip()
  fstop.close()
  return stopwords

以上这篇python加载自定义词典实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

详细介绍Ruby中的正则表达式

详细介绍Ruby中的正则表达式

正则表达式是一种特殊序列的字符,它通过使用有专门语法的模式来匹配或查找其他字符串或字符串集合。 语法 正则表达式从字面上看是一种介于斜杠之间或介于跟在 %r 后的任意分隔符之间的模式,如...

python自动分箱,计算woe,iv的实例代码

python自动分箱,计算woe,iv的实例代码

笔者之前用R开发评分卡时,需要进行分箱计算woe及iv值,采用的R包是smbinning,它可以自动进行分箱。近期换用python开发, 也想实现自动分箱功能,找到了一个woe包,地址h...

python机器学习库xgboost的使用

python机器学习库xgboost的使用

1.数据读取 利用原生xgboost库读取libsvm数据 import xgboost as xgb data = xgb.DMatrix(libsvm文件) 使用sk...

opencv-python 提取sift特征并匹配的实例

我就废话不多说,直接上代码吧! # -*- coding: utf-8 -*- import cv2 import numpy as np from find_obj import...

Python3简单实现串口通信的方法

如下所示: import serial import sys import os import time import re def wait_for_cmd_OK(): &nb...