Skip to content

hantang/ime-utils

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

IME-Utils

GitHub stars GitHub release GitHub repo size GitHub license

中文输入法词库文件(细胞词库)解析工具。

Chinese IME ciku (aka cell wordlist file) parsing tool.

支持:

  • 搜狗拼音(.scel
  • 百度拼音(.bdict)、百度输入法手机版(.bcd
  • QQ 拼音(.qcel)、QQ 拼音旧版(6.0 以下词库,.qpyd
  • 华宇拼音(紫光输入法)(.uwl

使用

  • 程序调用:
# 安装
# pip install ime-utils
# uv pip install . # 本地

# 用例:
from ime_utils.parser import SogouParser, BaiduParser

parser = BaiduParser()
files = [
    "医学词汇.bdict",
    "电影明星.bdict",
    "体操基本术语.bdict",
]

for file in files[:]:
    save_file = f"out-{file}.txt"
    if parser.parse(file):
        parser.save_data(save_file, keep_error=False)
  • 命令行调用
# 或者 python -m ime_utils -f file-names -o output

# 指定多个文件
ime-utils -f file-name1,file-name2 -o output
# 指定目录,-e保留解析异常词语, -r 目录递归检索文件
ime-utils -d file-dir -o text -e -r

相关

About

中文输入法词库文件(细胞词库)解析工具

Topics

Resources

License

Stars

Watchers

Forks

Languages