半年多前主包开始构建 rime_clinic 医学输入法词库项目,将能找到词库全部改成 rime 格式以后,发现一个大问题:
中医常用的术语并没有人做!
于是主包又开始开发rimetool 工具包,方便医学生将任意中医图书转换成输入法词库(当然,你也可以用于转换其他内容,不止是中医图书)
rimetool 支持 pip 安装,可以将任意长的书籍、论文、文章、句子等转换成 rime 可以使用的词库
你可以直接使用命令行操作,比如
rimetool --t txt -i something.txt
就可以得到四个词库,任选你需要的版本使用即可
另外也可以部署 web gui ,方便不习惯命令行的用户使用
rimetool web
目前 web gui 已经部署,你可以试试看 https://rimetool.beginner.center/
更详细的 文字/视频版 使用教程 https://forum.beginner.center/t/topic/2160
通过这个项目结识了很多朋友,得到了很多鼓励,学到了很多新知识,接下来会继续完善相关功能,敬请期待
也欢迎各位大佬 pr 、催更
![]() |
1
zpvip 1 天前 ![]() 别助力中医了, 让它慢慢地和辫子, 裹脚布一起消失吧.
|
![]() |
2
omph 1 天前 ![]() 多谢分享,用的 jieba 分词啊,确实专业词汇还得自己动手
请忽略某些不礼貌的楼层,平和平静平等 |
![]() |
3
whitewatercn OP @omph 目前的思路:
先用 jieba 分词,之后使用 nlp 分,再往后会基于用户提交的数据结合 jieba 和 nlp 分词(大家打字的时候怎么分词,就怎么构建分词库) |
![]() |
4
whitewatercn OP @omph 感谢支持😘
|