杀鸡用了牛刀😂,为了达到拼音长句输入的准确性,不依靠网络和大数据确实是一个复杂的问题。一开始我考虑过用词频和字典结合算法,但当句子变长以后就很难了。最后想想干脆用深度学习来解决这个问题。从头开始使用 huggingface 上能找到的拼音数据集针对 IME 做了预处理,然后使用 Bi—LSTM attension 模型进行训练再把训练好的模型通过 int8 onnx 转到 Android 手机上来运行,模型效果和运行速度居然还不错。彻底把这个输入法改成了 AI 输入法
今天做了下模型和 onnx runtime 在本地机器上的优化,速度得到了保障
