为公司帮助处理语料时做了 ltext 这个工具。
基本思路是,把文本和标注(用偏移量表达)封装在一个对象中,对外模拟字符串类型的接口做各种文本操作,比如 replace 和 strip 等方法。在这些方法执行时,改动文本同时操作偏移量。
请各位看看这个情景多不多,封装是不是恰当?
或者还需要增加什么功能。目前只实现了 replace、re_replace 两个方法。