V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
youmumzv2
V2EX  ›  分享创造

我开发的 AI 数据标注工具发布新版了,永久免费

  •  
  •   youmumzv2 · 2018-02-07 17:35:46 +08:00 · 9703 次点击
    这是一个创建于 2460 天前的主题,其中的信息可能已经有所发展或是发生改变。

    特别感谢大家的支持,上次在社区首发了自己开发的数据标注工具-精灵标注,得到了很多朋友的支持,灰常激动。为了不辜负大家的厚望,这几天一直在更新这个工具,终于今天更新了一个大版本 1.0.1:

    传送门精灵标注助手

    目前还挂在公司的二级域名下面的,不过已经注册了新的域名:

    www.collabeler.com -> collaboration + labeler 不过还没备案~

    版本 1.0.1 加入的功能

    • 调整的曲线标注的控制点的大小,之前太大的,影响操作
    • 曲线的时候加入的 ctrl+z 的撤销功能
    • 加了文本分类
    • 加了文本实体名称标注
    • 完成了整个多语言的处理,现在英文版上系统会彻底显示英文版
    • 修复了之前一些 bug

    后续打算继续添加的功能

    • 图像像素级标注
    • 音频标注(比如 trigger word 标注)
    • transcript 标注
    • 写插件的接入文档(最怕写文档~)

    最近听完了吴恩达大神的 RNN,总算对 NLP 有些了解了,所以这个版本加了一些 NLP 的标注,将来也打算导出的时候 直接集成一个 word embeding 的转换。

    Mac 版还是 1.0.0 的,刚刚注册的苹果开发者账号,所以后续的 Mac 新版会直接发 MacStore 了。

    建了一个 qq 群,有兴趣的可以进来交流:688942305

    32 条回复    2021-12-04 23:22:07 +08:00
    againstodds
        1
    againstodds  
       2018-02-07 17:59:26 +08:00
    下载了,一会用一下,感觉很棒
    hanbing135
        2
    hanbing135  
       2018-02-07 18:00:40 +08:00 via Android
    赞楼主
    neosfung
        3
    neosfung  
       2018-02-07 18:21:48 +08:00
    想试一下,发现 mac 版还不支持语料标注
    youmumzv2
        4
    youmumzv2  
    OP
       2018-02-07 18:33:04 +08:00
    @neosfung 嗯 手边没有 mac 没法打包,晚上回去打包新的 mac 版,后续版本都会直接发 MacStore 了
    TimePPT
        5
    TimePPT  
       2018-02-07 18:48:59 +08:00
    厉害,支持下!
    sam12321
        6
    sam12321  
       2018-02-07 20:31:34 +08:00
    期待图像像素级标注功能
    garyhj
        7
    garyhj  
       2018-02-07 20:48:59 +08:00 via Android
    哇,棒
    lj61785636
        8
    lj61785636  
       2018-02-07 22:40:51 +08:00
    厉害了
    yesqu
        9
    yesqu  
       2018-02-08 01:44:16 +08:00
    语料标注的话 跟 brat 比咋样?
    yyn618
        10
    yyn618  
       2018-02-08 04:42:04 +08:00 via Android
    同样等着 mac 版
    northisland
        11
    northisland  
       2018-02-08 08:29:14 +08:00
    厉害
    youmumzv2
        12
    youmumzv2  
    OP
       2018-02-08 08:44:14 +08:00
    @yesqu brat 很棒 nlp 这边基本就在参照 brat,而且导出格式也是完全按照 brat 的导出格式处理的,不过目前精灵标注还支持实体,后续会陆续加上关系,事件和参数的标注
    klxq15
        13
    klxq15  
       2018-02-08 09:27:43 +08:00 via Android
    win 下命名实体识别点导出后什么都没发生。。
    youmumzv2
        14
    youmumzv2  
    OP
       2018-02-08 09:48:10 +08:00
    @klxq15 每个文件标注完 需要点击一下那个大的勾按钮才会保存标注内容,然后才能导出
    yesqu
        15
    yesqu  
       2018-02-08 11:24:01 +08:00
    @youmumzv2 楼主如果能加入一下专业字典能实现一些提示或者预先标注就太棒了,这样子方便标注不同专业领域的数据,我一直想等空下来做一个这个,有空找楼主请教。 楼主牛逼!求能直接导出不同格式的就好了,比如直接 CoNLL 格式
    zjupigeon
        16
    zjupigeon  
       2018-02-08 11:28:36 +08:00
    太棒了
    klxq15
        17
    klxq15  
       2018-02-08 11:35:27 +08:00 via Android
    @youmumzv2 大勾按钮已经点了,然后点导出选 Brat Ann 然后点确定导出,还是什么都没发生。默认导出文件的位置是什么?还是说会弹出窗口让你选择保存文件的位置
    youmumzv2
        18
    youmumzv2  
    OP
       2018-02-08 11:42:45 +08:00
    @klxq15 会弹窗选择导出位置,你的系统是什么系统?保存之后,再次打开标注还在吗?
    youmumzv2
        19
    youmumzv2  
    OP
       2018-02-08 11:45:57 +08:00
    @yesqu 非常感谢建议,这些功能都是后面希望加的,就是希望能够成为一个真正意义上的数据助手,不过因为只有我一个人在开发,所以精力有限,目前主要精力还放在扩充标注类型上,剩下主要是音视频。全类型之后架构差不多就稳定了。会把插件接入文档开出来,让更多人能开发自定义的标注,主框架主要做数据导入导出这些功能。我去研究下 CoNLL
    zjupigeon
        20
    zjupigeon  
       2018-02-08 11:52:03 +08:00
    这个是用 qt 做的还是?
    youmumzv2
        21
    youmumzv2  
    OP
       2018-02-08 12:02:52 +08:00
    @zjupigeon 这个用的是 electron,之前做软件一直用 qt,后来发现 qt 容易遇到那种爬不出来的坑,网上也搜不到,再后来发现 electron 这个框架,js+css 开发起来比较轻松,虽然有些底层接口拿不到,但是整体来说已经很好了
    Dwyanetalk
        22
    Dwyanetalk  
       2018-02-08 12:50:33 +08:00
    期待 linux 版本 + tracking 标注
    klxq15
        23
    klxq15  
       2018-02-08 12:58:29 +08:00 via Android
    @youmumzv2 win10,标注还在
    youmumzv2
        24
    youmumzv2  
    OP
       2018-02-08 13:23:55 +08:00
    @Dwyanetalk linux 版只是 centos 还是 unbuntu 目前这方便打包还在研究中 不知道哪个更受欢迎一些,tracking 标注是指?
    youmumzv2
        25
    youmumzv2  
    OP
       2018-02-08 13:26:23 +08:00
    @klxq15 奇怪了 是不是权限问题,导致文件选择框弹不出来
    Dwyanetalk
        26
    Dwyanetalk  
       2018-02-08 16:20:45 +08:00
    Dwyanetalk
        27
    Dwyanetalk  
       2018-02-08 16:23:28 +08:00
    @youmumzv2
    据观察,在程序员中 centos 和 ubuntu 占比都挺高的
    tracking 标注是指轨迹标注,标出一个目标在视频中的一段连续位置,类似于这个: https://dbolkensteyn.github.io/vatic.js/
    youmumzv2
        28
    youmumzv2  
    OP
       2018-02-08 17:56:47 +08:00
    @Dwyanetalk 收到,非常棒的建议
    youmumzv2
        29
    youmumzv2  
    OP
       2018-02-12 13:19:40 +08:00
    @klxq15 问题已经修复了,到官网重新下载下就好了
    youmumzv2
        30
    youmumzv2  
    OP
       2018-02-12 13:20:04 +08:00
    @Dwyanetalk tracking 标注已经加上了
    miki6180
        31
    miki6180  
       2018-02-13 17:24:58 +08:00
    厉害, 开不开源.
    skysuka
        32
    skysuka  
       2021-12-04 23:22:07 +08:00
    搜了一些开源的工具,做了个集合帖子:
    https://www.zhihu.com/question/30626971/answer/2250278878
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2522 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 10:21 · PVG 18:21 · LAX 03:21 · JFK 06:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.