V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
quu
V2EX  ›  云计算

文本情感分析指数分析接口使用体验,一起完善

  •  
  •   quu · 2018-05-16 11:56:36 +08:00 · 3251 次点击
    这是一个创建于 2385 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前段时间发了我们的 NLP 体验争议很多,对于发现的问题我们逐一做了改善。

    本接口应用场景,建议用于:舆情、情报获取,这种标准的新闻内容筛查方面使用,中文很复杂,换了一个语境就是另外一个事情,所以想要用机器去完全解决中文情感分析,几乎是不可能的,至少短时间都做不到。

    所以无需使用,口语语、网络语、谐音错别字、叠加正负面字来刻意找问题,换其它任何一个做这方面内容的引擎,大家都会处于相同的境遇。

    工具的存在,是为了让我们更快、更高效、更好的去解决问题,而不是完全替代人类,目前这个阶段,就是流程有标准化可以建立机器规则的,让机器来完成(很多人就把这个逻辑叫了人工智能???),人去解决其它非标的问题。

    分享出来,提供给懂得如何用、对这方面有需求的小伙伴,然后大家一起解决问题来完善吧。

    昨天临时让团队小伙伴加班写了个超级单薄的接口平台,把接口放了上来,1000 次 /天 对于自用应该够了,商业使用更大的量的话,我们再详谈。

    测试 demo: http://txtai.com/product/nlp.shtml

    接口申请: http://www.txtai.com/api/api/nlp.shtml

    12 条回复    2018-05-17 09:53:44 +08:00
    enenaaa
        1
    enenaaa  
       2018-05-16 12:45:46 +08:00 via Android
    这类功能拼的是谁语料多吧。楼主语料是多大量级。
    data2world
        2
    data2world  
       2018-05-16 13:44:02 +08:00
    这种完全没需求,除非有价格优势,我刚才测了一下,错误率挺感人的 [虽然是短文本,或是短句子] 。百度 NLP 貌似现在免费? [之前是 10w 次 /天]
    回复不能添加图片?
    data2world
        3
    data2world  
       2018-05-16 13:47:14 +08:00
    开放源码吗? [哭笑]
    capo
        4
    capo  
       2018-05-16 13:48:59 +08:00   ❤️ 1
    “跌是不可能的”为负面,
    百度 QPS 小于 5 免费了
    l00t
        5
    l00t  
       2018-05-16 13:53:45 +08:00
    太弱了,这个分析是基于单独的词吗?貌似不考虑词之间的关系的。
    noNOno
        6
    noNOno  
       2018-05-16 13:56:15 +08:00
    @capo 只能偶尔涨一下,才能维持得了生活,这样子
    guana
        7
    guana  
       2018-05-16 14:00:53 +08:00
    你们 sentiment analysis 的 positive 和 negative 是怎么做的?是基于 lexicon 做的吗?
    guana
        8
    guana  
       2018-05-16 14:02:16 +08:00
    @enenaaa #1 测试了一个我平常的处理的文本,大连理工的 dutir 的库感觉出来的结果比楼主这个好,斯坦福 nlp 的没测试
    asdf123101
        9
    asdf123101  
       2018-05-16 14:08:28 +08:00 via Android
    手机端验证码有点难用,按上去整个页面都在动。css 是不是有点问题?
    data2world
        10
    data2world  
       2018-05-16 14:11:57 +08:00
    @guana 对啊,百度 NLP 情感分析也比楼主的强太多。不知道楼主是用什么做的??传统的 NB 算法+情感词典?还是最近常用的 Attention 机制+神经网络。关键是,楼主的语料肯定没百度大?。另外,这种通用的,还是别重复造轮子了。如果企业要用的话肯定会定制开发的。
    zynlp
        11
    zynlp  
       2018-05-16 16:32:47 +08:00 via iPhone
    楼主最后想走商用?路还很远…
    xjtushilei
        12
    xjtushilei  
       2018-05-17 09:53:44 +08:00
    商用走远了。自己玩玩还可以
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5761 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 06:37 · PVG 14:37 · LAX 22:37 · JFK 01:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.