V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  enenaaa  ›  全部回复第 23 页 / 共 36 页
回复总数  712
1 ... 19  20  21  22  23  24  25  26  27  28 ... 36  
2017-04-24 13:32:06 +08:00
回复了 enenaaa 创建的主题 分享创造 尝试让程序看懂小说,并能按内容检索。
@Jackeriss 是有这个问题, 我也没想到好的办法。也许关系链准确后, 可以通过人物关系消除。
2017-04-24 13:27:33 +08:00
回复了 enenaaa 创建的主题 分享创造 尝试让程序看懂小说,并能按内容检索。
@jyf
@isvara

基于上下文的关系推断,我做得不够深入,思路大体是:
1 、在段内推断主语,宾语。例如:宁江提着宝剑,跑了过来,笑道: xxx 。 这 3 个分句的主语是同一个。
2 、通过关系代词筛选段落。例如:宁小梦挽着哥哥的手臂。这个句子存在推断关系的可能。
3 、在 1 和 2 的基础上,检索附近文本中的主语、宾语和特定语义, 判断出是否存在关系。

可以看到,这个方法有准确性的问题。

另外, 分析的前一步, 是分词和语义格式化。
我首先创建词汇表、句法表、语义表,将句子格式化为已知语义的句法结构。 例如:你好 -> 招呼语义。 妹妹打我->主语是妹妹,谓语是打,宾语是我的指向动作语义。

这个方式当然不能识别所有的句子, 对于一般的小说文本,目前识别率在 5%~10%之间。
2017-04-24 13:01:26 +08:00
回复了 alwayshere 创建的主题 程序员 github 上 tensorflow 一个简单项目,新手有点不太懂
@alwayshere
训练次数看结果什么时候收敛,不同的模型不一样。训练次数、学习率、规范化参数怎么设置,怎么优化就需要了解下理论了。
2017-04-24 12:05:47 +08:00
回复了 alwayshere 创建的主题 程序员 github 上 tensorflow 一个简单项目,新手有点不太懂
1 、 no_of_epochs 是训练次数,在准确率收敛前增加次数能提高准确率。

2 、这个问法有点让我有点愣住。 每次训练,信息都会“保存”在神经网络的参数里, 训练好之后就可以直接测试了。
这个“保存”说得不确切, 大体上网络参数会根据输入图片和预设答案不断调整,参看“反向传播算法”。
2017-04-24 11:18:29 +08:00
回复了 enenaaa 创建的主题 分享创造 尝试让程序看懂小说,并能按内容检索。
@yongzhong
@jyf
人名判断用两种方式:
1 、在分词时通过姓氏分出人名。
2 、在语义分析阶段,通过特定句式判定。例如:张三说道:。。。, 就判断“张三”可能是人名,这种方式能找出非规则的人名,比如择天记里的天海姓氏。
在前面的基础上,再通过词频和特定词筛掉候选人名。

关系提取是一个是通过完整的关系句式判定,例如:张三作为李四的父亲。还有一个是通过上下文做推测, 目前准确率还不高。

校验方式上,我还没做太多工作,主要靠人肉抽检样本。
2017-04-21 16:22:11 +08:00
回复了 chengfu 创建的主题 分享创造 农民房设计服务,「求设计」新站上线,限时优惠
mark , 老家正准备建房子
2017-04-21 09:17:20 +08:00
回复了 bccber 创建的主题 程序员 我这个服务端 有必要使用内存映射文件吗?
可以考虑将数据从 mysql 迁移到 redis 上, 或用 redis 代替 B 。
另外保证服务不挂逼更重要
2017-04-20 17:47:27 +08:00
回复了 clearc 创建的主题 Apple iOS 的 IAP 规范范围究竟是什么,为什么微信的赞赏被包含了
问一下, 浏览器 app 内浏览网页进行支付, 是否也在 IAP 条款内。
@alwayshere 我的意思是, 这不是你的锅。 与其慢慢找别人犯的错, 不如简单粗暴点, 省时间精力。
换 gcc 版本, 换操作系统
2017-04-19 12:56:36 +08:00
回复了 Pimino 创建的主题 奇思妙想 会出现思考自己存在意义的机器人吗?
人是什么呢, 人除了机械思维,还有很多非理性的东西,情绪,欲望,价值观。人类连自己都还弄不清楚, 更逞论复制人了。
@onlyice python 3 应该是 b 前缀, b'\u60a8'.decode('unicode_escape')
这个才是比较好的解决办法
阿里云有免费证书? 在哪申请啊
2017-04-12 15:43:41 +08:00
回复了 phrack 创建的主题 程序员 为什么 Java 和 js 这么机车呢?
回调哪个脚本语言没有, js 槽点不是 var , this, undefined 和 类实现吗。每次都想吐
2017-04-11 11:51:34 +08:00
回复了 enenaaa 创建的主题 Android android studio 怎么看含有 webview 进程的内存?
@codehz 谢谢,我看到这个沙盒服务了。 不过 as 没显示出来。 我找找看什么情况
2017-04-10 09:44:01 +08:00
回复了 wowo243 创建的主题 小米 没人关注小米平板 3 吗?
没货怎么讨论
手机上 qq 浏览器经常登录不了微博, 有时是提示 cookie 或者页面异常什么的。
我就觉得微博的前端真的是非常不专业。
2017-04-01 10:36:23 +08:00
回复了 Kharazim 创建的主题 职场话题 分享斗鱼 hr 面经
我一哥们在斗鱼干不到 2 个月就自觉滚蛋了, 现在终于明白原因!
2017-03-29 09:31:31 +08:00
回复了 realpg 创建的主题 程序员 百度貌似又开发了赚钱的新买卖啊
@lanxyou +1 , 我觉得运营商的嫌疑更大
2017-03-28 12:56:38 +08:00
回复了 AlwaysBee 创建的主题 程序员 小程序对个人开发者开放了!!!
@xxdd 你应该说腾讯的文档都是一坨, 错误、陈旧、混乱遍地都是。
1 ... 19  20  21  22  23  24  25  26  27  28 ... 36  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1088 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 23:30 · PVG 07:30 · LAX 15:30 · JFK 18:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.