首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
V2EX
›
程序员
问答系统,使用元数据,还是抓网页数据的问题
genffy
·
genffy
·
2024-01-12 13:59:11 +08:00
· 941 次点击
这是一个创建于 439 天前的主题,其中的信息可能已经有所发展或是发生改变。
想在公司内部实验下问答系统,也就是目前市面上常见的 llm + rag 但是在如何处理现有数据有点纠结
是去爬网页上的数据呢,还是直接导元数据,主要是
confluence
gitlab
jira
这三种源。
#rag #llm #问答系统#
问答
rag
llm
数据
3 条回复
1
genffy
OP
2024-01-12 14:17:38 +08:00
jira ,confluence 我倾向爬页面上关系性强一点,gitlab 有点拿不准,我们 gitlab 只是个代码存储,除了 pr ,没有 cr, issue 这些资产在上面。
2
lixile
2024-01-12 14:28:53 +08:00
mark 一下 问答系统 有对应参考开源框架吗
3
genffy
OP
2024-01-12 16:21:59 +08:00
@
lixile
直接抄
https://github.com/datafuselabs/askbend
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
5780 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 25ms ·
UTC 02:15
·
PVG 10:15
·
LAX 19:15
·
JFK 22:15
Developed with
CodeLauncher
♥ Do have faith in what you're doing.