V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
doujiangjiyaozha
V2EX  ›  程序员

开发了一个浏览器插件,一个本地知识库 AI 助手,关于 RAG 的,希望各位大佬帮我指定下,给点建议,产品本身以及推广都可以,谢谢

  •  
  •   doujiangjiyaozha · 9 天前 · 1188 次点击

    具体的介绍都在官网这里 guanzhangai.cn

    23 条回复    2024-12-23 09:38:37 +08:00
    RotkPPP
        1
    RotkPPP  
       9 天前
    网站打不开
    ospider
        2
    ospider  
       9 天前   ❤️ 1
    搞笑呢,cn 域名和 AI 是互斥的,你有牌照吗?就敢大模型
    doujiangjiyaozha
        3
    doujiangjiyaozha  
    OP
       9 天前
    @RotkPPP 再试下老哥,我改了下 DNS,测了下全国网速,应该没问题了
    doujiangjiyaozha
        4
    doujiangjiyaozha  
    OP
       9 天前
    @ospider em, cn 域名和 AI 是互斥的, 这话我有点不太理解, 麻烦老哥帮忙解释下; 至于牌照与大模型,我也不太理解,我全程都用的第三方的开源 LLM 模型或者 api 调用,跟牌照有什么关系吗?
    hefish
        5
    hefish  
       9 天前
    我也想做个类似的东西,不知道如何下手,op 大佬能指点一二吗?比如需要哪些基础知识,基于哪个开源模型来搞之类的。。。
    doujiangjiyaozha
        6
    doujiangjiyaozha  
    OP
       9 天前
    @hefish 我想想哈, 如果是你要做服务端的话, 可以去看下 langchain, 它里面有提供 python 和 nodejs(我已知的)的库,基本上是可以帮你直接从清理文本,到存入向量数据库,到搜索匹配,直接一条龙完成了的,很方便; 如果你要是像我一样做客户端的话, web 端我调研的方案, 基本上就是 transformjs 处理向量,加 indexdb 存储, 复杂的点主要是中间的一些优化, 我当初弄我这玩意时候,内存老是爆;向量模型的话,就是 huggingface 上找找 embeding 的, 目前国外很多人用的是 nomic-embed-text-v1,不过我测了中文效果不咋地,我就换成了 jina-embeddings-v2-base-zh,目前测试还不错,后面有时间我应该会更新一些我碰到的坑写到我那个博客里(官网里有挂,才刚弄), 希望能帮到你
    smallparking
        7
    smallparking  
       9 天前 via Android
    @xiaoyuan9816 https://www.cac.gov.cn/2024-04/02/c_1713729983803145.htm
    有备案吗? 还用国外 api ?符合 "坚持社会主义核心价值观" 吗?
    https://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm
    doujiangjiyaozha
        8
    doujiangjiyaozha  
    OP
       9 天前
    @smallparking 我去 我还真不知道这玩意 感谢老哥提醒;我找时间研究下,不过 api 我只用我们国内的,支持我们国产模型 qianwen 之类的 hh
    RotkPPP
        9
    RotkPPP  
       9 天前
    这个功能有点不太明白哈,意思就是,用户将需要收藏的网站提交给你开发的插件,然后服务端会通过爬虫的方式将内容爬下来,输入到 llm 中,类似于一个 rag 的过程,然后就可以通过对话的形式来获取内容
    kneo
        10
    kneo  
       9 天前
    你这是违法的,赶紧关了。
    ospider
        11
    ospider  
       9 天前
    @doujiangjiyaozha #4 有别的老哥已经说过了,我就不再赘述了。反正不建议在国内搞这些,即使政策允许,国内的付费意愿也太弱,没有任何意义,直接出海是唯一的选择。
    amlee
        12
    amlee  
       9 天前
    没必要前怕虎后怕狼,做不做的起来还不一定

    先上车后补票例子多了去了

    不过还是建议从国外市场做,国内付费意愿太低,而且乱七八糟浏览器多,你这又是插件。
    国外基本上 chrome ,firfox ,safari 支持了就够了
    gaobh
        13
    gaobh  
       9 天前 via iPhone
    cn 域名做好进去的准备
    hefish
        14
    hefish  
       9 天前
    @doujiangjiyaozha 谢谢大佬!
    doujiangjiyaozha
        15
    doujiangjiyaozha  
    OP
       8 天前
    @RotkPPP 是的,总体就是你自己的所有资料会被向量化,然后根据你的问题进行匹配相关文档,再丢给 ai 回答;其实没有服务端,都是纯客户端,除了最后一步 llm 模型是怎么选的
    doujiangjiyaozha
        16
    doujiangjiyaozha  
    OP
       8 天前
    @ospider 好的 感谢
    doujiangjiyaozha
        17
    doujiangjiyaozha  
    OP
       8 天前
    @kneo 头疼....
    doujiangjiyaozha
        18
    doujiangjiyaozha  
    OP
       8 天前
    @amlee 嗯嗯 感谢指点
    doujiangjiyaozha
        19
    doujiangjiyaozha  
    OP
       8 天前
    @gaobh .....这么恐怖
    Jacobson
        20
    Jacobson  
       8 天前
    有没有火狐的?
    doujiangjiyaozha
        21
    doujiangjiyaozha  
    OP
       8 天前
    @Jacobson 火狐目前还不行,还没去适配
    lucasdev
        22
    lucasdev  
       7 天前
    好像 ICP 备案和公安备案也没搞?

    可以先弄个英语语义的域名,网站增加英文支持,先做出海
    doujiangjiyaozha
        23
    doujiangjiyaozha  
    OP
       7 天前
    @lucasdev 是呀 本来主要是想快速上线 看市场反馈 公司啥的我都有注册好的 备案啥就好麻烦 懒得弄 这两天也收到反馈 基本都是建议我先做出海 可能浏览器插件这玩意的属性 本来就适合出海吧
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2137 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 16:12 · PVG 00:12 · LAX 08:12 · JFK 11:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.