具体的介绍都在官网这里 guanzhangai.cn
1
RotkPPP 9 天前
网站打不开
|
2
ospider 9 天前 1
搞笑呢,cn 域名和 AI 是互斥的,你有牌照吗?就敢大模型
|
3
doujiangjiyaozha OP @RotkPPP 再试下老哥,我改了下 DNS,测了下全国网速,应该没问题了
|
4
doujiangjiyaozha OP @ospider em, cn 域名和 AI 是互斥的, 这话我有点不太理解, 麻烦老哥帮忙解释下; 至于牌照与大模型,我也不太理解,我全程都用的第三方的开源 LLM 模型或者 api 调用,跟牌照有什么关系吗?
|
5
hefish 9 天前
我也想做个类似的东西,不知道如何下手,op 大佬能指点一二吗?比如需要哪些基础知识,基于哪个开源模型来搞之类的。。。
|
6
doujiangjiyaozha OP @hefish 我想想哈, 如果是你要做服务端的话, 可以去看下 langchain, 它里面有提供 python 和 nodejs(我已知的)的库,基本上是可以帮你直接从清理文本,到存入向量数据库,到搜索匹配,直接一条龙完成了的,很方便; 如果你要是像我一样做客户端的话, web 端我调研的方案, 基本上就是 transformjs 处理向量,加 indexdb 存储, 复杂的点主要是中间的一些优化, 我当初弄我这玩意时候,内存老是爆;向量模型的话,就是 huggingface 上找找 embeding 的, 目前国外很多人用的是 nomic-embed-text-v1,不过我测了中文效果不咋地,我就换成了 jina-embeddings-v2-base-zh,目前测试还不错,后面有时间我应该会更新一些我碰到的坑写到我那个博客里(官网里有挂,才刚弄), 希望能帮到你
|
7
smallparking 9 天前 via Android
@xiaoyuan9816 https://www.cac.gov.cn/2024-04/02/c_1713729983803145.htm
有备案吗? 还用国外 api ?符合 "坚持社会主义核心价值观" 吗? https://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm |
8
doujiangjiyaozha OP @smallparking 我去 我还真不知道这玩意 感谢老哥提醒;我找时间研究下,不过 api 我只用我们国内的,支持我们国产模型 qianwen 之类的 hh
|
9
RotkPPP 9 天前
这个功能有点不太明白哈,意思就是,用户将需要收藏的网站提交给你开发的插件,然后服务端会通过爬虫的方式将内容爬下来,输入到 llm 中,类似于一个 rag 的过程,然后就可以通过对话的形式来获取内容
|
10
kneo 9 天前
你这是违法的,赶紧关了。
|
11
ospider 9 天前
@doujiangjiyaozha #4 有别的老哥已经说过了,我就不再赘述了。反正不建议在国内搞这些,即使政策允许,国内的付费意愿也太弱,没有任何意义,直接出海是唯一的选择。
|
12
amlee 9 天前
没必要前怕虎后怕狼,做不做的起来还不一定
先上车后补票例子多了去了 不过还是建议从国外市场做,国内付费意愿太低,而且乱七八糟浏览器多,你这又是插件。 国外基本上 chrome ,firfox ,safari 支持了就够了 |
13
gaobh 9 天前 via iPhone
cn 域名做好进去的准备
|
14
hefish 9 天前
@doujiangjiyaozha 谢谢大佬!
|
15
doujiangjiyaozha OP @RotkPPP 是的,总体就是你自己的所有资料会被向量化,然后根据你的问题进行匹配相关文档,再丢给 ai 回答;其实没有服务端,都是纯客户端,除了最后一步 llm 模型是怎么选的
|
16
doujiangjiyaozha OP @ospider 好的 感谢
|
17
doujiangjiyaozha OP @kneo 头疼....
|
18
doujiangjiyaozha OP @amlee 嗯嗯 感谢指点
|
19
doujiangjiyaozha OP @gaobh .....这么恐怖
|
20
Jacobson 8 天前
有没有火狐的?
|
21
doujiangjiyaozha OP @Jacobson 火狐目前还不行,还没去适配
|
22
lucasdev 7 天前
|
23
doujiangjiyaozha OP @lucasdev 是呀 本来主要是想快速上线 看市场反馈 公司啥的我都有注册好的 备案啥就好麻烦 懒得弄 这两天也收到反馈 基本都是建议我先做出海 可能浏览器插件这玩意的属性 本来就适合出海吧
|