V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  WithoutSugarMiao  ›  全部回复第 3 页 / 共 12 页
回复总数  229
1  2  3  4  5  6  7  8  9  10 ... 12  
3 月 11 日
回复了 PeanutMi 创建的主题 职场话题 年后第一次逛 v2ex,天塌了
今天刚入职新公司第一天就新公司给我的感觉还不错
3 月 9 日
回复了 Haoxueren 创建的主题 职场话题 入职手续办理一半,还是决定跑路了
@duuu 不是国家规定,是行业潜规则。一般来说就算八折,也是前三个月,转正还要看绩效,基本可以认为是想白嫖劳动力了,很难给你转正。估计用完就解约了。楼主走的没毛病。(不过这么重要的事情,入职前没先沟通吗?
@Bssn 不好说 看你要求。你如果想去大厂,我觉得可能得去外包。中小厂 完全靠缘分。把我另一个别人贴子的回复中的那两个课学习一下,实验作业做一下,我觉得找个岗位还是没问题的。
@dawnzhu #31 很正常 因为 AI 的能力太强,如果是小规模应用,完全没有微调的必要,就像 @123zouwen 回复的一样,如果你想在自己的公司使用,那么你懂公司的业务,用通过的 LLM ,用现成的 MCP 、skill ,完全 cover 的住。

但是这个东西的复杂度曲线 就像传统项目一样,你在公司用 你不用考虑 QPS 上来了怎么办,并发度高怎么办,分布式同步怎么办。因为公司就那些人。但是你要想做个企业级项目,比如豆包,比如千问, 那要考虑的东西就多太多了。微调只是最基础的部分。

还有一点就是,可能很多人觉得微调很难,又要理解模型,又得调整参数。实际上现在微调的门槛很低,LLM 发展这几年,早就有傻瓜式微调框架了。甚至一行代码不用写,你都能调出来一个差不多的模型。
@dawnzhu 一定会,我建议你看看 我在帖子里写的项目,阿里云的那个课程或者 hello-agents 。几乎所有的 agent 课程里必然会设计到微调,涉及到大模型的理解。
@yungyu 你说的完全风马牛不相及,你也没点进去我在回复中提到的课程,李宏毅的课 [第八讲:通用模型的终身学习] 你可以先看下。一句话总结,我部署了微调后的小模型进行专门的用户关注点预测,作为一个 function call 来给大模型使用。

我从 1 月份到现在 面试了十多家,拿了三个 offer ,你说的这些框架在面试中完全无人在意,或者说根本不会在意这些框架本身(但是现在大部分的商业级 agent 构建,确实有借鉴最初 langchain 的几大组件)。比如最开始 langchain 最火,你用了,然后 langgraph 又火了,你换不换,autogen 又火了继续换吗?现在 claude / openai 的 SDK 最火 又接着换?那如果后续还有其他框架比这俩 SDK 还火,怎么办呢?

agent 开发的门槛,并不在你说的框架熟练度和前面那个哥们说的 业务适配什么的。给你分享点我常遇到的问题。

你能讲讲 transformer 架构吗? gpt 和 transformer 有啥区别啊?为什么 temperature 会影响输出?
RAG 方面,你怎么做的分块?为什么考虑使用这种分块方式?如何优化召回率?使用 rerank 了吗?能说几个比较有新意的 rerank 方法吗?向量数据库怎么选啊?为啥用 milvus ?稀疏向量和稠密向量啥区别啊? RAG 和微调啥区别啊?你数据集怎么弄的啊?你微调的关键参数都有啥啊?你如何评估微调效果呢? agent 有什么构建模式吗?输出 token 超出了模型限制怎么办呢?

好多好多问题呀,我的感觉是基本围绕着四个方向,基础、RAG 、微调、Agent ,一次正经的面试中,这几个方向是一定一定都会被问到的。
@123zouwen #25 随便给你个场景,上个项目实际中遇到的。甲方是个化工公司,帮他们做老客户激活平台,主线功能就是 从个性化唤醒词到聊天获取销售线索。 遇到一个情况,LLM 分不清楚化工原料到具体产品的映射怎么办? 举个例子 化工原料 乙烯 能生产处 聚乙烯 使用聚乙烯 能做出塑料袋。 怎么让 LLM 理解这些? RAG ? 微调?提示词? 上下文? 模型理解了之后,有没有用 bad case ,有的话要怎么优化?

我在帖子里说的“拦截垃圾邮件 / RAG 项目” ,是 23 年 11 月份 到 24 年 11 月 这段时间的项目,当时的技术栈处于 RAG 刚兴起,agent 还没怎么热,大家都在提示词工程到上下文工程的转变上。其实在前面我应该表达时间段了,可能我没写清楚,我的问题。(我补充一下,虽然是比较早的项目,但是也遇到些比较有意思的问题,但是评论里我就不展开了,因为能写很多内容。)

当然我不是故意怼你的意思。我是觉得你是对 Agent 开发这个行业了解太少了,这也不怪你,毕竟也是 2025 年才刚兴起的。你如果感兴趣,我推荐你 我学习过的几个课程 你可以系统性学习一下。

1. 台湾国立大学李宏毅的 2025 年[最新课程]( https://www.youtube.com/playlist?list=PLJV_el3uVTsMMGi5kbnKP5DrDHZpTX0jT),被誉为中文 AI 圈神课。

2. 看完李宏毅的,可以看斯坦福的[CS336]( https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_),从 0 开始构建语言模型。

3. 辅助的论文阅读,可以关注李沐的这个频道( https://www.youtube.com/playlist?list=PLFXJ6jwg0qW-7UM8iUTj3qKqdhbQULP5I),他的分段精读 transformer ,我看了好多遍。

4. 不喜欢理论只喜欢实践,也可以看看国内写的这个[hello-agents]( https://datawhalechina.github.io/hello-agents/#/)

还有一些比较零碎的资料或者偏实践的,我在之前帖子里有写,就不放了。

总之,agent 开发,我作为从业者的看法是,已经从 2025 年初的探索阶段,过渡到成体系的标准应用了。至于你说的框架,额,怎么说呢?可能你们企业内用的多些,但是商业级的项目一般不会直接用框架。
@linxl 教程可以看我历史帖子。
@123zouwen #16 我目前专职做了两年以上的 agent 开发了。去年末从上家离职,最近刚确定 offer 准备入职。面试的岗位也全是专职 agent 开发。

“Agent 没有什么高深的技术” 你这句话 让我有点绷不住。
我就是 Agent 开发啊。原来做 python 后端,23 年末 RAG 刚火,在原公司做了一年 RAG ,之后入职 AI 公司做 Agent 。去年年末离职,刚准备入职下个工作,也是专职 Agent 开发。具体可以看我帖子 https://v2ex.com/t/1182394
3 月 5 日
回复了 vlhwnb 创建的主题 问与答 你们和 AI 聊天多吗?
楼主的帖子让我震惊了一下,我之前从没有关注过自己和 AI 聊天的频率。刚才去看了一下,我现在每天和 AI 聊天的频率已经远超和任何其他人聊天频率的总和了。 好像什么都在问 AI 。工作、学习、听的歌、看的书、写代码、徒步感受等等

哇 我好像和 AI 深度绑定了。
3 月 4 日
回复了 WithoutSugarMiao 创建的主题 游戏 寻个队友一起体验一下这个游戏
@ZeawinL 好的 我试试
3 月 4 日
回复了 WithoutSugarMiao 创建的主题 游戏 寻个队友一起体验一下这个游戏
可以先去 b 站 或者 抖音 看看玩法。
@ltmst 那感觉你们还在初级阶段,可以成规模的使用 IDE+好点的模型,来探索一下。


@baoziyucha 没理解兄弟说你的这个测试方面怎么使用,是什么意思。是说测试人员怎么使用 AI 来完成吗?


@crackhopper #3 棒!兄弟,我发这个帖子 主要就是想了解一下“项目逻辑和细节复杂、技术需求不常见、对产品质量要求高、维护场景多。这条路上反对者多。”这个具体是什么项目,需要实现什么功能,技术需求是什么,我就想自己试试,如果是我来用 现在的工具 能否 hold 住这种场景。因为我在用 claud4.5 开始,就没怎么再遇到自己没办法用 AI 工具解决,反而自己解决不了的事情。我分不清是我自己菜,所以才觉得工具万能,还是别人其实压根不会使用工具。


@archxm “AI 引入太多” 是用的什么模型,有加让它保持代码整洁之类的提示吗。


@crackhopper #5 真棒。第一点我也发现了,所以我在给 AI 的指南里,会给他标出项目整体架构,具体到某个文件是做什么,文件中都有什么功能的函数,并且在 plan 阶段,给它修整不合理的地方。第二点因为我几乎只用 python ,而 python 对 AI 来说更友好,所以我用起来比较舒服,第三点,我之前古法代码 有写集成测试的习惯,所以现在 vibe ,也会一并把测试带出来。之后我们使用方式差不多。


@luanfujian 老项目不能 vibe 吗,能简单讲下如何使用的吗?


@catinsides 真棒!


@swananan 把博客认真看完了,写的确实很好,我觉得基本上我们的理解大部分都是一致的。我觉得以现在 AI 的能力,管理好上下文,是没有项目解决不了的,并且越复杂的项目使用 AI coding 收益就越高。但是对于人的要求也越高了。我在 X 刷到到过一个观点,他说 AI coding 不是抹平了不同级别开发人员的差距,而是加大了开发人员的能力差距,初级工程师用了 AI 能力乘 10 ,而高级工程师用了 AI 能力乘 10000 。


@ty29022 额,这就有点抽象了。我的理解是 LLM 始终是工具,正确的使用工具,才能算作是 vibe coding 。一句模棱两可的需求,就算是人也干不好吧。


@Mandelo 是的。


@shunia 不好意思,其实我没太明白你的意思。测试和 review 是写代码的一部分,我觉得和 vibe 不 vibe 的好像没有什么关系?


@faceRollingKB 棒 正确做法!

@byweilong 这是另一个复杂的话题了,一篇帖子不好回复。

@sprinng 点了。

@aprilwei 也可能是 trea 不太行,换我帖子里的三个试试。

@Clannad0708 唔 你可能误会我的意思了。我说的 vibe coding 只是基础的姿势,不是我真的工作中就用这点,实际我在工作中要负责很多,甚至会自己维护 AI cache ,但是我觉得这些已经比较超出基础水平了。AI 开发不行的人(比如评论中的说 老项目维护 AI 只能辅助的),可能是他们姿势有问题,所以我分享了一下基础的配置。如果是使用了这些基础配置还觉得 AI 不行的人,我比较好奇,他们的工作是什么,为什么和大部分很厉害的高手都背道而驰。虽然我在北京,但是北京 cursor meet 刚好有事没去上,可惜。

@009694 哈哈哈 我确实会先跟 AI 聊 再 plan ,但是我没有说,是因为不是所有人都需要的,很多人拿到需求,本来就有思路的,不是所有人都需要和 AI 先交流。

@darksword21 棒!

@JoJoWuBeHumble 所以需要正确的使用姿势。

@ooee2016 额,没理解啥意思。

@YangWaleed 是的,所以我先把用的模型写在前面,哈哈哈。

@jackOff 和我不太一样,我是直接就用最好的。省的费劲 哈哈哈。

@17681880207 nice 。
3 月 4 日
回复了 caocong 创建的主题 职场话题 阿里千问负责人林俊旸千问离职
这评论区已经给人看力竭了。 为啥中文社区对人才的看法这么严苛?反而 X 上清一色的支持。

“没有什么人是不可替代的,不要把平台当成自己的能力。”
“业务发展期强行提上去的 P10 ,在业务稳定后,面对外界流入人才的冲击,很难守住自己的位置。”
“qwen 做的平平淡淡,被排挤很正常”
。。。。。

懒得引用了,这谁看了能蹦得住。
来了来了来了,从描述的情况来看,我感觉不是召回阶段的问题。

可以考虑在分块阶段优化一下,改成语义分块。判断后一句话和前一句话的相似度,从 0~1,为完全不想干与特别相干。设定一个阈值,当两句话分数相差超过阈值,既作为一个分块。这种分块方式可以让不同的语义分得更清楚。

在处理用户问题的时候,加入意图识别,准确识别意图,你想检索的是处置流程的分片,而不是消防安全事故相关。

以我的使用体验来看,现代模型准确识别出“想要的是处置流程的分片” 这一需求,不是难事。

另外,不行换好点的模型,国内用 deepseek 最新的。
2 月 28 日
回复了 0x114514 创建的主题 程序员 同事的离谱代码让我想发疯
用 cursor 或者 cc 模型就用 claude 或者 gpt 别用其他模型。AI 引入虚空方法,感觉已经是上个世纪的事了,从 claude4.0 开始,都没有这种问题了。
@Zonecde 我也只能算小入门的阶段。项目实际落地中,审计、sso 、权限控制 包括包公 OA 的接入,这些都和传统项目没有太大区别。

在安全方面,因为 agent 会使用工具,所以比传统项目风险更高。可以在 agent 执行中间加入判断层,比如接下来的步骤是删除文件,属于高危操作就给用户确认后再执行,或者 agent 自主判断不执行,通过其他方式完成任务。

至于合规性安全方面,如果要求高可以硬编码,在最终输出的时候加入违规词过滤。或者在模型方面进行安全性微调。

并发方面,我一直是用的 python 做的,首先全异步是比较基础的,如果用 AI 写,那提示词中要有体现。然后是工程结构中的优化,给你几个我做过的方案:
1. 多模型并用,请求分层。比如 轻量级模型,做专门的意图识别,快速分析问题类型,是否需要 agent 深入处理。一般业务中,大部分问题其实都比较简单,是可以简单处理的,把大模型留给最复杂的那个 sub—agent 。
2. 缓存决策信息。可以节省非常多的 token ,比如我在上个工作做一个化工行业的销售项目的时候,会提前缓存 AI 总结的客户画像,以天为单位的产品信息等。再比如阿里的那个免费奶茶,你会发现他虽然中间很多步,但是那个功能尤其的快。
3. 工具并发,当需要调用多工具的时候,也要支持并发。因为工具调用是 agent 最重要的一步,也是和普通提示词工程的区别。
4. 增加兜底机制,允许超时等场景,agent 回复默认信息。
5. 如果还不行,那就加机器好了。

而且其实公司再 oa 上用的独立应用,并发理应不会很高。
2 月 1 日
回复了 TimeDong 创建的主题 职场话题 2026 年了,前端开发还能学点啥
哥们,可以去招聘软件上看看,尤其是大厂的 jd 。比如京东的前端招聘要求。
https://i.imgur.com/G2aaVen.png
1  2  3  4  5  6  7  8  9  10 ... 12  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1095 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 23:36 · PVG 07:36 · LAX 16:36 · JFK 19:36
♥ Do have faith in what you're doing.