我不是做机器学习的,缺乏相关领域常识
最近看 chatGPT 都是说训练大模型,感觉是想一个模型干很多事
我想以后网上会不会有很多训练好的小模型,都只解决好一个小问题,然后把他们的数据输出对接起来,再当成整体进行训练,得到一个可以处理复杂任务的组合模型
大家可以自行选择训练好的小模型组合成复杂模型,也可以自己从头训练效果更好的小模型
我个人不希望强 AI 被某几个巨头公司垄断,不知道以后 训练自家的小模型 和 串联小模型训练复杂模型 有没有搞头,普通开发者有没有机会参与一下
1
NoOneNoBody 2023-02-18 17:58:49 +08:00
这个问题……
一般模型就是针对具体应用的,至少目前是这样 例如一张人像风景照片,问这是谁什么时候在哪拍的? 实际上从问题就已经分隔出三个子问题处理了:谁、年龄、地点,对应人脸识别、年龄识别、风景点识别三个模型 有些很难分割的问题,它直接对应的就是一个模型 例如 A 、B 、C 哪个好?要么按一些特定标准分割打分,要么将所有人的回答一起训练学习。前者是标准很清晰的时候,按机器学习方式进行,后者是标准很模糊甚至权重不同影响答案较大的,按深度学习进行 然后,你的问题还有另一个层面,不知道你是否指这个? 就是数据采集,巨头可以采集一亿人的身份证做一个模型,但能不能十万个小单位各自采集一千人的身份证做模型,这十万个小模型合起来用? 答案是很难,还是要元数据合起来做模型,而不是一堆模型合起来 模型已经是半成品,不能还原原始数据 |
2
Muniesa 2023-02-18 18:32:29 +08:00 via Android
串联小模型应用很多了,比如 OCR 是拆成文本检测、方向分类和文字识别,至于你说的当成整体训练,如果模型内部是分开的,和单个模型分开训练没有区别,如果要共用结构,那其实就是大模型。
|
3
Windn0 2023-02-18 20:14:51 +08:00 via iPhone
只能说你突发奇想,想太简单了。
|
4
nightwitch 2023-02-18 23:37:34 +08:00 via Android
"再当成整体进行训练,得到一个可以处理复杂任务的组合模型"
本质上不就是拼成了一个大模型? 分阶段做处理也不是什么新思路了,你翻翻 2011 年附近的论文那个时候显卡还很弱鸡,也没好用的 dl 框架,拿到一个复杂任务都要分好几个阶段用不同的模型去处理 |
5
sujin190 2023-02-19 10:09:55 +08:00 via Android 1
只是量变累加并不能得到质变
|
6
sky497134710 2023-07-25 12:24:04 +08:00 1
|