它的训练是不是需要海量的数据?
1
yangzhezjgs 2023-03-23 16:44:37 +08:00 1
不太专业,学过一点机器学习和深度学习,姑妄言之
机器学习本质上就是归纳法,希望通过提取过往数据中的本质特征来找到一个普遍性函数映射关系,来实现对新的未知东西的预测,比如:动物分类模型,训练过程就是给大量的数据让他预测,并给他反馈,让他不断调整,直到找到那个函数关系为止。 早期的机器学习就需要人工设计函数映射关系,结构是基于比较严谨的数学原理推理出来的,现在深度学习是通过神经网络作为万能的函数拟合器代替了人工设计,解释性比较差,但是效果好。对深度学习感兴趣可以看这本: https://book.douban.com/subject/30270959/ 所以数据很重要,大量优质的有标注的数据才是基础。 |
2
emSaVya 2023-03-23 17:53:25 +08:00
这种问题 去问 chatgpt 非常合适
|
3
cccb 2023-03-23 21:16:45 +08:00
假如一项能力是一个公式,例如听汉语语音输出汉字,那么这个 AI 就是在学这个公式的未知数,当 AI 大致猜到了这个公式的未知量,那 AI 大概也就能做听语音输出汉字的活了。
比如 AI 模型是一个有超多未知量的非线性高阶魔法公式,我知道这个公式的一些输入和输出,但是我不知道魔法公式的未知量都是什么。 我可以猜这些参数,也就是我通过输入和输出之间的关系,可以反推这些参数大概是什么样子(猜的不准,那我可以反推去修正这些参数),我输入和输出(一起成为样本)越多,那我猜的就越准,如果我有海量数据,那这个魔法公式的未知量就逐渐可以被猜的跟真实值很近。 结合现实就是,我不知道人是怎么分辨猫和狗的,但是我可以根据人给猫猫狗狗的图片打的标签, 反推人识别猫猫狗狗所用的公式的未知量是啥,本身这个任务不复杂,猜的够多之后,机器逐渐也掌握了人类用来猜猫狗的“魔法公式”。 以上只是 有监督学习 的 AI ,AI 种类还有很多。 |
4
mingoing428 2023-03-25 11:16:15 +08:00 via Android
两个点能确定一条线性函数,三个点能确定二次函数,四个点。。。。。
|