半监督学习:一种机器学习方法,训练数据同时包含少量已标注数据(labeled data)和大量未标注数据(unlabeled data),目标是在标注成本较低的情况下提升模型的泛化性能。该术语也常用于深度学习、自然语言处理与计算机视觉中的数据稀缺场景。
/ˌsɛmi səˈvɝːvaɪzd ˈlɝːnɪŋ/
Semi-supervised learning can work well when labels are expensive.
当标注成本很高时,半监督学习往往很有效。
By combining a small labeled set with a large pool of unlabeled images, the model achieved higher accuracy through semi-supervised learning.
通过将少量已标注样本与大量未标注图像结合,模型借助半监督学习获得了更高的准确率。
semi- 来自拉丁语 semi,意为“半、部分”;supervised 源自 supervise(监督、指导),表示“有标签/有指导的”;learning 为“学习”。合起来字面意思是“半(部分)监督的学习”,强调训练过程中只有一部分数据带有监督信号(标签)。