标注函数:在机器学习(尤其是“弱监督/程序化标注”)中,用一条规则、启发式方法或小程序,把数据样本映射为某个标签(或输出“弃权/未知”)的函数,用于自动生成训练标签、减少人工标注成本。(也常简称 LF。)
/ˈleɪbəlɪŋ ˈfʌŋkʃən/
A labeling function marks emails with “spam” when they contain certain keywords.
当邮件包含某些关键词时,一个标注函数会把它标为“垃圾邮件”。
In weak supervision, multiple labeling functions can vote on a label, and a model learns from their noisy outputs.
在弱监督中,多个标注函数可以对标签“投票”,模型再从这些带噪声的输出中学习。
labeling 来自 label(“标签”),词源可追溯到中古法语 label/lambel,本义与“挂在物品上的标记”相关;function 来自拉丁语 functio(“执行、作用”)。合起来表示“用来给数据贴标签的作用/规则(函数)”。