中文餐馆过程(CRP)是贝叶斯非参数统计中的一种概率分布与生成式隐喻,常用来描述“把对象分到若干组/簇(cluster)”的随机过程:新对象更倾向加入人数较多的已有簇,但也有一定概率创建新簇。它等价于狄利克雷过程(Dirichlet Process)聚类的一种直观表述。该名称来自“餐馆入座”的比喻,并非指真实的中国餐馆。
/ˈtʃaɪniːz ˈrɛst(ə)rɑːnt ˈprəʊsɛs/
We used a Chinese restaurant process to decide how many clusters to form.
我们用中文餐馆过程来决定要形成多少个簇。
In Bayesian nonparametric topic modeling, the Chinese restaurant process provides a flexible prior that allows the number of topics to grow with the data.
在贝叶斯非参数的主题建模中,中文餐馆过程提供了一种灵活的先验,使主题数量可以随着数据量增加而增长。
“Chinese restaurant process”是统计学界为帮助理解而创造的比喻名称:把数据点想象成进餐馆的客人,把簇想象成桌子;客人倾向坐到已有客人多的桌子(“富者愈富”),也可能开新桌。该隐喻在20世纪后期的概率论与贝叶斯非参数研究中逐渐普及,常与狄利克雷过程联系在一起。