谱聚类:一种基于图论与线性代数的聚类方法。它先把数据点看作图中的节点,用相似度构成边,再利用图拉普拉斯矩阵(Laplacian)的特征向量把数据映射到新的空间,最后在该空间中进行聚类(常见做法是再用 k-means)。常用于处理非凸形状或“连通性”更重要的数据结构。该术语在机器学习中最常见;在其他语境里“spectral”也可表示“幽灵般的/光谱的”,但这里主要指“谱(特征谱)”。
/ˈspɛktrəl ˈklʌstərɪŋ/
Spectral clustering can separate two moons-shaped datasets.
谱聚类可以把“两个月牙形”数据集分开。
By constructing an affinity graph and computing the smallest eigenvectors of the normalized Laplacian, spectral clustering often reveals community structure that k-means misses in the original feature space.
通过构建相似度图并计算归一化拉普拉斯矩阵对应的最小特征向量,谱聚类常能揭示在原始特征空间里 k-means 容易忽略的社区结构。
spectral 来自 spectrum(“谱/光谱”),在数学与工程语境中常指“特征值与特征向量构成的谱”;clustering 来自 cluster(“簇/群”)。合起来的 spectral clustering 字面意思是“基于谱(特征谱)的聚类”。