PartJava - 编程学习与开发工具导航平台

机器学习/无监督学习算法4 / 11

课程进度 30% · 第4/11章第4/11章 · 标签 1/3

— 1 —

无监督学习算法

无监督学习是机器学习的重要分支，它从未标记的数据中发现隐藏的模式和结构。与监督学习不同，无监督学习不需要人工标注的标签，而是通过数据本身的特征和分布来学习。主要任务包括聚类分析、降维技术和关联规则挖掘。

聚类分析降维技术关联规则

K-Means是最经典的聚类算法之一，它将数据划分为K个簇，每个簇由其质心代表。算法通过迭代分配数据点到最近的质心，并更新质心位置，直到收敛。适用于球形簇，需要预先设定K值，对初始质心选择敏感。

— 2 —

PCA（主成分分析）是一种常用的降维技术，通过线性变换将高维数据映射到低维空间，保留数据中方差最大的方向。主成分是原始特征的线性组合，彼此正交。常用于数据可视化、降噪和特征提取。

DBSCAN（基于密度的空间聚类算法）可以发现任意形状的簇，并自动识别噪声点。核心思想：在指定半径(eps)内包含足够多(min_samples)数据点的区域被视为密集区域。无需预设簇数，能处理非球形簇，对噪声鲁棒。

K-MeansPCADBSCAN聚类降维关联规则