课程进度 30% · 第4/11章第4/11章 · 标签 1/3
— 1 —
无监督学习算法
无监督学习概述
无监督学习是机器学习的重要分支,它从未标记的数据中发现隐藏的模式和结构。 与监督学习不同,无监督学习不需要人工标注的标签,而是通过数据本身的特征和分布来学习。 主要任务包括聚类分析、降维技术和关联规则挖掘。
聚类分析降维技术关联规则
常用算法详解
K-Means聚类算法
K-Means是最经典的聚类算法之一,它将数据划分为K个簇,每个簇由其质心代表。 算法通过迭代分配数据点到最近的质心,并更新质心位置,直到收敛。 适用于球形簇,需要预先设定K值,对初始质心选择敏感。
— 2 —
PCA主成分分析
PCA(主成分分析)是一种常用的降维技术,通过线性变换将高维数据映射到低维空间, 保留数据中方差最大的方向。主成分是原始特征的线性组合,彼此正交。 常用于数据可视化、降噪和特征提取。
DBSCAN聚类算法
DBSCAN(基于密度的空间聚类算法)可以发现任意形状的簇,并自动识别噪声点。 核心思想:在指定半径(eps)内包含足够多(min_samples)数据点的区域被视为密集区域。 无需预设簇数,能处理非球形簇,对噪声鲁棒。
K-MeansPCADBSCAN聚类降维关联规则