导航菜单

机器学习/无监督学习算法
课程进度 30% · 第4/11章4/11章 · 标签 1/3
1

无监督学习算法

无监督学习概述

无监督学习是机器学习的重要分支,它从未标记的数据中发现隐藏的模式和结构。 与监督学习不同,无监督学习不需要人工标注的标签,而是通过数据本身的特征和分布来学习。 主要任务包括聚类分析、降维技术和关联规则挖掘。

聚类分析降维技术关联规则

常用算法详解

K-Means聚类算法

K-Means是最经典的聚类算法之一,它将数据划分为K个簇,每个簇由其质心代表。 算法通过迭代分配数据点到最近的质心,并更新质心位置,直到收敛。 适用于球形簇,需要预先设定K值,对初始质心选择敏感。

2

PCA主成分分析

PCA(主成分分析)是一种常用的降维技术,通过线性变换将高维数据映射到低维空间, 保留数据中方差最大的方向。主成分是原始特征的线性组合,彼此正交。 常用于数据可视化、降噪和特征提取。

第一主成分方向

DBSCAN聚类算法

DBSCAN(基于密度的空间聚类算法)可以发现任意形状的簇,并自动识别噪声点。 核心思想:在指定半径(eps)内包含足够多(min_samples)数据点的区域被视为密集区域。 无需预设簇数,能处理非球形簇,对噪声鲁棒。

簇A簇B噪声点
K-MeansPCADBSCAN聚类降维关联规则