课程进度 2% · 第1/13章第1/13章 · 标签 1/4
— 1 —
什么是计算机视觉?
计算机视觉是人工智能的一个重要分支,它致力于让计算机能够"看见"并理解视觉世界。通过模拟人类视觉系统,计算机视觉使机器能够从图像或视频中获取信息,理解场景内容,并做出相应的决策。
计算机视觉系统的基本组成:
- 图像获取:通过相机等设备捕获图像
- 预处理:图像增强、去噪等
- 特征提取:提取图像中的关键信息
- 模式识别:识别图像中的对象和场景
- 理解与决策:理解场景并做出相应决策
计算机视觉的核心任务
基础任务:
- 图像分类:识别图像中的主要对象
- 目标检测:定位和识别图像中的多个对象
- 图像分割:将图像分割成多个区域
- 特征匹配:在不同图像间找到对应点
高级任务:
- 场景理解:理解图像中的场景和上下文
- 姿态估计:估计物体的3D姿态
- 动作识别:识别视频中的动作
- 3D重建:从2D图像重建3D场景
— 2 —