第一章绪论
第一章 绪论
§11计算机视觉( Computer Vision)及其与相关学科的关系 计算机视觉 研究完成一项任务所需视觉信息和如何从图象中获取这些信息的研究领域 图象 视觉系统 视觉信息(距离,朝向,质地等) 图1.1枧觉系统功能 计算机视觉要达到的基本目的至少有三个: 1.根据一幅或多幅二维投影图象计算出观察点到目标物体的距离 2.根据一幅或多幅二维投影图象计算出目标物体的运动参数; 3.根据一幅或多幅二维投影图象计算出目标物体的表面物理特性 要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的 某些功能。 计算机视觉研究的本质问题—利用二维投影图象来重构三维物体的可视 部分
§1.1 计算机视觉(Computer Vision)及其与相关学科的关系 一. 计算机视觉 研究完成一项任务所需视觉信息和如何从图象中获取这些信息的研究领域 图象 视觉系统 视觉信息(距离, 朝向, 质地等) 图1.1视觉系统功能 计算机视觉要达到的基本目的至少有三个: 1. 根据一幅或多幅二维投影图象计算出观察点到目标物体的距离; 2. 根据一幅或多幅二维投影图象计算出目标物体的运动参数; 3. 根据一幅或多幅二维投影图象计算出目标物体的表面物理特性; 要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的 某些功能。 计算机视觉研究的本质问题— — 利用二维投影图象来重构三维物体的可视 部分
计算机视觉(CV)与人工智能(A)、图象处理(IP)以及模式识别(PR)等的关系 图象 图象处理系统 处理过的图象 图1.2图象处理系统功能 Image Processing 模式 模式识别系统 分类结果 Compter Pattern Vi ISIon Recognition 图1.3模式识别系统功能 Artificial ntelligence 图14AI、CV、ⅢP与PR的关系
二. 计算机视觉(CV)与人工智能(AI)、图象处理(IP)以及模式识别(PR)等的关系 图象 图象处理系统 处理过的图象 模式 模式识别系统 分类结果 图1.2 图象处理系统功能 图1.3 模式识别系统功能 Artificial Intelligence Compter Vision Pattern Recognition Image Processing 图1.4 AI、CV、IP与PR的关系
§12计算机视觉的发展 发展概况 方法上 Roberts(1965)—三维积木世界理解 70年代,Ma为代表—计算理论 Barrow、 Tenenbaum本征图( trinsic image) 80年代, Aloimonous提出主动视觉( Active vision)、有目的视觉( Purpose vision)- 性视觉( Qualitative Vision) 系统上 简化世界解释: VISION(麻省大学)、 ACRONYM(Standford Univ.) Mobile robert:道路分析与避障 Navlab、 Polly 困难与问题 1.对生理学、神经生物学等的研究有待深入,对侧抑制现象的揭示是这方面的典 型例证 关于这一点并非绝对,汽车之与动物行走方式的不同、飞机之与鸟类飞行方式的不同是很好 的反例 2.视觉问题多半是逆问题 3.视觉知识的表达与使用 人类获取信息的80%来源于视觉—一涉及面广 存储与检索 4.巨大的计算量
§1.2 计算机视觉的发展 一. 发展概况 方法上: Roberts(1965)— — 三维积木世界理解 70年代,Marr为代表— — 计算理论 Barrow、Tenenbaum本征图(Intrinsic Image) 80年代,Aloimonous提出主动视觉(Active Vision)、有目的视觉(Purpose Vision)、 定性视觉(Qualitative Vision) 系统上: 简化世界解释:VISION(麻省大学)、ACRONYM(Standford Univ.) Mobile Robert:道路分析与避障Navlab、Polly 二. 困难与问题 1. 对生理学、神经生物学等的研究有待深入,对侧抑制现象的揭示是这方面的典 型例证; 关于这一点并非绝对,汽车之与动物行走方式的不同、飞机之与鸟类飞行方式的不同是很好 的反例; 2. 视觉问题多半是逆问题 3. 视觉知识的表达与使用 人类获取信息的80%来源于视觉— —涉及面广 存储与检索 4. 巨大的计算量
1.3计算机视觉的研究方法与内容 叉学科——涉及几何(射影几何、空间解析几何)、线性代数、概率、随机过程、优化 、信息论、生理学、心理学、光学、热力学等 要方法 从简化世界出发(早期的主要手段) 恢复精确三维形状 主动方法 究内容 立体视觉 运动视觉 Shape from X 高层表示与推理 视觉学习 主动视觉
§1.3 计算机视觉的研究方法与内容 交叉学科— — 涉及几何(射影几何、空间解析几何)、线性代数、概率、随机过程、优化方 法、信息论、生理学、心理学、光学、热力学等 主要方法 从简化世界出发(早期的主要手段) 恢复精确三维形状 主动方法 研究内容 1. 立体视觉 2. 运动视觉 3. Shape from X 4. 高层表示与推理 5. 视觉学习 6. 主动视觉