图3.5Lowe的视觉识别模型 识别可通过多种预测的特性与实际检测特性之间的对应来实现,其中包括形状、颜色 纹理、连通性、上下文、运动或影调。这里要强调的是空间对应性,即图象中特征的检测位 置准确地与某种物体特征在特定的投影下的位置相吻合。 LowelLow8s提出了进行视觉识别的模型,如图3.5所示。在此模型中除了经过深度和表 面表象的通路以外,还有由所谓的感知组织原理形成的通路。感知组织可以从二维图象特征 直接形成,并且可以用作基于搜索的识别过程的输入。至于图象解释正确性的验证也可直接 通过校验三维知识和图象二维位置之间的一致性来完成,而不需要通过深度表象。 感知组织和推理在视觉理解中的作用可以用以下心理物理学实验来证明,在此实验图象 中,为进行感知组织的必要信息被故意丢失了。如图36所示,图中是一幅自行车的线画图 但是它只完成了大约50%,并且使可进行自底向上聚集的大多数可能都被隐去(即隐去了 大多数显著的共线性、平行性、对称性和靠近的端点等)。实验证明,当被试验者对 图3.6当自底向上的图象特征聚类机会被排除时,线画图就难以识别 图中的内容并无先验知识时,要识别这幅图是相当困难的,在一个有10位试验者的小组中 有9位在90秒的时间内没能识出物体,第10位试验者则花了45秒完成识别。我们可以在 图中逐步地增加进行感知组织的线索,并继续进行实验,以观察这时能否使识别所需时间缩 短,在图37中只对图36增加了一根线条,但它的位置具有战略的重要性,使它能与其 图3.7增加一条提供聚类证论的线就使识别变得容易
49 图 3.5 Lowe 的视觉识别模型 识别可通过多种预测的特性与实际检测特性之间的对应来实现,其中包括形状、颜色、 纹理、连通性、上下文、运动或影调。这里要强调的是空间对应性,即图象中特征的检测位 置准确地与某种物体特征在特定的投影下的位置相吻合。 Lowe[Low 85]提出了进行视觉识别的模型,如图 3.5 所示。在此模型中除了经过深度和表 面表象的通路以外,还有由所谓的感知组织原理形成的通路。感知组织可以从二维图象特征 直接形成,并且可以用作基于搜索的识别过程的输入。至于图象解释正确性的验证也可直接 通过校验三维知识和图象二维位置之间的一致性来完成,而不需要通过深度表象。 感知组织和推理在视觉理解中的作用可以用以下心理物理学实验来证明,在此实验图象 中,为进行感知组织的必要信息被故意丢失了。如图 3.6 所示,图中是一幅自行车的线画图, 但是它只完成了大约 50%,并且使可进行自底向上聚集的大多数可能都被隐去(即隐去了 大多数显著的共线性、平行性、对称性和靠近的端点等)。实验证明,当被试验者对 图 3.6 当自底向上的图象特征聚类机会被排除时,线画图就难以识别 图中的内容并无先验知识时,要识别这幅图是相当困难的,在一个有 10 位试验者的小组中 有 9 位在 90 秒的时间内没能识出物体,第 10 位试验者则花了 45 秒完成识别。我们可以在 图中逐步地增加进行感知组织的线索,并继续进行实验,以观察这时能否使识别所需时间缩 短,在图 3.7 中只对图 3.6 增加了一根线条,但它的位置具有战略的重要性,使它能与其 图 3.7 增加一条提供聚类证论的线就使识别变得容易
它的线条聚集成为共线曲线。这第二幅图所需的识别时间就大为降低。10名试验者中有3 名可在5秒以内完成识别,其余7名可在60秒以内完成识别。从可以通过控制形成感知组 织来影响识别时间说明这个过程具有搜索的本质。在形成初始的感知组织聚类产生了有关线 条可形成一个圆形曲线的假设以后,使自行车的识别问题迎刃而解,说明了这是一个由假设 检验组成的推理过程 Kanizsalkanγ提出形状的感知可分成两个阶段:初始阶段,把视觉输入聚成具有空间和 时间规则性的区域:第二个阶段是完整性、完全性和集成性的感知推理,这个阶段使我们能 超出传感数据直接给出的信息范围,填补实现感知所缺少的信息。 32感知组织的基本原理 Gestalt心理学家证明和强调了感知组织在视觉中的重要性,他们虽然认识到了在感知 组织计算中应该计算什么,但是并没有令人信服地解答为什么要进行和如何进行这样的计算 的问题。也就是没有解决感知组织的基本原理的问题。对感知组织基本原理的研究要解决的 问题是聚类过程的目的是什么,以及如何进行聚类过程。对此问题研究者已进行了大量的工 作。下面我们介绍其中有代表性的两种观点:(1) Lowel85和 Witkin等认为聚类过程的目 的是发现图象元素之间的因果关系或非偶然性关系。图象之间的关系不太可能是由于偶然因 素产生的程度决定了元素之间关系的显要性( Significance),因此感知组织可被看成是对图 象特性的每一种可能的聚类赋以显要性的过程。(2) McCafferty认为和大多数逆向问题 样,在其原始状态下聚类是一个不适定问题。可以通过引入稳定函数来限制解的空间,这 些稳定函数表征了所期望的解的性质。感知组织的 Gestalt规则可用来描述人类视觉系统具 有的聚类特征,因此可通过引入稳定函数来实现 Gestalt规则。按照正则理论,这时聚类就 成为一个求能量极小的问题。在以下的章节中,我们将分别讨论这两种聚类方法 321根据图象关系的显要性进行聚类 Lowe认为可把图象中元素之间的关系分成两类:一类是由于偶然巧合的视点或位置产 生的关系;另一类是由景物中的某些有意义的(即可预测的)关系所产生。例如,图38(a) 和(b)中所示的由三个点所组成的两种关系。在(a)中三个点组成了等间距的共线关系,当视 点在相当大的范围内变化时,这样的关系都可以得以保持,因此当看到图象中的点之间具有 等间距的共线关系,可以推测它们是空间等间距共线点的成象。这样的关系被认为是因果的、 非偶然的。与此相反(b)图中三个点形成的是等边三角形的关系,如果三个点在空间形成等 边三角形的关系,那么只有在某一特定视角下,它们的图象才能保持等边三角形的关系。同 时对于空间中的任意三个点都存在一个特殊的视角,在该视角下这三个点在图象平面中的投 影是等边三角形。因此三个点之间的等边三角形关系就不是因果关系,而是偶然关系,这时 我们就不能从图象中点之间的等边三角形关系推论它们在三维空间中也保持这样的关系。因 此Lowe和[wit&Ten83认为:(1)聚类过程的目的是发现图象元素之间的因果关系 ( Causal relations),或非偶然性关系(non- accidental relations),这些关系在以后的解释过 程中原封不动地保存下来,解释过程中的许多处理只是给原始的聚类加上标志。所以,从图 象恢复三维结构的主要计算工作已由聚类过程完成。例如,在上述例子中三个点之间在空间 形成的等间距共线关系在聚类过程中已经被推论得知。(2)图象中元素之间关系的显要性 ( Significance)取决于这种关系不太可能是由于偶然性因素产生的程度。例如,在图象中平 行曲线关系被认为是高度显要的,这不是由于投影产生平行曲线结构的机会比不是这种结构 的多,而是因为两条不平行的曲线通过投影成为平行可能性很小。(3)图象关系的显要性也
50 它的线条聚集成为共线曲线。这第二幅图所需的识别时间就大为降低。10 名试验者中有 3 名可在 5 秒以内完成识别,其余 7 名可在 60 秒以内完成识别。从可以通过控制形成感知组 织来影响识别时间说明这个过程具有搜索的本质。在形成初始的感知组织聚类产生了有关线 条可形成一个圆形曲线的假设以后,使自行车的识别问题迎刃而解,说明了这是一个由假设 -检验组成的推理过程。 Kanizsa[Kan 79]提出形状的感知可分成两个阶段:初始阶段,把视觉输入聚成具有空间和 时间规则性的区域;第二个阶段是完整性、完全性和集成性的感知推理,这个阶段使我们能 超出传感数据直接给出的信息范围,填补实现感知所缺少的信息。 3.2 感知组织的基本原理 Gestalt 心理学家证明和强调了感知组织在视觉中的重要性,他们虽然认识到了在感知 组织计算中应该计算什么,但是并没有令人信服地解答为什么要进行和如何进行这样的计算 的问题。也就是没有解决感知组织的基本原理的问题。对感知组织基本原理的研究要解决的 问题是聚类过程的目的是什么,以及如何进行聚类过程。对此问题研究者已进行了大量的工 作。下面我们介绍其中有代表性的两种观点:(1) Lowe[Low 85]和 Witkin 等认为聚类过程的目 的是发现图象元素之间的因果关系或非偶然性关系。图象之间的关系不太可能是由于偶然因 素产生的程度决定了元素之间关系的显要性(Significance),因此感知组织可被看成是对图 象特性的每一种可能的聚类赋以显要性的过程。(2)McCafferty[McC 90]认为和大多数逆向问题 一样,在其原始状态下聚类是一个不适定问题。可以通过引入稳定函数来限制解的空间,这 些稳定函数表征了所期望的解的性质。感知组织的 Gestalt 规则可用来描述人类视觉系统具 有的聚类特征,因此可通过引入稳定函数来实现 Gestalt 规则。按照正则理论,这时聚类就 成为一个求能量极小的问题。在以下的章节中,我们将分别讨论这两种聚类方法。 3.2.1 根据图象关系的显要性进行聚类 Lowe 认为可把图象中元素之间的关系分成两类:一类是由于偶然巧合的视点或位置产 生的关系;另一类是由景物中的某些有意义的(即可预测的)关系所产生。例如,图 3.8(a) 和(b)中所示的由三个点所组成的两种关系。在(a)中三个点组成了等间距的共线关系,当视 点在相当大的范围内变化时,这样的关系都可以得以保持,因此当看到图象中的点之间具有 等间距的共线关系,可以推测它们是空间等间距共线点的成象。这样的关系被认为是因果的、 非偶然的。与此相反(b)图中三个点形成的是等边三角形的关系,如果三个点在空间形成等 边三角形的关系,那么只有在某一特定视角下,它们的图象才能保持等边三角形的关系。同 时对于空间中的任意三个点都存在一个特殊的视角,在该视角下这三个点在图象平面中的投 影是等边三角形。因此三个点之间的等边三角形关系就不是因果关系,而是偶然关系,这时 我们就不能从图象中点之间的等边三角形关系推论它们在三维空间中也保持这样的关系。因 此 Lowe 和 [Wit & Ten 83]认为:(1) 聚类过程的目的是发现图象元素之间的因果关系 (Causal relations),或非偶然性关系(non-accidental relations),这些关系在以后的解释过 程中原封不动地保存下来,解释过程中的许多处理只是给原始的聚类加上标志。所以,从图 象恢复三维结构的主要计算工作已由聚类过程完成。例如,在上述例子中三个点之间在空间 形成的等间距共线关系在聚类过程中已经被推论得知。(2) 图象中元素之间关系的显要性 (Significance)取决于这种关系不太可能是由于偶然性因素产生的程度。例如,在图象中平 行曲线关系被认为是高度显要的,这不是由于投影产生平行曲线结构的机会比不是这种结构 的多,而是因为两条不平行的曲线通过投影成为平行可能性很小。(3) 图象关系的显要性也
提供了进行聚类的方法。感知组织可被看成是对图象特征的每一种可能的聚类赋以显要性程 度的过程。 b 图38(a)三点成等间距关系(b)三点成等边三角形关系 3211图象关系非偶然性产生的概率 Lowe认为每种图象关系都包含了表示这种关系是非偶然性产生的统计信息,并且正是 这种非偶然性的程度形成了对它赋以显要性程度的基础。由于在图象中可能存在的图象关系 类型有无穷多种。(例如,对任何给定的N,图中所有的“直线”对之间形成相对角度为N 度的关系。)在这些可能的关系中只有一小部分是显要的和值得检测的。而确定一种关系是 否值得检测的关键就是要计算这种图象关系是非偶然性产生的概率( probability of accident occurrence),以下我们来研究这个问题 在计算图象关系的非偶然性概率时要考虑以下多种因素: (1)关于图象投影过程的知识告诉我们,只有某些类型的图象关系通常不是由于偶然 性产生的。因此从统计上讲,只有这样的关系是可探测的:(2)在作非偶然性统计估计时可 利用对于每种关系产生概率的先验知识;(3)在建立图象关系事件的模型时可假设图象元素 的位置和方位是独立的:(4)对任何关系来说,相似特征的背景密度决定了某个给定程度接 近性的显要性:(5)初始的关系可递归地组合成新的关系,此新关系可影响原始估计的显要 性 1.视点恒常性条件 景物到图象投影过程的性质向我们提供了一种对图象关系强有力和通用的约束信息。如 果我们假设摄象机或眼睛的视点是与景物中的物体相独立的,那么可以证明只有某些类型的 图象关系通常不是由于偶然因素产生的。这些类型的图象关系的特点是它可以在视点的一个 范围内保持稳定。例如,景物中曲线的共线性可在相当宽的视点范围内投影形成图象中的共 线性。任何在投影时产生的关系,如果不能在多数视点范围内保持稳定的话,就难以把这样 的关系与由于偶然性产生的关系相区分。例如,景物中成直角的直线对在大多数视点下都不 能投影为图象中成直角的直线对。因此,虽然我们在图象中检测到了成直角的直线对,我们 也没有理由相信,这不是由于视点与某个未知空间角度相配合偶然产生的结果。 视点恒常性约束极大地限制了可作为感知组织基础的图象关系类型。只有少数类型的关 系,例如,共线、连接性可以在所有的视点下保持恒常。不过,还有另外一些类型的关系, 可以在相当大的范围内加以保持,因此可被认为是经常出现的。例如,平行和一系列共线特 征的等间距性在透视效应的情况下,仍能在相当大的视点范围内保持。此外,由于许多物体 只占据较小的视角,或者与观察者到物体的距离相比,物体本身的深度范围较小,我们还可 认为其它一些关系在图象中是经常产生的。对这样的关系在使用时要小心处理。例如,在投
51 提供了进行聚类的方法。感知组织可被看成是对图象特征的每一种可能的聚类赋以显要性程 度的过程。 图 3.8 (a)三点成等间距关系 (b)三点成等边三角形关系 3.2.1.1 图象关系非偶然性产生的概率 Lowe 认为每种图象关系都包含了表示这种关系是非偶然性产生的统计信息,并且正是 这种非偶然性的程度形成了对它赋以显要性程度的基础。由于在图象中可能存在的图象关系 类型有无穷多种。(例如,对任何给定的 N,图中所有的“直线”对之间形成相对角度为 N 度的关系。)在这些可能的关系中只有一小部分是显要的和值得检测的。而确定一种关系是 否值得检测的关键就是要计算这种图象关系是非偶然性产生的概率(probability of accident occurrence),以下我们来研究这个问题。 在计算图象关系的非偶然性概率时要考虑以下多种因素: (1) 关于图象投影过程的知识告诉我们,只有某些类型的图象关系通常不是由于偶然 性产生的。因此从统计上讲,只有这样的关系是可探测的;(2) 在作非偶然性统计估计时可 利用对于每种关系产生概率的先验知识;(3) 在建立图象关系事件的模型时可假设图象元素 的位置和方位是独立的;(4) 对任何关系来说,相似特征的背景密度决定了某个给定程度接 近性的显要性;(5) 初始的关系可递归地组合成新的关系,此新关系可影响原始估计的显要 性。 1. 视点恒常性条件 景物到图象投影过程的性质向我们提供了一种对图象关系强有力和通用的约束信息。如 果我们假设摄象机或眼睛的视点是与景物中的物体相独立的,那么可以证明只有某些类型的 图象关系通常不是由于偶然因素产生的。这些类型的图象关系的特点是它可以在视点的一个 范围内保持稳定。例如,景物中曲线的共线性可在相当宽的视点范围内投影形成图象中的共 线性。任何在投影时产生的关系,如果不能在多数视点范围内保持稳定的话,就难以把这样 的关系与由于偶然性产生的关系相区分。例如,景物中成直角的直线对在大多数视点下都不 能投影为图象中成直角的直线对。因此,虽然我们在图象中检测到了成直角的直线对,我们 也没有理由相信,这不是由于视点与某个未知空间角度相配合偶然产生的结果。 视点恒常性约束极大地限制了可作为感知组织基础的图象关系类型。只有少数类型的关 系,例如,共线、连接性可以在所有的视点下保持恒常。不过,还有另外一些类型的关系, 可以在相当大的范围内加以保持,因此可被认为是经常出现的。例如,平行和一系列共线特 征的等间距性在透视效应的情况下,仍能在相当大的视点范围内保持。此外,由于许多物体 只占据较小的视角,或者与观察者到物体的距离相比,物体本身的深度范围较小,我们还可 认为其它一些关系在图象中是经常产生的。对这样的关系在使用时要小心处理。例如,在投
影时曲率恒常性不能严格地保持,但对于在曲线只占较小的径向角度范围的局部区域内,基 本上可说曲率保持不变。尽管有上述这些复杂性,视点恒常性约束仍然是一种非常有用的工 具,它可用于把几乎无穷的图象关系局限到少数几种候选关系,这些关系可在投影的条件下 至少可以部分保持恒常性。 在视点恒常性的基础上检测图象关系的重要优点是,这样检测到的图象关系意味着它们 是某个特定的空间关系投影产生的。因此就有可能根据图象关系来推论相应的空间结构。例 如,如果我们已确定图象内的若干特征的共线关系不是由于偶然因素产生的,就可以推论这 些特征在空间也是共线的。这个问题在下面的章节中研究 2.关于图象关系产生概率的先验知识 上一节讨论的视点恒常性约束是确定图象关系是否是偶然因素产生的主要因素之一,但 与此同时还需考虑与图象内容有关的先验知识。当决定先验知识在判断图象关系的非偶然性 时可以应用条件概率和 Bayesian(贝叶斯)推理: 设,p(ra)是事件r和a都是真的概率,p(alr)是当r事件为真时,事件a的概率。因此 P(r&a)=P(rP(ar)=P(a)p(rla) 所以 P(a)p(rla) P(ar) P(r) 这就是基本的 Bayesian公式。如果r是以某种精确度测得已知图象关系的事件;a表示 图象关系是偶然性产生的事件;c表示图象关系是因果性产生的事件。那么 P(r)=P(a)+P(c)(因为a和c是r的两种相互排斥的情况)和P(r1a)=P(rl)=1(因 为a和c是r的实例),因此,根据 Bayesian公式可得 P(a) P(ar)- P(a)+P(c) P(c)=1-P(ar)=1-(a) P(a)+ P(c) 以上公式使我们能根据偶然事件和非偶然事件的先验概率来计算给定的图象关系是非偶然 性的概率。对P(a)的估计问题将在以下章节中讨论,前一节中讨论的视点恒常性条件的目标 是选择P(c)显著高的关系,但对定量估计图象关系的因果性概率来说,视点恒常性只是其 中的一个因素。如何来确定P(c)呢?一种可能的方法是通过统计的实验方法,另一种较为理 论的方法是先建立视觉世界的某种通用模型,然后根据这个模型得到这种图象关系的出现概 率。当然对P(c)的估计并不需要很准确,数量级的估计就可满足应用的需要。 3.位置独立性假设 给定以某种精度保持的图象关系,要计算这种具有一定精度的关系是偶然产生的概率, 我们就必须对物体周围的分布情况作某种假设,以此为背景来判断关系的显要性。一种最通 用和显然的假设是认为背景中的物体位置相互独立,由此可知在图象的背景中,物体位置也 是相互独立的。这被称为位置独立性的空假设( null hypothesis) 已知三维空间中位置和方向的独立性假设以后,就很容易计算具有给定精度的某种关系 是偶然产生的概率。例如,如果两条直线平行,其平行的精度为5°以内,那么可算出这样 的关系是由于两个独立物体偶然产生的概率是5/180=1/36。 4.背景特征密度与接近性之比 以上研究了单独给定关系的情况,当在图象中同时存在多个图象特征时,需要研究的图 象关系数量就与特征数量的平方成正比。例如,已知图中有10条线,那么可能的线段对的 数量就有10×(10-1)/2=45条。不难想象,可以从中发现一些相互平行的线段对。图39中
52 影时曲率恒常性不能严格地保持,但对于在曲线只占较小的径向角度范围的局部区域内,基 本上可说曲率保持不变。尽管有上述这些复杂性,视点恒常性约束仍然是一种非常有用的工 具,它可用于把几乎无穷的图象关系局限到少数几种候选关系,这些关系可在投影的条件下 至少可以部分保持恒常性。 在视点恒常性的基础上检测图象关系的重要优点是,这样检测到的图象关系意味着它们 是某个特定的空间关系投影产生的。因此就有可能根据图象关系来推论相应的空间结构。例 如,如果我们已确定图象内的若干特征的共线关系不是由于偶然因素产生的,就可以推论这 些特征在空间也是共线的。这个问题在下面的章节中研究。 2. 关于图象关系产生概率的先验知识 上一节讨论的视点恒常性约束是确定图象关系是否是偶然因素产生的主要因素之一,但 与此同时还需考虑与图象内容有关的先验知识。当决定先验知识在判断图象关系的非偶然性 时可以应用条件概率和 Bayesian(贝叶斯)推理: 设,p(r& a)是事件 r 和 a 都是真的概率, p(a|r) 是当 r 事件为真时,事件 a 的概率。因此 有: P(r&a) = P(r)P(a|r) = P(a)P(r|a) 所以 P a r P a P r a P r ( | ) ( ) ( | ) ( ) = 这就是基本的 Bayesian 公式。如果 r 是以某种精确度测得已知图象关系的事件;a 表示 图象关系是偶然性产生的事件; c 表 示图 象 关 系 是 因 果 性 产 生的 事 件 。 那 么 P(r) = P(a) + P(c) (因为 a 和 c 是 r 的两种相互排斥的情况)和 P(r|a) = P(r|c) = 1 (因 为 a 和 c 是 r 的实例),因此,根据 Bayesian 公式可得 P a r P a P a P c ( | ) ( ) ( ) ( ) = + P c r P a r P a P a P c ( | ) ( | ) ( ) ( ) ( ) = − = − + 1 1 以上公式使我们能根据偶然事件和非偶然事件的先验概率来计算给定的图象关系是非偶然 性的概率。对 P(a)的估计问题将在以下章节中讨论,前一节中讨论的视点恒常性条件的目标 是选择 P( c)显著高的关系,但对定量估计图象关系的因果性概率来说,视点恒常性只是其 中的一个因素。如何来确定 P(c)呢?一种可能的方法是通过统计的实验方法,另一种较为理 论的方法是先建立视觉世界的某种通用模型,然后根据这个模型得到这种图象关系的出现概 率。当然对 P(c)的估计并不需要很准确,数量级的估计就可满足应用的需要。 3. 位置独立性假设 给定以某种精度保持的图象关系,要计算这种具有一定精度的关系是偶然产生的概率, 我们就必须对物体周围的分布情况作某种假设,以此为背景来判断关系的显要性。一种最通 用和显然的假设是认为背景中的物体位置相互独立,由此可知在图象的背景中,物体位置也 是相互独立的。这被称为位置独立性的空假设(null hypothesis)。 已知三维空间中位置和方向的独立性假设以后,就很容易计算具有给定精度的某种关系 是偶然产生的概率。例如,如果两条直线平行,其平行的精度为 5°以内,那么可算出这样 的关系是由于两个独立物体偶然产生的概率是 5 180 = 1 36。 4. 背景特征密度与接近性之比 以上研究了单独给定关系的情况,当在图象中同时存在多个图象特征时,需要研究的图 象关系数量就与特征数量的平方成正比。例如,已知图中有 10 条线,那么可能的线段对的 数量就有 10×(10-1) / 2=45 条。不难想象,可以从中发现一些相互平行的线段对。图 3.9 中
的例子表示了这一点 a N 图3.9两条几乎平行的线段在图a中形成了一个显要的关系,因为这时与背景中的相似特 征的密度相比,这两条线相互更为接近。但当接近性与密度之比下降时,这两条平行线段的 显要性就减弱了,这说是图(b)所示的情况。 如果把背景的密度考虑进来,那么构成关系的特征之间的接近性就成为判断关系是否显 要的一个主要因素,当两个特征之间的距离变得更近时,在给定的背景特征密度情况下,具 有相同接近程度的其它特征的数量就急剧下降。 请注意,接近性不但是在判断其它类型图象关系显要性时的一个因素,而且它本身也是 一种可用于检测的非偶然性的图象关系。在空间是相互接近的特征,在各种视点下都将投影 为图象中相互接近的特征,所以接近性可以通过视点恒常性试验 5递归地进行构造 由于图象测量的精度有限,所以至今所讨论的简单图象关系通常不能产生很低的偶然性 概率。因此难以作为识别关系的可靠证据,但是可以通过组合初步得到的关系来建立新的图 象关系,这些组合图象关系的偶然性概率就会低得多。例如,我们可以把若干个共线的点聚 类成线,然后又把这条线进一步组合进平行线这样较大的结构中。这些后来形成的结构对较 早的聚类提供了确认。这样的过程可以一直进行下去,直到识别物体。在前面所举的识别自 行车的例子中可以看到,识别了自行车就是对前面的初始聚类的强有力的确认。 3212限制计算的复杂性 前面已研究了若干确定某一图象关系是否是偶然性产生的因素。但是,在有些情况下人 类视觉却不能检测按任何合理的统计准则来衡量都是高度显要的聚类关系。如图3.10中 图3.10(a)所示为5个等间距共线点或3个等间距共线线段,如果把这些特征放在相似背
53 的例子表示了这一点。 图 3.9 两条几乎平行的线段在图(a)中形成了一个显要的关系,因为这时与背景中的相似特 征的密度相比,这两条线相互更为接近。但当接近性与密度之比下降时,这两条平行线段的 显要性就减弱了,这说是图(b)所示的情况。 如果把背景的密度考虑进来,那么构成关系的特征之间的接近性就成为判断关系是否显 要的一个主要因素,当两个特征之间的距离变得更近时,在给定的背景特征密度情况下,具 有相同接近程度的其它特征的数量就急剧下降。 请注意,接近性不但是在判断其它类型图象关系显要性时的一个因素,而且它本身也是 一种可用于检测的非偶然性的图象关系。在空间是相互接近的特征,在各种视点下都将投影 为图象中相互接近的特征,所以接近性可以通过视点恒常性试验。 5. 递归地进行构造 由于图象测量的精度有限,所以至今所讨论的简单图象关系通常不能产生很低的偶然性 概率。因此难以作为识别关系的可靠证据,但是可以通过组合初步得到的关系来建立新的图 象关系,这些组合图象关系的偶然性概率就会低得多。例如,我们可以把若干个共线的点聚 类成线,然后又把这条线进一步组合进平行线这样较大的结构中。这些后来形成的结构对较 早的聚类提供了确认。这样的过程可以一直进行下去,直到识别物体。在前面所举的识别自 行车的例子中可以看到,识别了自行车就是对前面的初始聚类的强有力的确认。 3.2.1.2 限制计算的复杂性 前面已研究了若干确定某一图象关系是否是偶然性产生的因素。但是,在有些情况下人 类视觉却不能检测按任何合理的统计准则来衡量都是高度显要的聚类关系。如图 3.10 中 图 3.10 (a)所示为 5 个等间距共线点或 3 个等间距共线线段,如果把这些特征放在相似背