第八章纹理 8.1概述 8.1.1纹理的定义 8.12纹理的描述和分析方法 8.1.3纹理基元与影调 8.1.4纹理研究的领域 82人类视觉系统的纹理分割模式 8.3纹理描述 83.1测量纹理特性的统计方法 832纹理的空间频率特性 83.3纹理描述的结构方法 81概述 811纹理的定义 尽管纹理在图象分类和图象分析中是很重要的特性,并且它几乎无所不在,从多光谱卫 星图片到细胞组织的图象都可以看到纹理,但目前对纹理还没有精确的定义。图81中的 D34图是通过把特定的子图象有规则地重复,由人工产生的纹理。图8.1中的其它部分 图8.1人造和自然纹理图案 则是更为复杂的自然纹理。图象纹理可定性地用以下一种或几种描述来表征:粗的、细的、 平滑的、颗粒状的、随机的、线划状的或斑驳杂色的、不规则的和波纹状的。从图8.1所示 的纹理可看到纹理是一种有组织的区域现象,它的基本特征是移不变性( shift invariance) 也即对纹理的视觉感知基本上与其在图象中的位置无关。移不变性可被描述成是确定性的
160 第八章 纹 理 8.1 概述 8.1.1 纹理的定义 8.1.2 纹理的描述和分析方法 8.1.3 纹理基元与影调 8.1.4 纹理研究的领域 8.2 人类视觉系统的纹理分割模式 8.3 纹理描述 8.3.1 测量纹理特性的统计方法 8.3.2 纹理的空间频率特性 8.3.3 纹理描述的结构方法 8.1 概述 8.1.1 纹理的定义 尽管纹理在图象分类和图象分析中是很重要的特性,并且它几乎无所不在,从多光谱卫 星图片到细胞组织的图象都可以看到纹理,但目前对纹理还没有精确的定义。图 8.1 中的 D34 图是通过把特定的子图象有规则地重复,由人工产生的纹理。图 8.1 中的其它部分 图 8.1 人造和自然纹理图案 则是更为复杂的自然纹理。图象纹理可定性地用以下一种或几种描述来表征:粗的、细的、 平滑的、颗粒状的、随机的、线划状的或斑驳杂色的、不规则的和波纹状的。从图 8.1 所示 的纹理可看到纹理是一种有组织的区域现象,它的基本特征是移不变性(shift invariance), 也即对纹理的视觉感知基本上与其在图象中的位置无关。移不变性可被描述成是确定性的
(规则的或结构的)或是随机的(不规则的),但很可能存在着介于这两者之间的类别。确 定性的图案通常是人造的,并且由线条、三角形、矩形、圆、多边形有规律的排列组成,而 随机图象则通常是自然界产生的。 812纹理的描述和分析方法 描述纹理图象ρ的简单数学模型是 P=R(SK 其中R是位移(或关系)规则,Sk是象素的小区域,它构成了纹理基元(元素)。Sk本身 又是输入图象I(,〕的函数。以下对纹理的研究也是从纹理基元和位移或关系规则这两方面 进行的。由于纹理基元的重要性,下面我们将先对它进行单独讨论 纹理分析方法主要有两类,一类是统计的方法,另一类是结构分析的方法。统计的方 法对纹理进行分析,并描述图案p的特征。结构分析的方法则试图通过研究(8-1)式中的R和 Sk的特性来揭示纹理的细节。这样做显然要困难得多,这也是为什么人们倾向于采用统计 方法的原因。但是,如果R和Sk有明碓的定义或已知,那么用结构分析的方法就很简单。 按方程(8-1)的观点,可以从两个方面描述纹理。第一个方面用于描述组成纹理的基元 第二个方面用于描述纹理基元之间的空间联系或相互影响。第一个方面与纹理区域中的影调 基本分布情况(称为影调基元)或局部特性有关。第二个方面与影调基元的空间组织有关。 纹理区域 纹理基元 纹理基元之间 属性 的空间关系 度属性 区域属性 基元区域 空间组织方式 类型 均值其它 形状‖其它 结构的函数的 极值 面积 极值 统计的 图82纹理分析方法 影调基元是具有确定影调特性的区域,可以用诸如平均灰度,或区域中的最大和最小灰 度这样的特性来描述。把具有给定影调特性的象素最大程度地连接起来就组成了影调基元 可以按它的面积和形状来评价影调基元。影调基元不但包括它的灰度而且包括它的影调的区 域特性。 纹理可用纹理基元的数量和类型以及这些基元的空间组织或排列来描述。纹理的空间组 织可能是随机的,也可能一个基元对相邻基元有成对的依赖关系,或者几个基元同时相互关 联。这样的关联可能是结构的、概率的或是函数的。纹理分析的方法可用示意图82表示 813纹理基元与影调 个纹理基元(不严格地说)是一个具有一定的不变特性的视觉基元。这些不变特性在 给定区域内的不同位置上,以不同的变形和不同的方向重复出现。纹理基元最基本的不变特 性之一是区域内象素的灰度分布,在更为复杂的情况下可能还有与形状有关的特性,而影 也是表示灰度的明暗分布。因此,我们认为影调和纹理不是独立的概念,它们之间的关系很 象光波中的粒子性与波动性之间的关系。光在任何时候都有粒子性和波动性,但是根据具体
161 (规则的或结构的)或是随机的(不规则的),但很可能存在着介于这两者之间的类别。确 定性的图案通常是人造的,并且由线条、三角形、矩形、圆、多边形有规律的排列组成,而 随机图象则通常是自然界产生的。 8.1.2 纹理的描述和分析方法 描述纹理图象 的简单数学模型是: = R Sk ( ) (8-1) 其中 R 是位移(或关系)规则, Sk 是象素的小区域,它构成了纹理基元(元素)。 Sk 本身 又是输入图象 I(i, j)的函数。以下对纹理的研究也是从纹理基元和位移或关系规则这两方面 进行的。由于纹理基元的重要性,下面我们将先对它进行单独讨论。 纹理分析方法主要有两类, 一类是统计的方法,另一类是结构分析的方法。统计的方 法对纹理进行分析,并描述图案 的特征。结构分析的方法则试图通过研究(8-1)式中的 R 和 Sk 的特性来揭示纹理的细节。这样做显然要困难得多,这也是为什么人们倾向于采用统计 方法的原因。但是,如果 R 和 Sk 有明碓的定义或已知,那么用结构分析的方法就很简单。 按方程(8-1)的观点,可以从两个方面描述纹理。第一个方面用于描述组成纹理的基元; 第二个方面用于描述纹理基元之间的空间联系或相互影响。第一个方面与纹理区域中的影调 基本分布情况(称为影调基元)或局部特性有关。第二个方面与影调基元的空间组织有关。 纹理区域 纹理基元之间 的空间关系 纹理基元 属性 灰度属性 区域属性 其它 极值 平均值 其它 面积 形状 基元区域 空间组织方式 类型 极值 函数的 统计的 结构的 图 8.2 纹理分析方法 影调基元是具有确定影调特性的区域,可以用诸如平均灰度,或区域中的最大和最小灰 度这样的特性来描述。把具有给定影调特性的象素最大程度地连接起来就组成了影调基元, 可以按它的面积和形状来评价影调基元。影调基元不但包括它的灰度而且包括它的影调的区 域特性。 纹理可用纹理基元的数量和类型以及这些基元的空间组织或排列来描述。纹理的空间组 织可能是随机的,也可能一个基元对相邻基元有成对的依赖关系,或者几个基元同时相互关 联。这样的关联可能是结构的、概率的或是函数的。纹理分析的方法可用示意图 8.2 表示。 8.1.3 纹理基元与影调 一个纹理基元(不严格地说)是一个具有一定的不变特性的视觉基元。这些不变特性在 给定区域内的不同位置上,以不同的变形和不同的方向重复出现。纹理基元最基本的不变特 性之一是区域内象素的灰度分布,在更为复杂的情况下可能还有与形状有关的特性,而影调 也是表示灰度的明暗分布。因此,我们认为影调和纹理不是独立的概念,它们之间的关系很 象光波中的粒子性与波动性之间的关系。光在任何时候都有粒子性和波动性,但是根据具体
情况粒子性或是波动性可能占主导地位。相似地,在图象中总存在影调和纹理,只是有时 种特性相对于另一种特性占优势。在实际问题的处理中,为了简便,我们经常倾向于认为只 有影调或只有纹理。因此,当我们定义影调和纹理时,我们不是定义两种概念,而是定义影 调一纹理概念 影调一纹理概念内部的基本关系如下所述:当在图象的一定面积区域中影调基元的变化 很小时,这个区域的主导特性是影调。当在小面积区域中含大量不同的影调,这个区域占主 导的特性是纹理。按这种区分方法,关键点是小面积区域的大小,影调基元的相对大小和类 型以及可区分的影调数量的多少。事实上,当小面积区域小到只有一个分辨率单元大小,以 至只有一种独立的特性时,表现出来的唯一特性就是简单的灰度影调。当小面积区域中可区 分的影调基元数量增加时,纹理特性将占主导。当影调基元中的空间图案是随机的,以及基 元之间的灰度影调的变化范围很广时,这就得到精细的纹理。当空间图案变得较为确定以及 影调区域涉及较多的象素时,就得到粗糙的纹理 图象表现出的影调一纹理特性与图象的分辨率密切相关。因为在纹理基元定义中的一个 重要部分是基元要在给定区域中重复出现,问题是重复多少次?为了定性地回答这个问题, 可以想象把一个近似等于我们视场的窗口迭加到一个很大的纹理区域上。随着这个窗口逐渐 变小,这相当于移动视点逐渐靠近纹理,这时包含在窗口内的纹理越来越少。到某一距离时 窗口内的图象不再出现纹理。如果窗口逐渐增大,这相当于视场逐渐远离图象,也会发生类 似的效果。当增大到某一距离时,纹理细节逐渐模糊,变成连续的影调,当窗口平移时,再 也看不到重复的纹理基元。因此,在定义纹理时需要有合适分辨率的概念。在此合适分辨率 之下,纹理将是明显的,而且随视场在纹理区域内移动时,纹理“看起来是一样的”。通常 合适分辨率并不知道,但必须计算出来。 ConnorsICon8l提出一种通过检查图象中重复的最大 值来计算合适分辨率的方法。 纹理可以是分级的。不同级相应于不同的分辨率。“砖墙”纹理可以说明这样的分级性 质。在某一分辨率之下,可明显看到由砖组成的结构性很强的图象,而分辨率更高时,则可 看到每块砖表面的细致纹理 814纹理研究的领域 纹理研究的领域大致可分成三种类型。第一类是纹理的描述和分类。这类问题在图象识 别中有重要应用,因此已经引起了广泛的重视。例如,在医学图象处理中利用纹理特性来区 别正常细胞和癌细胞。这时,就要先抽取这两种细胞图象的纹理特性,然后进行分类识别。 第二类是以纹理为特征的图象分割。第三类是利用纹理信息推断物体的深度信息或表面方 向 纹理可提供关于可见表面几何结构的重要信息。首先研究这个问题的是 Gibson gib50.6 因为图象本身不能提供求解所需的足够信息,为此要对纹理的几何特性作出假设。 Gibson 假设纹理基元在物体平面上的分布密度是均匀的。他发现这时根据图象中纹理基元密度的梯 度可以确定表面的方向。如图8.3所示,在纹理基元分布均匀的条件下,表面倾斜方向在图 象中的投影就是局部纹理密度变化量大的方向,或者说是垂直于纹理基元分布最均匀的那个 方向。在图83(b)所示的情况下,按后一种方法就是寻找与透视直线等间隔相交的直线方向 (见图8.3(c)。但是, StevensITe。的研究发现在透视投影的条件下纹理密度梯度既取决于 表面方向,又取决于物体的距离和位置。因此纹理基元密度并不是表面方向的良好测量。由 于纹理对恢度表面方向的重要性,所以在这方面已进行了大量研究。详见[Baj76][Wit8l [ Ken 80
162 情况粒子性或是波动性可能占主导地位。相似地,在图象中总存在影调和纹理,只是有时一 种特性相对于另一种特性占优势。在实际问题的处理中,为了简便,我们经常倾向于认为只 有影调或只有纹理。因此,当我们定义影调和纹理时,我们不是定义两种概念,而是定义影 调—纹理概念。 影调—纹理概念内部的基本关系如下所述:当在图象的一定面积区域中影调基元的变化 很小时,这个区域的主导特性是影调。当在小面积区域中含大量不同的影调,这个区域占主 导的特性是纹理。按这种区分方法,关键点是小面积区域的大小,影调基元的相对大小和类 型以及可区分的影调数量的多少。事实上,当小面积区域小到只有一个分辨率单元大小,以 至只有一种独立的特性时,表现出来的唯一特性就是简单的灰度影调。当小面积区域中可区 分的影调基元数量增加时,纹理特性将占主导。当影调基元中的空间图案是随机的,以及基 元之间的灰度影调的变化范围很广时,这就得到精细的纹理。当空间图案变得较为确定以及 影调区域涉及较多的象素时,就得到粗糙的纹理。 图象表现出的影调—纹理特性与图象的分辨率密切相关。因为在纹理基元定义中的一个 重要部分是基元要在给定区域中重复出现,问题是重复多少次?为了定性地回答这个问题, 可以想象把一个近似等于我们视场的窗口迭加到一个很大的纹理区域上。随着这个窗口逐渐 变小,这相当于移动视点逐渐靠近纹理,这时包含在窗口内的纹理越来越少。到某一距离时, 窗口内的图象不再出现纹理。如果窗口逐渐增大,这相当于视场逐渐远离图象,也会发生类 似的效果。当增大到某一距离时,纹理细节逐渐模糊,变成连续的影调,当窗口平移时,再 也看不到重复的纹理基元。因此,在定义纹理时需要有合适分辨率的概念。在此合适分辨率 之下,纹理将是明显的,而且随视场在纹理区域内移动时,纹理“看起来是一样的”。通常 合适分辨率并不知道,但必须计算出来。Connors[Con 81]提出一种通过检查图象中重复的最大 值来计算合适分辨率的方法。 纹理可以是分级的。不同级相应于不同的分辨率。“砖墙”纹理可以说明这样的分级性 质。在某一分辨率之下,可明显看到由砖组成的结构性很强的图象,而分辨率更高时,则可 看到每块砖表面的细致纹理。 8.1.4 纹理研究的领域 纹理研究的领域大致可分成三种类型。第一类是纹理的描述和分类。这类问题在图象识 别中有重要应用,因此已经引起了广泛的重视。例如,在医学图象处理中利用纹理特性来区 别正常细胞和癌细胞。这时,就要先抽取这两种细胞图象的纹理特性,然后进行分类识别。 第二类是以纹理为特征的图象分割。第三类是利用纹理信息推断物体的深度信息或表面方 向。 纹理可提供关于可见表面几何结构的重要信息。首先研究这个问题的是 Gibson[Gib 50, 66]。 因为图象本身不能提供求解所需的足够信息,为此要对纹理的几何特性作出假设。Gibson 假设纹理基元在物体平面上的分布密度是均匀的。他发现这时根据图象中纹理基元密度的梯 度可以确定表面的方向。如图 8.3 所示,在纹理基元分布均匀的条件下,表面倾斜方向在图 象中的投影就是局部纹理密度变化量大的方向,或者说是垂直于纹理基元分布最均匀的那个 方向。在图 8.3(b)所示的情况下,按后一种方法就是寻找与透视直线等间隔相交的直线方向 (见图 8.3(c))。但是,Stevens[Ste 80]的研究发现在透视投影的条件下纹理密度梯度既取决于 表面方向,又取决于物体的距离和位置。因此纹理基元密度并不是表面方向的良好测量。由 于纹理对恢度表面方向的重要性,所以在这方面已进行了大量研究。详见[Baj 76] [Wit 81] [Ken 80]
号 图83根据纹理基元密度梯度恢度表面方向 82人类视觉系统的纹理分割模型 根据已有的证据,人类视觉系统是以图84中所示的方式进行纹理分割的。首先假设, 输入的图象是以并行的方式在多通道中进行处理的。表示输入图象在不同频率范围中特性的 输出向量被用于计算一定面积内的粗细度、对比度和边缘方向。这三个特性是影响聚集 粗细序A1 测量 图象 I(,j) A S=Sx 多通道 边缘方 模型 向测量 逻辑谓 对比度]43 词P 测量 低层特 计算的 性 属性 图84纹理分割的模型 过程的主要因素。多通道模型的输出是一组区域S={Sk},k=1,2,…,m,这些区域是根 据逻辑谓词P对图象I(,j的采样网格X进行分割的结果。逻辑谓词定义了进行聚集的条件。 163
163 图 8.3 根据纹理基元密度梯度恢度表面方向 8.2 人类视觉系统的纹理分割模型 根据已有的证据,人类视觉系统是以图 8.4 中所示的方式进行纹理分割的。首先假设, 输入的图象是以并行的方式在多通道中进行处理的。表示输入图象在不同频率范围中特性的 输出向量被用于计算一定面积内的粗细度、对比度和边缘方向。这三个特性是影响聚集 A1 I(i, j) 低层特 性 图象 逻辑谓 词 P 边缘方 向测量 对比度 测量 粗细度 测量 多通道 模型 A2 A3 S=Sx 计算的 属性 图 8.4 纹理分割的模型 过程的主要因素。多通道模型的输出是一组区域 S = Sk, k = 1, 2, ,m ,这些区域是根 据逻辑谓词 P 对图象 I(I, j)的采样网格 X 进行分割的结果。逻辑谓词定义了进行聚集的条件
按照图8-4所示的模型,纹理分析是一个通用的处理过程,也就是说它与图象内容特定的应 用范围无关,这也符合低层视觉处理的定义。这可能意味着在人类视觉中纹理的辨别是在双 目立体视觉融合以后,发生在大脑皮层 人们可用来描述纹理的性质有,均匀性( Uniformity)、密度( density)、粗细度 ( Coarseness)、粗糙度( roughness、规律性( regularity)、线性度( linearity)、定向性 ( directionality)、方向性( direction)、频率( frequency)和相位( phase)。这些性质的理想 化如图8.5所示。显然,这些性质是相互联系的。虽然,目前还不完全清楚人类视觉系统中 实际应用多少种性质来描述纹理,但可比较有把握地说,上述性质中的大多数并未用到。所 以在图84的模型中仅限于三种性质的量测 人们用来描述纹理最常用的词藻是粗的或细的[am78]。什么是粗的纹理、什么是细的 纹理目前还无精确的定义。粗略地讲,我们通过观察组成图案的纹理基元,如果这些基元的 尺寸较大,或有许多重复的基元,则给人总的印象是粗的。例如,图8.1中的D98和D111 所示的纹理。已有人提出了检测纹理粗、细程度的多通道模型。[she80的做法是在一个小 区域里检査一组不同频率通道的输出,选择其中响应最强的通道。空间频率最低的通道被认 为表示是粗的纹理,那么高空间频率通道就被认为表示细的纹理。由于通道的响应大小不但 由基元的大小,而且由分布规律所决定。所以还需要在一个领域里作出每个通道响应的直方 图曲线[ zucKer75],通过分析这些曲线的特性就能确定纹理的粗细。 (a) Uniformity (b)Density (c) Coarseness (d) Roughness 夏 (e)regularit (f)Linearity = (g) Directionality (h) Direction (i) Frequency (j)Phase 图8.5描述纹理的性质 描述纹理的第二个特性是边缘元素的方向,或斜率。心理物理学的实验研究表明这个特 性非常重要。图8.6(a)中的实验表明了基元斜率对区别纹理的强烈影响。正放的和倾斜的T 形之间很容易区分。L形和正放的T形之间在形状上很不同,但似乎可以聚集成一个区域 图8.6(b中证明了相似的效应。图中包括猫、旋转的猫和猫的镜象。当要求被试验者确定图
164 按照图 8-4 所示的模型,纹理分析是一个通用的处理过程,也就是说它与图象内容特定的应 用范围无关,这也符合低层视觉处理的定义。这可能意味着在人类视觉中纹理的辨别是在双 目立体视觉融合以后,发生在大脑皮层。 人们可用来描述纹理的性质有,均匀性(Uniformity)、密度(density)、粗细度 (Coarseness)、粗糙度(roughness)、规律性(regularity)、线性度(linearity)、定向性 (directionality)、方向性(direction)、频率(frequency)和相位(phase)。这些性质的理想 化如图 8.5 所示。显然,这些性质是相互联系的。虽然,目前还不完全清楚人类视觉系统中 实际应用多少种性质来描述纹理,但可比较有把握地说,上述性质中的大多数并未用到。所 以在图 8.4 的模型中仅限于三种性质的量测。 人们用来描述纹理最常用的词藻是粗的或细的[Tam 78]。什么是粗的纹理、什么是细的 纹理目前还无精确的定义。粗略地讲,我们通过观察组成图案的纹理基元,如果这些基元的 尺寸较大,或有许多重复的基元,则给人总的印象是粗的。例如,图 8.1 中的 D98 和 D111 所示的纹理。已有人提出了检测纹理粗、细程度的多通道模型。[she 80]的做法是在一个小 区域里检查一组不同频率通道的输出,选择其中响应最强的通道。空间频率最低的通道被认 为表示是粗的纹理,那么高空间频率通道就被认为表示细的纹理。由于通道的响应大小不但 由基元的大小,而且由分布规律所决定。所以还需要在一个领域里作出每个通道响应的直方 图曲线[zucKer 75],通过分析这些曲线的特性就能确定纹理的粗细。 图 8.5 描述纹理的性质 描述纹理的第二个特性是边缘元素的方向,或斜率。心理物理学的实验研究表明这个特 性非常重要。图 8.6(a)中的实验表明了基元斜率对区别纹理的强烈影响。正放的和倾斜的 T 形之间很容易区分。L 形和正放的 T 形之间在形状上很不同,但似乎可以聚集成一个区域。 图 8.6(b)中证明了相似的效应。图中包括猫、旋转的猫和猫的镜象。当要求被试验者确定图