1.3 可视化技术 根据Keim and Kriegel(1996,1997),我们将多元数据的可视化 技术分为4类:几何投影方法,基于像素(Pixel-oriented)的可视化 技术,层次化可视化(Hierarchical display)和基于图标方法(Iconog- raphy) 1.3.1几何投影方法 ·寻找将高维数据集在低维空间显示的有效投影和变换方法 ·将数据的属性映射到2D平面(例如散点图)或者任意的空间 (例如平行坐标图) ·这种方法有利于发现异常点和不同维数之间的相关性 ·坐标的展示顺序可能会影响我们的视觉发现, Previous Next First Last Back Forward 6
1.3 可视化技术 根据 Keim and Kriegel (1996, 1997), 我们将多元数据的可视化 技术分为 4 类: 几何投影方法, 基于像素 (Pixel-oriented) 的可视化 技术, 层次化可视化 (Hierarchical display) 和基于图标方法 (Iconography) 1.3.1 几何投影方法 • 寻找将高维数据集在低维空间显示的有效投影和变换方法 • 将数据的属性映射到 2D 平面 (例如散点图) 或者任意的空间 (例如平行坐标图) • 这种方法有利于发现异常点和不同维数之间的相关性 • 坐标的展示顺序可能会影响我们的视觉发现. Previous Next First Last Back Forward 6
·当数据量或者维数较大时可能会出现观测值或者类的重叠,从 而对视觉发现造成困难 Scatter plot ·散点图(scatterplot)用来展示二元离散数据. ·可以适当的扩展,以显示更多的信息或者推广到3维数据 二维数据: Previous Next First Last Back Forward
• 当数据量或者维数较大时可能会出现观测值或者类的重叠, 从 而对视觉发现造成困难 Scatter plot • 散点图 (scatterplot) 用来展示二元离散数据. • 可以适当的扩展, 以显示更多的信息或者推广到 3 维数据 二维数据: Previous Next First Last Back Forward 7
Scatterplot E三ampw Car Previous Next First Last Back Forward F
2 3 4 5 10 15 20 25 30 Scatterplot Example Car Weight Miles Per Gallon 2 3 4 5 10 15 20 25 30 wt mpg Chrysler Imperial Toyota Corolla Fiat 128 Previous Next First Last Back Forward 8
三维数据: US airpollution: amperature,802 and No.of manufacturing enrprise Iris Data ⊙ ⊙ ⊙ 0 5 Previous Next First Last Back Forward 9
三维数据: 45 50 55 60 65 70 75 20 40 60 80 100 US airpollution: temperature, SO2 and No. of manufacturing enterprise Temp SO2 Petal.Length Petal.Width Sepal.Length Iris Data setosa versicolor virginica Previous Next First Last Back Forward 9
Previous Next First Last Back Forward 10
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Previous Next First Last Back Forward 10