当前位置:文档之家› 矩阵变换的解释

矩阵变换的解释

1.1 三維旋轉矩陣實用算法3D数学---- 矩阵和线性变换一般来说,方阵能描述任意线性变换。

线性变换保留了直线和平行线,但原点没有移动。

线性变换保留直线的同时,其他的几何性质如长度、角度、面积和体积可能被变换改变了。

从非技术意义上说,线性变换可能“拉伸”坐标系,但不会“弯曲”或“卷折”坐标系。

矩阵是怎样变换向量的向量在几何上能被解释成一系列与轴平行的位移,一般来说,任意向量v都能写成“扩展”形式:另一种略有差别的形式为:注意右边的单位向量就是x,y,z轴,这里只是将概念数学化,向量的每个坐标都表明了平行于相应坐标轴的有向位移。

让我们将上面的向量和重写一遍,这次分别将p、q、r定义为指向+x,+y和+z方向的单位向量,如下所示:v = x p + y q + z r现在,向量v就被表示成向量p,q,r的线性变换了,向量p,q,r称作基向量。

这里基向量是笛卡尔坐标轴,但事实上,一个坐标系能用任意3个基向量定义,当然这三个基向量要线性无关(也就是不在同一平面上)。

以p、q、r为行构建一个3 x 3矩阵M,可得到如下矩阵:用一个向量乘以该矩阵,得到:如果把矩阵的行解释为坐标系的基向量,那么乘以该矩阵就相当于执行了一次坐标转换,如果aM=b,我们就可以说,M将a转换到b。

从这点看,术语“转换”和“乘法”是等价的。

坦率地说,矩阵并不神秘,它只是用一种紧凑的方式来表达坐标转换所需的数**算。

进一步,用线性代数操作矩阵,是一种进行简单转换或导出更复杂转换的简便方法。

矩阵的形式:基向量[1, 0, 0], [0, 1, 0], [0, 0, 1]乘以任意矩阵M:用基向量[1, 0, 0]乘以M时,结果是M的第1行。

其他两行也有同样的结果,这是一个关键的发现:矩阵的每一行都能解释为转换后的基向量。

这个强有力的概念有两条重要性质:1、有了一种简单的方法来形象化解释矩阵所代表的变换。

2、有了反向建立矩阵的可能---- 给出一个期望的变换(如旋转、缩放等),能够构造一个矩阵代表此变换。

我们所要做的一切就是计算基向量的变换,然后将变换后的基向量填入矩阵。

首先来看看2D例子,一个2 x 2矩阵:这个矩阵代表的变换是什么?首先,从矩阵中抽出基向量p和q:p = [2 1]q = [-1 2]图7.1以“原”基向量(x轴,y轴)为参考,在笛卡尔平面中展示了这些向量。

、如图7.1所示,x基向量变换至上面的p向量,y基向量变换至q向量。

所以2D中想象矩阵的方法就是想象由行向量构成的“L”形状。

这个例子中,能够很清楚的看到,M代表的部分变换是逆时针旋转26度。

当然,所有向量都被线性变换所影响,不只是基向量,从“L”形状能够得到变换最直观的印象,把基向量构成的整个2D平行四边形画完整有助于进一步看到变换对其他向量的影响,如图7.2所示:平行四边形称作“偏转盒”,在盒子中画一个物体有助于理解,如图7.3 所示:很明显,矩阵M不仅旋转坐标系,还会拉伸它。

这种技术也能应用到3D转换中。

2D中有两个基向量,构成"L"型;3D中有三个基向量,它们形成一个”三脚架“。

首先,让我们展示出一个转换前的物品。

图7.4展示了一个茶壶,一个立方体。

基向量在”单位“向量处。

(为了不使图形混乱,没有标出z轴基向量[0, 0, 1],它被茶壶和立方体挡住了。

)现在,考虑以下3D变换矩阵:从矩阵的行中抽出基向量,能想象出该矩阵所代表的变换。

变换后的基向量、立方体、茶壶如图7.5所示:这个变换包含z轴顺时针旋转45度和不规则缩放,使得茶壶比以前”高“。

注意,变换并没有影响到z 轴,因为矩阵的第三行是[0, 0 , 1]。

我们可以通过让比例因子k按比例放大或缩小来缩放物体。

如果在各方向应用同比例的缩放,并且沿原点“膨胀”物体,那么就是均匀缩放。

均匀缩放可以保持物体的角度和比例不变。

如果长度增加或减小因子k,则面积增加或减小k^2。

在3D中,体积将增加或减小k^3。

如果需要“挤压”或"拉伸"物体,在不同的方向应用不同的因子即可,这称作非均匀缩放。

非均匀缩放时,物体角度将发生变化。

视各方向缩放因子的不同,长度、面积、体积的变化因子也各不相同。

如果|k|<1,物体将“变短”;如果|k|>1,物体将“变长”,如果k = 0,就是正交投影,如果k < 0就是镜像。

应用非均匀缩放的效果类似于切变,事实上,非均匀缩放和切变和很难区分的。

沿坐标轴的缩放最简单的缩放方法是沿着每个坐标轴应用单独的缩放因子,缩放是沿着垂直的轴(2D中)或平面(3D 中)进行的。

如果每个轴的缩放因子相同,就是均匀缩放,否则是非均匀缩放。

2D中有两个不同的缩放因子,Kx和Ky,图8.13展示了应用不同缩放因子后的情况。

凭直觉就可知道,基向量p,q由相应的缩放因子单独影响:p' = Kx p = Kx [1 0] = [Kx 0]q' = Ky q = Ky [0 1] = [0 Ky]用基向量构造矩阵,结果如公式8.6所示:对于3D,需要增加第三个缩放因子Kz,3D缩放矩阵如公式8.7所示:沿任意方向缩放我们可以不依赖于坐标系而沿任意方向进行缩放,设n为平行于缩放方向的单位向量,k为缩放因子,缩放沿穿过原点并平行于n的直线(2D中)或平面(3D中)进行。

我们需要推导出一个表达式,给定向量v,可以通过v,n和k来计算v'。

为了做到这一点,将v分解为两个分量,v|| 和v⊥,分别平行于n和垂直于n,并满足v =v|| + v⊥。

v||是v在n上的投影,由(v . n)n可以得到v||。

因为v⊥垂直于n,它不会被缩放操作影响。

因此,v' = v||' + v⊥,剩下的问题就是怎样得到v||'。

由于v||平行于缩放方向,v||'可以由公式k v|| 得出,如图8.14所示:总结已知向量并进行代换,得到:既然我们知道了怎样对任意向量进行缩放,当然也就可以计算缩放后的基向量。

这里只详细列出2D 中的一个基向量的求法,其余的基向量依次类推。

我们只给出其结果(注意下面采用列向量形式只是为了使等式的形式好看一些。

)通过基向量构造矩阵,得到以单位向量n为缩放方向,k为因子的缩放矩阵,如公式8.8所示:3D中,基向量为:以单位向量n为缩放方向,k为因子的3D缩放矩阵如公式8.9所示:一般来说,投影意味着降维操作,有一种投影方法是在某个方向上用0作为缩放因子。

这种情况下,所有点都被拉平至垂直的轴(2D)或平面(3D)上。

这种类型的投影称作正交投影(或者平行投影),因为从原来的点到投影点的直线相互平行。

向坐标轴或平面投影最简单的投影方式是向坐标轴(2D)或平面(3D)投影,如图8.15所示:向坐标轴或平面投影在实际变换中不常发生,大多数情况是向低维的变换赋值,且要抛弃维数时。

例如,将3D点赋值给2D点,抛弃z分量,只复制x和y。

通过使垂直方向上的缩放因子为零,就能向坐标轴或平面投影。

考虑到完整性,下面列出这些变换矩阵,见公式8.10 - 8.14。

向任意直线或平面投影也能向任意直线或平面投影,像往常一样,由于不考虑平移,这些直线或平面必须通过原点。

投影由垂直于直线或平面的单位向量n定义。

通过使该方向的缩放因子为0能够导出向任意方向投影的矩阵,2D中的情况如公式8.15所示:记住这里n垂直于投影直线,而不是平行。

3D中,向垂直于n的平面投影的矩阵如公式8.16所示:镜像镜像(也叫做反射)是一种变换,其作用是将物体沿直线(2D中)或平面(3D中)“翻折”,图8.16展示了镜像的效果。

使缩放因子为-1能够很容易地实现镜像变换,设n为2D单位向量,公式8.17所示的矩阵将沿通过原点且垂直于n的反射轴来进行镜像变换。

3D中,用反射平面代替直线。

公式8.18中的矩阵将沿通过原点且垂直于n的平面来进行镜像变换:注意一个物体只能“镜像”一次,如果再次镜像(当沿不同的轴或平面的时候),物体将翻回“正面”(用一张纸来想象),这和在原位置旋转物体的效果一样。

切变切变是一种坐标系“扭曲”变换,非均匀地拉伸它。

切变的时候角度会发生变化,但令人惊奇的是面积和体积却保持不变。

基本思想是将某一坐标的乘积加到另一个上。

例如,2D中将y乘以某个因子然后加到x上,得到x' = x + sy,如图8.17所示:实现这个切变变换的矩阵为:变换的组合设想世界中有一个任意方向、任意位置的物体,我们要把它渲染到任意方向、任意位置的摄像机中。

为了做到这一点,必须将物体的所有顶点从物体坐标系变换到世界坐标系,接着再从世界坐标系变换到摄像机坐标系。

其中的数学变换总结如下:矩阵乘法满足结合律,所以我们能用一个矩阵直接从物体坐标系变换到摄像机坐标系:这样就能在渲染的循环外先将所有矩阵组合起来,使循环内作矩阵乘法的时候只需要和一个矩阵相乘即可(物体有很多顶点,省一次矩阵乘法就会提高不少效率),如下:所以矩阵组合从代数角度看是利用了矩阵乘法的结合律。

矩阵的行向量就是变换后的基向量,这在多个变换的情况下也是成立的。

考虑矩阵乘法AB,结果中的每一行都是A中相应的行与矩阵B相乘的结果。

换言之,设a1, a2, a3为A的行,矩阵乘法能够写为:这使得结论更加清晰,AB结果中的行向量确实是对A的基向量进行B变换的结果。

变换分类变换的类别并不是互斥的,也不存在一定的“次序”或“层次”使得某一类比另一类多或少一些限制。

当讨论一般意义上的变换时,我们将使用类似的术语:映射或函数。

在最一般的意义上,映射就是一种简单的规则,接受输入,产生输出。

我们把从a到b的F映射记作F(a) = b。

线性变换在数学上,如果满足下式,那么映射F(a)就是线性的:F(a + b) = F(a) + F(b) 以及F(k a) = k F(a)如果映射F保持了基本运算:加法和数量乘,那么就可以称该映射为线性的。

在这种情况下,将两个向量相加然后再进行变换得到的结果和先分别进行变换再将变换后的向量相加得到的结果相同。

同样,将一个向量数量乘再进行变换和先进行变换再数量乘的结果也是一样的。

这个线性变换的定义有两条重要的引理:(1) 映射F(a) = aM,当M为任意方阵时,说映是一个线性变换,这是因为:F(a + b) = (a + b)M = aM + bM = F(a) + F(b)和F(k a) = (k a)M = k(aM) = k F(a)(2) 零向量的任意线性变换的结果仍然是零向量。

(如果F(0) = a,a≠0。

那么F不可能是线性变换。

因为F(k0) = a,但F(k0) ≠ k F(0)),因此线性变换不会导致平移(原点位置上不会变化)。

在某些文献中,线性变换的定义是平行线变换后仍然是平行线。

相关主题