线性变换T(x)=Ax,矩阵A左乘向量,那为何在基变换中,往往是T(e1.en)=(e1.en)A.A右乘,有何区别?

1个回答

  • T(x)=Ax只是对于K^n这样的标准列向量空间才成立,这里左端和右端的x意义是不太一样的,左端的x表示一个向量,右端的x表示的是左端的x这个向量在K^n的标准基底下的坐标

    你应该优先把后面那种表示理解清楚,然后再看上面的特殊形式

    比如说T: U->V是两个抽象的线性空间之间的映射,[u_1,...,u_m]是U的基,[v_1,...,v_n]是V的基

    那么T[u_1,...,u_m]是[T(u_1),...,T(u_m)]的一个简单记法(注意,整个线性代数就是一套记号体系),从形式上看T[u_1,...,u_m]又可以形式上看作是T和[u_1,...,u_m]的乘积,把这个乘积定义成[T(u_1),...,T(u_m)]

    由于T(u_1),...,T(u_m)是V中的向量,可以由v_1,...,v_n来线性表示,也就是说存在一组常数a_{ij}满足

    T(u_1)=a_{11}v_1+...+a_{n1}v_n

    ...

    T(u_m)=a_{1m}v_1+...+a_{nm}v_n

    形式上讲如果把右端看成矩阵乘法,最容易想到的有两种记法

    一种是把T(u_k)和v_k都竖着堆成列向量的形式,大致写成Tu=Av的形式,A是mxn的数量矩阵

    另一种是把T(u_k)和v_k都横着排成行向量的形式,大致写成Tu=vA的形式,这里的A是nxm的数量矩阵,和上面的相差一个转置

    有多种理由使得我们倾向于后一种写法

    在很多时候我们考虑具体的列向量空间V=K^n,如果采用后一种写法那么v=[v_1,...,v_n]就是一个nxn的矩阵,每一列都是K^n的基(确切地说是在K^n的标准基下的坐标),vA可以沿用原来那个nxm的数量矩阵A

    然而如果采用前一种写法那么v=[v_1;v_2;...;v_m](我用分号表示换行)是一个(n^2)x1的列向量,这个很长的列向量丢失了V的结构,为了仍然让Av有意义就得不能把A表示成mxn的矩阵,这给使用矩阵乘法带来了困难

    从这个比较就可以看出Tu=vA的形式中不论u和v是有抽象向量构成的形式向量,还是由具体的向量拼成的数量矩阵,T的表示矩阵A总可以使用同一种数量矩阵,这种统一使得

    T[u_1,...,u_m]=[v_1,...,v_n]A

    这种写法更加方便

    再比如考虑复合映射T: U->V, S: V->W的时候,

    ST[u_1,...,u_m]=S[v_1,...,v_n]A=[w_1,...,w_p]BA

    这样ST的表示矩阵就是S和T各自表示矩阵的乘积,另一种写法则没有如此直接的形式

    回头看一下最开始说的T(x)=Ax的特殊形式

    如果T: K^m->K^n,那么取K^m的标准基u_1,...,u_m,u_k是m阶单位阵的第k列,再取K^n的标准基v_1,...,v_n, v_k是n阶单位阵的第k列,那么u=[u_1,...,u_m]=I_m, v=[v_1,...,v_n]=I_n

    Tu=vA说明T的表示矩阵是A,A是nxm的矩阵

    然后看T作用到一个具体的向量x上

    x=u[x_1;...;x_m]=x_1u_1+...+x_mu_m,这里x_k就是x在u下的坐标,为了区分坐标我们暂时记y=[x_1;...;x_m]

    T(x)=T(uy)=(Tu)y=(vA)y=v(Ay)

    然后由于u=I_m,v=I_n,事实上就有T(x)=Ay,然而y这个记号是为了区别x这个向量本身和它在u下的坐标而引进的,从数值上将x和y的分量都一样,这样就得到T(x)=Ax

    也就是说从T[u_1,...,u_m]=[v_1,...,v_n]A这个形式出发是可以推导出T(x)=Ax这样的特殊形式的(当然你必须搞清楚所有的概念),但是反过去推导(从特殊到一般)就不可能了,因为这里u=I_m和v=I_n都太特殊了

    你如果学到特征值的话也要把Ax=xλ理解成A限制在由x张成的子空间上的映射的表示矩阵是λ,这远比Ax=λx这种常见的形式有用,并且Ax=xλ符合一般矩阵乘法规则,可以推广到高维不变子空间,但Ax=λx右端只能看成数乘,不利于推广,这也反映出刚才讲的那种表示形式的优点