T(x)=Ax只是对于K^n这样的标准列向量空间才成立,这里左端和右端的x意义是不太一样的,左端的x表示一个向量,右端的x表示的是左端的x这个向量在K^n的标准基底下的坐标
你应该优先把后面那种表示理解清楚,然后再看上面的特殊形式
比如说T: U->V是两个抽象的线性空间之间的映射,[u_1,...,u_m]是U的基,[v_1,...,v_n]是V的基
那么T[u_1,...,u_m]是[T(u_1),...,T(u_m)]的一个简单记法(注意,整个线性代数就是一套记号体系),从形式上看T[u_1,...,u_m]又可以形式上看作是T和[u_1,...,u_m]的乘积,把这个乘积定义成[T(u_1),...,T(u_m)]
由于T(u_1),...,T(u_m)是V中的向量,可以由v_1,...,v_n来线性表示,也就是说存在一组常数a_{ij}满足
T(u_1)=a_{11}v_1+...+a_{n1}v_n
...
T(u_m)=a_{1m}v_1+...+a_{nm}v_n
形式上讲如果把右端看成矩阵乘法,最容易想到的有两种记法
一种是把T(u_k)和v_k都竖着堆成列向量的形式,大致写成Tu=Av的形式,A是mxn的数量矩阵
另一种是把T(u_k)和v_k都横着排成行向量的形式,大致写成Tu=vA的形式,这里的A是nxm的数量矩阵,和上面的相差一个转置
有多种理由使得我们倾向于后一种写法
在很多时候我们考虑具体的列向量空间V=K^n,如果采用后一种写法那么v=[v_1,...,v_n]就是一个nxn的矩阵,每一列都是K^n的基(确切地说是在K^n的标准基下的坐标),vA可以沿用原来那个nxm的数量矩阵A
然而如果采用前一种写法那么v=[v_1;v_2;...;v_m](我用分号表示换行)是一个(n^2)x1的列向量,这个很长的列向量丢失了V的结构,为了仍然让Av有意义就得不能把A表示成mxn的矩阵,这给使用矩阵乘法带来了困难
从这个比较就可以看出Tu=vA的形式中不论u和v是有抽象向量构成的形式向量,还是由具体的向量拼成的数量矩阵,T的表示矩阵A总可以使用同一种数量矩阵,这种统一使得
T[u_1,...,u_m]=[v_1,...,v_n]A
这种写法更加方便
再比如考虑复合映射T: U->V, S: V->W的时候,
ST[u_1,...,u_m]=S[v_1,...,v_n]A=[w_1,...,w_p]BA
这样ST的表示矩阵就是S和T各自表示矩阵的乘积,另一种写法则没有如此直接的形式
回头看一下最开始说的T(x)=Ax的特殊形式
如果T: K^m->K^n,那么取K^m的标准基u_1,...,u_m,u_k是m阶单位阵的第k列,再取K^n的标准基v_1,...,v_n, v_k是n阶单位阵的第k列,那么u=[u_1,...,u_m]=I_m, v=[v_1,...,v_n]=I_n
Tu=vA说明T的表示矩阵是A,A是nxm的矩阵
然后看T作用到一个具体的向量x上
x=u[x_1;...;x_m]=x_1u_1+...+x_mu_m,这里x_k就是x在u下的坐标,为了区分坐标我们暂时记y=[x_1;...;x_m]
T(x)=T(uy)=(Tu)y=(vA)y=v(Ay)
然后由于u=I_m,v=I_n,事实上就有T(x)=Ay,然而y这个记号是为了区别x这个向量本身和它在u下的坐标而引进的,从数值上将x和y的分量都一样,这样就得到T(x)=Ax
也就是说从T[u_1,...,u_m]=[v_1,...,v_n]A这个形式出发是可以推导出T(x)=Ax这样的特殊形式的(当然你必须搞清楚所有的概念),但是反过去推导(从特殊到一般)就不可能了,因为这里u=I_m和v=I_n都太特殊了
你如果学到特征值的话也要把Ax=xλ理解成A限制在由x张成的子空间上的映射的表示矩阵是λ,这远比Ax=λx这种常见的形式有用,并且Ax=xλ符合一般矩阵乘法规则,可以推广到高维不变子空间,但Ax=λx右端只能看成数乘,不利于推广,这也反映出刚才讲的那种表示形式的优点