科数网
学习首页
高中数学
高等数学
线性代数
概率统计
实变函数
复变函数
离散数学
数论
群论
大学物理
公式
高中数学公式
高等数学公式
线性代数公式
概率论公式
初中数学公式
关于
高中
高数
线性
概率
公式
高中数学公式
高等数学公式
线性代数公式
概率论公式
初中数学公式
游客,
登录
注册
在线学习
线性代数
序言
最后
更新:
2024-04-22 07:27
●
参与者
查看:
175
次
纠错
分享
评论
参与项目
序言
## 序言 ### 线性代数用来干什么的 线性代数用来干什么的,说起来很简单,就是解方程。有许多同学感觉,线性代数太难了,或者说太抽象了,这是因为,线性代数的学习方法和高等数学完全不一样,也就是说你学习线性代数首先你得换学习思想,它完全是一套全新的学习思想。 更直白点:(1)高等数学(微积分)是先学习一个知识点,然后通过大量做题就能学会。(2)线性代数则相反,必须理解他的概念,至于题目,做一道和做十道没有本质的区别。比如矩阵初等变换,你会一个三阶行列式后,后面的四阶、五阶、六阶理论上你就都会了,相反,如果你三阶的你不理解其中的概念,你做再多的四阶、五阶、六阶初等变化都没用。 ### 线性代数本质是解方程 线性代数的本质是解方程,而这里的方程其实就值研究两类:一次方程和二次方程。 ### 一次方程 在初中,我们就会解方程,例如 $$ \left\{\begin{array}{l} x+y=3 \\ x-y=1 \end{array}\right. $$ 这有啥好研究的?这是因为,这是只有2个未知量方程,但是现实生活中可能需要解成百上千个方程,例如预测天气预报,估算导弹飞行路程。 美国学者David C. Lay 在《线性代数及其应用》书就介绍一个小故事:1949 年夏末, 哈佛大学教授列昂惕夫研究美国经济时,他从美国劳动统计局获得了25 万多条信息. 列昂惕夫把美国经济分解为 500 个部门, 例如煤炭工业、汽车工业、交通系统,等等,对每个部门,他写出了一个描述该部门的产出如何分配给其他经济部门的线性方程.最后得到了一个包含 500 个未知数的 500 个方程的方程组,如何解这个方程?至少当时是无法解,由此促使数学家来研究解方程。 典型的一次方程形式如下: $$ \left\{\begin{array}{c} a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n=b_1 \\ \vdots \\ a_{i 1} x_1+\cdots+a_{i i} x_i+\cdots+a_{i n} x_n=b_i \\ \vdots \\ a_{n 1} x_1+a_{n 2} x_2+\cdots+a_{n n} x_n=b_n \end{array}\right. $$ 在《线性代数》这么课里,为了研究解一次方程,引入了行列式,引入了矩阵,进而又引入了伴随矩阵,矩阵的秩,引入了线性相关与线性无关等概念相关,最终目的都是为了解一次方程。 ### 二次方程 为了研究二次方程,引入了标准型,二次型分为标准二次型和不标准二次型,这两者的区别在哪,就是它们对应的矩阵不一样,这其中有一个问题就是我们要把非标准化成标准,这个时候本质上需要做一件事,就是把矩阵从不对角变成对角,这个时候你为了完成这个任务你就必须准备一套理论,这套理论就是特征值,特征向量这套理论,这条理论我是非常喜欢的,为什么呢,因为它非常的深刻。 二次型是变量的二次乘积项的和,类似于 $a x^2+b x y+c y^2$ 的多项式子,一般包括两个变量乘积项和一个变量平方两种形式。二次型是个函数,如上式可以写成 $f(x, y)=a x^2+b x y+c y^2$ 的等式形式。 **有人疑惑: 这个多项式不是线性函数啊,这二次型和线性代数有什么关系?** 如果我们把函数 $f(x, y)=a x^2+b x y+c y^2$ 的自变量换一下, 把单变量 $x 、 y$ 合成一个变向量那么再引入矩阵,原二元二次函数就可以改写成一元二次向量函数: $$ f(x)=\left(\begin{array}{ll} x & y \end{array}\right)\left[\begin{array}{cc} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right]\left(\begin{array}{l} x \\ y \end{array}\right) $$ 是不是很熟悉,这就是把二次项转换为了矩阵的运算,**上面研究的矩阵的性质和那套理论就可以应用到二次型上**。 #### 计算复杂矩阵 利用线性代数,可以计算复杂矩阵,例如 已知矩阵 $\boldsymbol{A}=\left(\begin{array}{ccc}0 & -1 & 1 \\ 2 & -3 & 0 \\ 0 & 0 & 0\end{array}\right)$. 求 $\boldsymbol{A}^{99}$. 解: 要求 $A^{99}$ ,不就是求 99 个 $\mathrm{A}$ 相乘吗? 这又不难 (至少理论上是,一个个相乘吧),现在有计算机了,计算确实不难,但是在没有计算机的年代,要计算99个A相乘,只能说 "看上去很美 ",大概率,你是做不出来的,或者很容易出错的。 因此,数学家重要想办法,到底有没有更简便的方法来计算这个矩阵。 解 (I) 计算 $\boldsymbol{A}$ 的特征多项式 $|\lambda \boldsymbol{E}-\boldsymbol{A}|$. $$ |\lambda \boldsymbol{E}-\boldsymbol{A}|=\left|\begin{array}{ccc} \lambda & 1 & -1 \\ -2 & \lambda+3 & 0 \\ 0 & 0 & \lambda \end{array}\right| {\text { 按第三行展开 }} \lambda\left(\lambda^2+3 \lambda+2\right)=\lambda(\lambda+1)(\lambda+2) . $$ 因此, $\boldsymbol{A}$ 有 3 个不同的特征值: $-2,-1,0$. 由于属于不同特征值的特征向量线性无关, 故 $\boldsymbol{A}$ 有 3 个线性无关的特征向量, $\boldsymbol{A}$ 相似于对角矩阵 $\left(\begin{array}{ccc}-2 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0\end{array}\right)$. 分别计算 $\boldsymbol{A}$ 的属于特征值 $-2,-1,0$ 的特征向量. 当 $\lambda=-2$ 时, 解 $(-2 \boldsymbol{E}-\boldsymbol{A}) \boldsymbol{x}=\mathbf{0}$. 由于 $$ -2 \boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{ccc} -2 & 1 & -1 \\ -2 & 1 & 0 \\ 0 & 0 & -2 \end{array}\right) \rightarrow\left(\begin{array}{ccc} -2 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array}\right), $$ 故 $(1,2,0)^{\mathrm{T}}$ 为 $\boldsymbol{A}$ 的属于特征值 -2 的一个特征向量. 当 $\lambda=-1$ 时, 解 $(-\boldsymbol{E}-\boldsymbol{A}) \boldsymbol{x}=0$. 由于 $$ -\boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{ccc} -1 & 1 & -1 \\ -2 & 2 & 0 \\ 0 & 0 & -1 \end{array}\right) \rightarrow\left(\begin{array}{ccc} -1 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array}\right), $$ 故 $(1,1,0)^{\mathrm{T}}$ 为 $\boldsymbol{A}$ 的属于特征值 -1 的一个特征向量. 当 $\lambda=0$ 时, 解 $(0 \boldsymbol{E}-\boldsymbol{A}) \boldsymbol{x}=\mathbf{0}$. 由于 $$ 0 \boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{ccc} 0 & 1 & -1 \\ -2 & 3 & 0 \\ 0 & 0 & 0 \end{array}\right) $$ 故 $(3,2,2)^{\mathrm{T}}$ 为 $\boldsymbol{A}$ 的属于特征值 0 的一个特征向量. 令 $\boldsymbol{P}=\left(\begin{array}{lll}1 & 1 & 3 \\ 2 & 1 & 2 \\ 0 & 0 & 2\end{array}\right)$, 则 $\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\left(\begin{array}{ccc}-2 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0\end{array}\right)$. 计算 $P^{-1}$ 得, $P^{-1}=\left(\begin{array}{ccc}-1 & 1 & \frac{1}{2} \\ 2 & -1 & -2 \\ 0 & 0 & \frac{1}{2}\end{array}\right)$. $$ \begin{aligned} \boldsymbol{A}^{99} & =\boldsymbol{P}\left(\begin{array}{ccc} (-2)^{99} & 0 & 0 \\ 0 & (-1)^{99} & 0 \\ 0 & 0 & 0 \end{array}\right) \boldsymbol{P}^{-1}=\left(\begin{array}{lll} 1 & 1 & 3 \\ 2 & 1 & 2 \\ 0 & 0 & 2 \end{array}\right)\left(\begin{array}{ccc} -2^{99} & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0 \end{array}\right)\left(\begin{array}{ccc} -1 & 1 & \frac{1}{2} \\ 2 & -1 & -2 \\ 0 & 0 & \frac{1}{2} \end{array}\right) \\ & =\left(\begin{array}{ccc} 2^{99}-2 & 1-2^{99} & 2-2^{98} \\ 2^{100}-2 & 1-2^{100} & 2-2^{99} \\ 0 & 0 & 0 \end{array}\right) . \end{aligned} $$ 这就是说,特征值,特征向量,方程组的解,基础解系,对角型,使用这几个概念互相配合, **竟然把一个矩阵要算99次的超大“工作”量,转换为了其矩阵元素的指数次方。** 工作量大大的降低。 #### 数学服务于物理 我们说数学是为物理服务的,因为你要知道在物理里,有大量二次运算,比如牛顿加速度运动定律 $m v^2 / 2$ ,电压电流 $U=I R ,$ 万有引力定律等等都是二次的。 #### 数学服务于几何 从几何上看,更要研究二次型 在中学的几何中我们学过,对于一元二次函数 $f(x)=a x^2$ 在二维平面上看我们有非常清晰的几何图形: 他就是过原点的抛物线: $a>0$ 开口向上, $a<0$ 开口向下, $a=0$ ,抛物线蜕化成直线 $x$ 轴。 ![图片](/uploads/2024-04/fdc979.jpg) 那么对于函数 $f(x)=a x^2+b x+c$ 图形呢? 我们依然清哳地知道, 他还是一个抛物线图像,只不过在横轴和纵轴方向上同时进行了平移,但图形趋势仍然相同。因为可以把它经过配方得到上面的形式: $f(x)=a x^2+b x+c=a\left(x+\frac{b}{2 a}\right)^2+\left(c-\frac{b^2}{4 a}\right)$ 所以,一个多项式的图像,是由最高次幂决定的,后面低次幂仅是对图像上下左右进行变化。 到这里我们有一个小小的初步结论, 就是函数的几何图形是合同的, **合同的意思是它们经过平移后图形会完全重合**。 既然是这样,如果是要考察几何图形性质的话,对于 $f(x)=a x^2+b x+c$ 类的函数我们只要考察 $f(x)=a x^2$ 的形式就可以了。这样可以简化运算,换句话说, 我们只需研究透了这个二次函数的性质,就能得到整体的性质 (这也可以认为是坐标映射)。 再如二元函数 $f(x, y)=a x^2+c y^2$ 的图形在三维空间中观看是鞍马面,我们大致能推断 $f(x)=a x^2+b x y+c y^2+d$ 函数图形经过旋转平移等应该和它 "长" 的类似。 ![图片](/uploads/2024-04/73bf94.jpg) ## 线性空间转换 正如一元二次方程 $ax^2+bx+c=0$ 一样,如果从解方程的角度看,他是解二次方程,但是如果从二次函数的视角看,他是一个抛物线。同样一个代数式,不同的视角会赋予不同的含义,最终会殊途同归。 在上面介绍线性代数里,是从解方程的角度看待线性代数,目前主流观点是从线性空间理解线性代数,最著名的就是 3Blue1Brown 发布的系列视频,详见 [https://www.bilibili.com/video/BV1ys411472E](https://www.bilibili.com/video/BV1ys411472E) 例如对于矩阵变换 ![图片](/uploads/2024-04/8293ce.jpg){width=300px} 在此基下,完成了镜面反转这个线性变换: ![图片](/uploads/2024-04/87096c.jpg){width=300px} 理解这种思维最简单的方式就是:爱因斯坦相对论说的时空弯曲:同样一个物体,在不同坐标系下展现出不同的坐标方式。 对于初学者,使用线性空间角度学习线性代数是好的,因为他方便理解各种观念(比如,矩阵的加法、减法、乘法和逆矩阵)的物理意义。 但是,如果想更深入的理解线性代数,建议还是从方程/多项式的意义理解。
上一篇:
没有了
下一篇:
线性代数的意义
本文对您是否有用?
有用
(
0
)
无用
(
0
)
0
条评论
写评论
更多笔记
提交评论