科数网
题库
在线学习
高中数学
高等数学
线性代数
概率统计
数学分析
复变函数
离散数学
实变函数
数论
群论
高中物理
词条搜索
科数
试题
高中数学
高数
线代
more
你好
游客,
登录
注册
在线学习
线性代数
引言 线性代数的意义
序言 线性代数用来干什么的
最后
更新:
2025-03-15 07:42
查看:
375
次
高考专区
考研专区
公式专区
刷题专区
词条搜索
序言 线性代数用来干什么的
## 序言 ### 线性代数用来干什么的 线性代数用来干什么的,说起来很简单,就是解方程。有许多同学感觉,线性代数太难了,或者说太抽象了,这是因为,线性代数的学习方法和高等数学完全不一样,也就是说你学习线性代数首先你得换学习思想,它完全是一套全新的学习思想。 更直白点:(1)高等数学(微积分)是先学习一个知识点,然后通过大量做题就能学会。(2)线性代数则相反,必须理解他的概念,至于题目,做一道和做十道没有本质的区别。比如矩阵初等变换,你会一个三阶行列式后,后面的四阶、五阶、六阶理论上你就都会了,相反,如果你三阶的你不理解其中的概念,你做再多的四阶、五阶、六阶初等变化都没用。 ### 线性代数本质是解方程 线性代数的本质是解方程,而这里的方程其实就值研究两类:一次方程和二次方程。 ### 一次方程 在初中,我们就会解方程,例如 $$ \left\{\begin{array}{l} x+y=3 \\ x-y=1 \end{array}\right. $$ 这有啥好研究的?这是因为,这是只有2个未知量方程,但是现实生活中可能需要解成百上千个方程,例如预测天气预报,估算导弹飞行路程。 美国学者David C. Lay 在《线性代数及其应用》书就介绍一个小故事:1949 年夏末, 哈佛大学教授列昂惕夫研究美国经济时,他从美国劳动统计局获得了25 万多条信息. 列昂惕夫把美国经济分解为 500 个部门, 例如煤炭工业、汽车工业、交通系统,等等,对每个部门,他写出了一个描述该部门的产出如何分配给其他经济部门的线性方程.最后得到了一个包含 500 个未知数的 500 个方程的方程组,如何解这个方程?至少当时是无法解,由此促使数学家来研究解方程。 典型的一次方程形式如下: $$ \left\{\begin{array}{c} a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n=b_1 \\ \vdots \\ a_{i 1} x_1+\cdots+a_{i i} x_i+\cdots+a_{i n} x_n=b_i \\ \vdots \\ a_{n 1} x_1+a_{n 2} x_2+\cdots+a_{n n} x_n=b_n \end{array}\right. $$ 在《线性代数》这么课里,为了研究解一次方程,引入了行列式,引入了矩阵,进而又引入了伴随矩阵,矩阵的秩,引入了线性相关与线性无关等概念相关,最终目的都是为了解一次方程。 > 在 [附录1:线性方程组、行列式、矩阵、向量组的关系](https://kb.kmath.cn/kbase/detail.aspx?id=1234) 我们从上帝的视角,来一次性概括一次函数要解决的问题。 ### 二次方程 为了研究二次方程,引入了标准型,二次型分为标准二次型和不标准二次型,这两者的区别在哪,就是它们对应的矩阵不一样,这其中有一个问题就是我们要把非标准化成标准,这个时候本质上需要做一件事,就是把矩阵从不对角变成对角,这个时候你为了完成这个任务你就必须准备一套理论,这套理论就是特征值,特征向量这套理论,这条理论我是非常喜欢的,为什么呢,因为它非常的深刻。 二次型是变量的二次乘积项的和,类似于 $a x^2+b x y+c y^2$ 的多项式子,一般包括两个变量乘积项和一个变量平方两种形式。二次型是个函数,如上式可以写成 $f(x, y)=a x^2+b x y+c y^2$ 的等式形式。 **有人疑惑: 这个多项式不是线性函数啊,这二次型和线性代数有什么关系?** 如果我们把函数 $f(x, y)=a x^2+b x y+c y^2$ 的自变量换一下, 把单变量 $x 、 y$ 合成一个变向量那么再引入矩阵,原二元二次函数就可以改写成一元二次向量函数: $$ f(x)=\left(\begin{array}{ll} x & y \end{array}\right)\left[\begin{array}{cc} a & \frac{b}{2} \\ \frac{b}{2} & c \end{array}\right]\left(\begin{array}{l} x \\ y \end{array}\right) $$ 是不是很熟悉,这就是把二次项转换为了矩阵的运算,**上面研究的矩阵的性质和那套理论就可以应用到二次型上**。 #### 计算复杂矩阵 利用线性代数,可以计算复杂矩阵,例如 已知矩阵 $\boldsymbol{A}=\left(\begin{array}{ccc}0 & -1 & 1 \\ 2 & -3 & 0 \\ 0 & 0 & 0\end{array}\right)$. 求 $\boldsymbol{A}^{99}$. 解: 要求 $A^{99}$ ,不就是求 99 个 $\mathrm{A}$ 相乘吗? 这又不难 (至少理论上是,一个个相乘吧),现在有计算机了,计算确实不难,但是在没有计算机的年代,要计算99个A相乘,只能说 "看上去很美 ",大概率,你是做不出来的,或者很容易出错的。 因此,数学家重要想办法,到底有没有更简便的方法来计算这个矩阵。 解 (I) 计算 $\boldsymbol{A}$ 的特征多项式 $|\lambda \boldsymbol{E}-\boldsymbol{A}|$. $$ |\lambda \boldsymbol{E}-\boldsymbol{A}|=\left|\begin{array}{ccc} \lambda & 1 & -1 \\ -2 & \lambda+3 & 0 \\ 0 & 0 & \lambda \end{array}\right| {\text { 按第三行展开 }} \lambda\left(\lambda^2+3 \lambda+2\right)=\lambda(\lambda+1)(\lambda+2) . $$ 因此, $\boldsymbol{A}$ 有 3 个不同的特征值: $-2,-1,0$. 由于属于不同特征值的特征向量线性无关, 故 $\boldsymbol{A}$ 有 3 个线性无关的特征向量, $\boldsymbol{A}$ 相似于对角矩阵 $\left(\begin{array}{ccc}-2 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0\end{array}\right)$. 分别计算 $\boldsymbol{A}$ 的属于特征值 $-2,-1,0$ 的特征向量. 当 $\lambda=-2$ 时, 解 $(-2 \boldsymbol{E}-\boldsymbol{A}) \boldsymbol{x}=\mathbf{0}$. 由于 $$ -2 \boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{ccc} -2 & 1 & -1 \\ -2 & 1 & 0 \\ 0 & 0 & -2 \end{array}\right) \rightarrow\left(\begin{array}{ccc} -2 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array}\right), $$ 故 $(1,2,0)^{\mathrm{T}}$ 为 $\boldsymbol{A}$ 的属于特征值 -2 的一个特征向量. 当 $\lambda=-1$ 时, 解 $(-\boldsymbol{E}-\boldsymbol{A}) \boldsymbol{x}=0$. 由于 $$ -\boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{ccc} -1 & 1 & -1 \\ -2 & 2 & 0 \\ 0 & 0 & -1 \end{array}\right) \rightarrow\left(\begin{array}{ccc} -1 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array}\right), $$ 故 $(1,1,0)^{\mathrm{T}}$ 为 $\boldsymbol{A}$ 的属于特征值 -1 的一个特征向量. 当 $\lambda=0$ 时, 解 $(0 \boldsymbol{E}-\boldsymbol{A}) \boldsymbol{x}=\mathbf{0}$. 由于 $$ 0 \boldsymbol{E}-\boldsymbol{A}=\left(\begin{array}{ccc} 0 & 1 & -1 \\ -2 & 3 & 0 \\ 0 & 0 & 0 \end{array}\right) $$ 故 $(3,2,2)^{\mathrm{T}}$ 为 $\boldsymbol{A}$ 的属于特征值 0 的一个特征向量. 令 $\boldsymbol{P}=\left(\begin{array}{lll}1 & 1 & 3 \\ 2 & 1 & 2 \\ 0 & 0 & 2\end{array}\right)$, 则 $\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}=\left(\begin{array}{ccc}-2 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0\end{array}\right)$. 计算 $P^{-1}$ 得, $P^{-1}=\left(\begin{array}{ccc}-1 & 1 & \frac{1}{2} \\ 2 & -1 & -2 \\ 0 & 0 & \frac{1}{2}\end{array}\right)$. $$ \begin{aligned} \boldsymbol{A}^{99} & =\boldsymbol{P}\left(\begin{array}{ccc} (-2)^{99} & 0 & 0 \\ 0 & (-1)^{99} & 0 \\ 0 & 0 & 0 \end{array}\right) \boldsymbol{P}^{-1}=\left(\begin{array}{lll} 1 & 1 & 3 \\ 2 & 1 & 2 \\ 0 & 0 & 2 \end{array}\right)\left(\begin{array}{ccc} -2^{99} & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0 \end{array}\right)\left(\begin{array}{ccc} -1 & 1 & \frac{1}{2} \\ 2 & -1 & -2 \\ 0 & 0 & \frac{1}{2} \end{array}\right) \\ & =\left(\begin{array}{ccc} 2^{99}-2 & 1-2^{99} & 2-2^{98} \\ 2^{100}-2 & 1-2^{100} & 2-2^{99} \\ 0 & 0 & 0 \end{array}\right) . \end{aligned} $$ 这就是说,特征值,特征向量,方程组的解,基础解系,对角型,使用这几个概念互相配合, **竟然把一个矩阵要算99次的超大“工作”量,转换为了其矩阵元素的指数次方。** 工作量大大的降低。 #### 数学服务于物理 我们说数学是为物理服务的,因为你要知道在物理里,有大量二次运算,比如牛顿加速度运动定律 $m v^2 / 2$ ,电压电流 $U=I R ,$ 万有引力定律等等都是二次的。 #### 数学服务于几何 从几何上看,更要研究二次型 在中学的几何中我们学过,对于一元二次函数 $f(x)=a x^2$ 在二维平面上看我们有非常清晰的几何图形: 他就是过原点的抛物线: $a>0$ 开口向上, $a<0$ 开口向下, $a=0$ ,抛物线蜕化成直线 $x$ 轴。  那么对于函数 $f(x)=a x^2+b x+c$ 图形呢? 我们依然清哳地知道, 他还是一个抛物线图像,只不过在横轴和纵轴方向上同时进行了平移,但图形趋势仍然相同。因为可以把它经过配方得到上面的形式: $f(x)=a x^2+b x+c=a\left(x+\frac{b}{2 a}\right)^2+\left(c-\frac{b^2}{4 a}\right)$ 所以,一个多项式的图像,是由最高次幂决定的,后面低次幂仅是对图像上下左右进行变化。 到这里我们有一个小小的初步结论, 就是函数的几何图形是合同的, **合同的意思是它们经过平移、变换后图形会完全重合**。 既然是这样,如果是要考察几何图形性质的话,对于 $f(x)=a x^2+b x+c$ 类的函数我们只要考察 $f(x)=a x^2$ 的形式就可以了。这样可以简化运算,换句话说, 我们只需研究透了这个二次函数的性质,就能得到整体的性质 (这也可以认为是坐标映射)。 再如二元函数 $f(x, y)=a x^2+c y^2$ 的图形在三维空间中观看是鞍马面,我们大致能推断 $f(x)=a x^2+b x y+c y^2+d$ 函数图形经过旋转平移等应该和它 "长" 的类似。  相比一次函数,二次函数要复杂、抽象的多,为此提出了矩阵的等价、相似与合同三大概念,我们会在附录2里进行简单概括,详见 > 在 [附录2:线性方程组、行列式、矩阵、向量组的关系](https://kb.kmath.cn/kbase/detail.aspx?id=772) 理解矩阵的等价、相似与合同。 ## 线性空间转换 正如一元二次方程 $ax^2+bx+c=0$ 一样,如果从解方程的角度看,他是解二次方程,但是如果从二次函数的视角看,他是一个抛物线。同样一个代数式,不同的视角会赋予不同的含义,最终会殊途同归。 在上面介绍线性代数里,是从解方程的角度看待线性代数,目前主流观点是从线性空间理解线性代数, > 如果说解方程是从微观视角看线性代数,那么图形变换则是从宏观视角理解线性代数。 这就像,我们知道物质都是有原子或者分子组成,这是一个微观视角,但是当一个人生病后,去检测白细胞,红细胞,细胞本质上也是原子、分子组成的,但是在医学上从来不会说原子,分子,而是说细胞,或者说细胞是生物最小的基础单位(而原子不是生物上最小组成单位)。 我们在[矩阵乘法](https://kb.kmath.cn/kbase/detail.aspx?id=1380) 里可以看到,两个矩阵相乘,本质是做一个线性变换。 一个矩阵其实就是一个线性变换,因为一个矩阵乘以一个向量后得到的向量,其实就相当于将这个向量进行了线性变换。比如说一个向量$(1,1)$ 乘以下面的一个矩阵: $$ M=\left[\begin{array}{ll} 3 & 0 \\ 0 & 1 \end{array}\right] $$ 他其实就是对向量进行了缩放,参考下图,可以看到图像变长了。  再如图2-15中的大写字母 N 由 8 个点组成, 这8个点有8个坐标$(x,y)$组成 {width=300px} 如果乘以一个矩阵,则变成 $A=\left[\begin{array}{cc}1 & 0.25 \\ 0 & 1\end{array}\right]$ 则变成 {width=350px} 再乘以矩阵,则变成 {width=350px} **现在你明白了,当我们打开微软Word软件时,对字体进行加粗、变斜、变细,其本质就是对字的原本做一个矩阵乘法即可。** 这种变换类似切边变换、反射变换等,在使用Photoshop进行图像处理时,可以进行各种修图,本质也是进行矩阵的一种变换。 {width=500px} 我们将在[矩阵乘法](https://kb.kmath.cn/kbase/detail.aspx?id=1380) 、[矩阵的平移矩阵,旋转矩阵,缩放矩阵,线性变换,仿射变换,齐次坐标](https://kb.kmath.cn/kbase/detail.aspx?id=1859) 和 [奇异值分解](https://kb.kmath.cn/kbase/detail.aspx?id=2578) 介绍。 ## 近世代数对数学的整体思考 参考下图:一个个数字或者物体被称作**元素**,元素放在一起组成了**集合**(这个高中就学过),集合排在一起组成了**空间**,如果空间满足八大性质(交换律、结合律等)则被定义为**线性空间**。空间里元素的距离称为**度量空间**。我们需要一个尺子作为度量的基准,这个尺子被称为**范数**,含有范数的空间称为**线性赋范空间**,具备完备后称为**巴拿赫空间**。  这里要强调一下**封闭性**,如果集合$F$里的数进行加减乘除仍在$F$里,则$F$称为**封闭数域**,比如“全体有理数”就是一个封闭数域,因为任何有理数的加减乘除仍在有理数里,但是“全体整数”就不是封闭数域,因为两个数相除有可能是分数。 详细介绍参加 [近世代数对数学的整体思考](https://kb.kmath.cn/kbase/detail.aspx?id=2602) ## 如何学好线性代数 概念**环环相扣**是线性代数最大的特点,举例来说,与"$n$ 阶矩阵 $A$ 可逆"这个概念等价的命题就有十多个:$n$ 阶矩阵 $A$ 可逆 $\Leftrightarrow A$ 的行列式的值不为 $0 \Leftrightarrow A$ 满秩 $\Leftrightarrow A$ 的列向量组线性无关 $\Leftrightarrow A$ 的行向量组线性无关 $\Leftrightarrow$ 以 $A$ 为系数矩阵的齐次线性方程组 $A x=0$ 只有零解 $\Leftrightarrow A$ 可以通过一系列初等行变换化作单位矩阵 $\Leftrightarrow A$ 可分解为一系列初等矩阵的乘积 $\Leftrightarrow A$ 的列向量可作为 $n$ 维向量空间 $R ^n$ 的一组基 $\Leftrightarrow R ^n$ 中任意一个向量都可以由 $A$ 的列向量线性表出 $\Leftrightarrow$ 对任意 $n$ 维向量 $b$ ,方程组 $A x = b$ 必有惟一解 $\Leftrightarrow A$ 没有零特征值等等。这些等价命题原先是分散在各个章节中的,需要读者在学习过程中不断分析,归纳和总结。 [线性代数公式](https://kb.kmath.cn/kbase/detail.aspx?id=1374) 为你归纳了核心知识点的总结。
上一篇:
没有了
下一篇:
引论:线性代数的意义
在线学习仅为您提供最基础的数学知识,
开通会员
可以挑战海量
超难试题
, 分享本文到朋友圈,邀请更多朋友一起学习。
本文对您是否有用?
有用
(
1
)
无用
(
0
)
评论
更多
初中数学
高中数学
高中物理
高等数学
线性代数
概率论与数理统计
复变函数
离散数学
实变函数
数学分析
数论
群论
纠错
高考
考研
关于
赞助
留言
科数网是专业专业的数学网站。