线性代数¶

是 3B1B 笔记。

向量¶

可以将向量视为坐标系中，一个一端在原点，一端指向坐标系中某个点的线段。

或者称为一个从原点指出的箭头，于是很自然的写出坐标表示，

\[ \begin{bmatrix} a\\b \end{bmatrix} \]

这种写法也叫做二元数组。

为了简便，也可以记为 $(a,b)$，这非常直观的表示坐标轴中的位置。

这对坐标这指出了如何从原点到达这个向量所指的位置，即坐标的位置：

其中 $a$ 表示沿 $x$ 方向走多远，$b$ 表示沿 $y$ 方向走多远，正负表示方向。

空间向量定义类似，$(a,b,c)$ 中，$c$ 表示沿 $z$ 方向走多远，正负表示方向。

而写作

\[ \begin{bmatrix} a\\b\\c \end{bmatrix} \]

的，也叫做三元数组。

另外，当我们在讨论坐标系内的一组（可能是无限个）向量时，

通常把他们抽象为一组点，分别表示原点到这个点所表示的向量。

向量加法¶

将一个向量固定在原点，其余向量一次首尾相连，类似于对实数的操作。

则其和为原点到最后一个向量末尾的线段，就是这些向量的和。

可以把向量看做坐标系中的某种运动，因此位移合成，即向量加法。

当我们把向量看成上述两步（两个坐标轴方向），就容易得出公式，

\[ \begin{bmatrix} x_1\\y_1 \end{bmatrix}+\begin{bmatrix} x_2\\y_2 \end{bmatrix}=\begin{bmatrix} x_1+x_2\\y_1+y_2 \end{bmatrix} \]

向量数乘¶

向量数乘就是将向量伸缩 $k$ 倍，从几何看就是缩放，类似于对实数的操作。

其中，我们定义了此操作为几何意义上的缩放，乘的数也称标量。

我们可以类比将实数加法拓展到乘法的过程，这也是非常直观的，

\[ \lambda\begin{bmatrix} x\\y \end{bmatrix}=\begin{bmatrix} \lambda x\\\lambda y \end{bmatrix} \]

线性组合¶

在若干向量中，有两个向量最特殊，

\[ \def\vecc#1#2{\begin{bmatrix}#1\\#2\end{bmatrix}} \hat\imath=\vecc10\\[0.5em] \hat\jmath=\vecc01 \]

于是，我们可以把向量 $(a,b)$ 看成上面两个向量的缩放，即

\[ \def\vecc#1#2{\begin{bmatrix}#1\\#2\end{bmatrix}} \vecc a b=a\hat\imath+b\hat\jmath \]

这种缩放向量并相加的思想很重要，我们称 $\hat\imath,\hat\jmath$ 为 $xy$ 坐标系的基向量。

这意味着，把向量的坐标看为标量，那么基向量就是这些标量缩放的对象。

于是，我们就可以通过这些基向量，来构建整个坐标系。

那么我们引出一个重要的问题：如果我们选择不同的基向量呢？

我们不严谨的，选择两个向量，大部分都可以构成整个坐标系。

这意味着，当我们用一组数来表示向量的时候，它就依赖于我们选择的基。

我们会发现，如果我们固定其中一个基向量，然后随意缩放另一个。

你会发现，其和端点，在坐标系中画出了一道优美的。咳咳。直线。

于是，我们移动一个，再移动另一个，就可以得到一个面了哦。

那么，如果无限缩放下去，就会填满整个坐标系，也就是表示了整个坐标系。

同时也很容易得出，如果两个基向量共线，就只能得到一个过原点的直线了。

同时，也容易发现，如果两个基向量都是零向量，那么只能得到原点一处。

最后，我们引出定义，称

\[ a\vec v+b\vec w \]

为 $\vec v$ 和 $\vec w$ 的线性组合。

所有可以表示为给定向量线性组合的向量的集合，被称为给定向量的张成空间。

也许在看两个向量所张成的空间铺满了整个平面会有些抽象，

我们考虑，在三维空间内，两组不共线的向量张成的空间是什么样的。

不难的，是一个过原点的平面，即这个平面上的点的集合就是这其张成空间。

三维中的两个的向量呢？其线性组合类似的定义为，

\[ a\vec v+b\vec w+c\vec u \]

考虑在一个已经有两个向量的张成空间中，加入第三个向量，

当我们加入的第三个向量与前两个之一共线，或者正好落在了前两个的张成空间中，

那么其三个的张成空间没有拓展。

定义：多个向量中删去一个，不影响其张成空间的，称他们为线性相关的。

或者，如果一个向量可以表示为另外两个向量的线性组合，则称他们是线性相关的。

另外，如果加入的新向量完全拓展了其张成空间，则称其为线性无关的。

此时，我们可以引入基的严格定义：

向量空间的一组基是张成该空间的一个线性无关的向量集。

线性变换¶

变换，可以简单的认为是一种的函数，此处的变换是向量到向量的函数。

而变换这个说法，正好对应了变换这个过程，这是很直观的。

实际上变换可能很复杂，但是线性变换指的是满足下面两条的变换：

坐标系中的直线经过线性变换依旧是直线，且变换前后坐标系原点不动。

即线性变换是对空间的一种变换，满足网格线保持平行，且等距分布。

注意此时一定不能只关注一部分直线，但是可以考虑一些特殊的直线。

考虑在平面内，如何用数值来准确描述一个线性变换？

根据上面基向量的思想，我们只需要记录 $\hat\imath,\hat\jmath$ 的变换位置即可。

感性理解，我们可以根据变化的 $\hat\imath,\hat\jmath$ 推断出述任意向量位置。

有一个性质，若一向量可以表示为，

\[ \vec v=a\hat\imath+b\hat\jmath \]

那么在 $\hat\imath,\hat\jmath$ 变换后的 $\hat\imath',\hat\jmath'$ 中，在原坐标系中，有，

\[ \vec v=a\hat\imath'+b\hat\jmath' \]

代数表示，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{x\\y}\to x\vecc{a\\b}+y\vecc{c\\d}=x\vecc{ax+cy\\bx+dy} \]

我们通常把 $a,b,c,d$ 这四个数封装在一个东西中，称为矩阵，对于上面的，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{a&c\\b&d} \]

左边一列右边一列（称为矩阵的列）分别表示变换之后的 $\hat\imath,\hat\jmath$ 基，$(a,b),(c,d)$。

因此可以定义出矩阵乘向量的简化形式，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{a&c\\b&d}\vecc{x\\y}=x\vecc{a\\b}+y\vecc{c\\d}=\vecc{ax+cy\\bx+dy} \]

其中，左边的矩阵可以理解为一个函数，对于右边的向量操作。

根据这个，可以得出很多有意思的矩阵，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{0&-1\\1&0}:\small\text{逆时针旋转 $90^\circ$}\\[0.5em] \vecc{1&1\\0&1}:\small\text{剪切、错切}\\ \]

在变换的时候，可以先对 $\hat\imath$ 变换，再对 $\hat\jmath$ 变换，可以方便一点。

如果变换的 $\hat\imath,\hat\jmath$ 是线性相关的，那么就会丢失一个维度，使张成空间成为一个直线。

注：线性的严格定义，若一个变换 $L$ 满足，

\[ L(\vec v+\vec w)=L(\vec v)+L(\vec w)\\ L(c\vec v)=cL(\vec v) \]

则称 $L$ 是线性的。

矩阵乘法¶

考虑如果把两个线性变换合并，比如上文提到的选择和剪切，如何？

这个新的变换显然也是线性变换，我们称其为前两个独立变化的复合变换。

代数的，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{1&1\\0&1}\left(\vecc{0&-1\\1&0}\vecc{x\\y}\right)=\vecc{1&-1\\1&0}\vecc{x\\y} \]

右面的，即复合矩阵，于是我们定义矩阵乘法形如，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{1&1\\0&1}\vecc{0&-1\\1&0}=\vecc{1&-1\\1&0} \]

注意矩阵乘法是右结合性，即从右往左读，类似复合函数，

\[ (g\circ f)(x)=g(f(x)) \]

此时可以考虑矩阵乘法的数值表示。

考虑右边的矩阵变换的基向量，再通过左边的矩阵变换，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{a&b\\c&d}\vecc{e&f\\g&h}\to\vecc{a&b\\c&d}\vecc{e\\g},\vecc{a&b\\c&d}\vecc{f\\h} \]

即，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{a&b\\c&d}\vecc{e&f\\g&h}=\vecc{ae+bg&af+bh\\ce+dg&cf+dh} \]

可以看这个网站理解：https://rainppr.gitee.io/matrixmultiplication.xyz/。

容易发现，

\[ M_1M_2\neq M_2M_1 \]

即矩阵乘法没有交换律，但是

\[ (AB)C=A(BC) \]

即矩阵乘法具有结合律。

三维空间中的线性变换¶

如果我们去尝试想象整个三维空间会很复杂，

因此只考虑三个基向量，$\hat\imath,\hat\jmath,\hat k$。

将三个基向量作为列的形式，依次记录在矩阵中，形如，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{a&b&c\\d&e&f\\g&h&i} \]

和二维类似的，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{a&b&c\\d&e&f\\g&h&i}\vecc{x\\y\\z}=x\vecc{a\\d\\g}+y\vecc{b\\e\\h}+z\vecc{c\\f\\i}=\vecc{ax+by+cz\\ dx+ey+fz\\ gx+hy+iz} \]

行列式¶

我们发现，有的线性变换是在向外拉伸空间，有的则是在向内挤压空间。

那么，具体被拉伸了多少呢？具体的，单位面积的缩放比例是多少。

例如，线性变换

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{2&0\\0&3} \]

将空间拉伸了 $6$ 倍。这个缩放比例，叫做线性变换的行列式，即

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \det\left(\vecc{2&0\\0&3}\right)=6 \]

这个值意味着，任意形状的图形，其面积经过变换后都会拉伸这个倍数。

如果一个线性变换的行列式为 $0$，这意味着这个线性变换使一些维度消失了。

然而，行列式是允许出现负数值的，这意味着空间被翻转了。

具体的，正常情况下，$\hat\jmath$ 在 $\hat\imath$ 的左侧，因此如果反过来了，就意味着空间被翻转。

也被称为，空间的定向发生改变，此时行列式的绝对值表示缩放倍数。

放在三维中，只需要考虑 $1\times1\times1$ 的正方体即可。

三维空间的定向使用右手定则，

食指、中指分别指向 $\hat\imath,\hat\jmath$，此时若拇指指向 $\hat k$，则行列式为正，反之为负。

那么如何计算呢？给出一个简单的公式，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \det\left(\vecc{a&b\\c&d}\right)=ad-bc \]

因此，如果 $b,c$ 有一个为零，那么行列式的值即 $ad$，平行四边形的面积。

更进阶的公式（具体如何计算自己百度），

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \def\dett#1{\det\left(\vecc{#1}\right)} \begin{aligned} &\;\dett{a&b&c\\d&e&f\\g&h&i}\\ =&\;a\dett{e&f\\h&i}\\ -&\;b\dett{d&f\\g&i}\\ +&\;c\dett{d&e\\g&h} \end{aligned} \]

有性质，

\[ \det(M_1M_2)=\det(M_1)\det(M_2) \]

高斯消元¶

形如，额没有形。

每一项都是简单的一元，不存在三角函数等高级函数，

比如，

\[ \begin{cases} 2x+5y+3z=-3\\ 4x+0y+8z=0\\ 1x+3y+0z=2 \end{cases} \]

可以发现这个东西类似向量乘法，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{2&5&3\\4&0&8\\1&3&0}\vecc{x\\y\\z}=\vecc{-3\\0\\2} \]

简记为，

\[ A\vec x=\vec v \]

则解方程的过程，相当于找到一个向量 $\vec x$ 在经过 $A$ 的变换后，恰好等于 $\vec v$。

对于 $\det A\neq0$ 的情况，显然解是唯一的，我们可以通过找到 $A$ 的逆的方式来求解。

这个线性变换为 $A$ 的逆，记为，$A^{-1}$。例如逆时针旋转 $90^\circ$ 的逆，为顺时针旋转 $90^\circ$。

那么，$AA^{-1}$ 就对应一个什么都不做的变换，形如

\[ AA^{-1}=\def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{1&0\\0&1} \]

那么，我们可以这么解方程，

\[ A\vec x=\vec v\\ AA^{-1}\vec x=A^{-1}\vec v\\ \vec x=A^{-1}\vec v \]

由上，一个线性变换存在逆的充要条件，即其行列式不为零。

因为行列式为零一位置压缩维度，那么损失的维度就不存在信息来复原了。

如果一个线性变换把维度确定为 $k$ 维，那么其秩为 $k$，或者说变换后空间的维数。

因此，对于一个 $n\times n$ 的矩阵，其秩最大为 $n$，即张成了整个 $n$ 维空间，称为满秩。

经过变换所有能得到的向量的集合成为线性变换的列空间。

或者说，就是一个矩阵的列张成的空间。

于是我们更严谨的定义线性变换的秩为，其列空间的维数。

因为线性变换不操作原点，因此零向量一直存在于列空间中。

经过变换后，所有落在零向量的向量组成了其零空间（或核）。

非方阵¶

此时就存在内在的维度变化，例如，

\[ \def\vecc#1{\begin{bmatrix}#1\end{bmatrix}} \vecc{3&1\\4&1\\5&9} \]

意味着把 $\hat\imath$ 变换到 $(3,4,5)$，把 $\hat\jmath$ 变换到 $(1,1,9)$。

这是一个三行两列的矩阵，记作 $3\times2$ 的矩阵。

这个矩阵的列空间，是一个过三维原点的二维平面。

但是因为传入的就是二维的，因此这个矩阵也是满秩的。

NOT THE END.（咕咕咕

本页面最近更新：正在加载中，更新历史。
编辑页面：在 GitHub 上编辑此页！
本页面贡献者：RainPPR。