有理函數和矩陣

Core mathematics 介紹過 rational function（有理函數），即形如　 $\frac{P(x)}{Q(x)}$ 　者（其中 P(x) 及 Q(x) 皆為多項式）。

若 P(x) 及 Q(x) 皆為線性（linear），即形如　 $\frac{ax+b}{cx+d}$ 　者，稱之曰 fractional linear function（FLF）。

中四教 function（函數）時，偶談下例，設　 $f(x)=\frac{ax+b}{cx+d}$ ，求　 f(f(x)) 。

解之曰

f(f(x))

$=\frac{af(x)+b}{cf(x)+d}$

$=\frac{a\times \frac{ax+b}{cx+d}+b}{c\times \frac{ax+b}{cx+d}+d}$

$=\frac{(a^2+bc)x+b(a+d)}{c(a+d)x+bc+d^2}$

仍舊是 FLF。

現看看 2×2 矩陣（matrix）和 FLF 之關係。

設　 $M=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)$ ，求　 M^2 。

解之曰

M^2

$=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)$

$=\left(\begin{array}{rcl}a^2+bc& b(a+d)\\c(a+d)& bc+d^2\\\end{array}\right)$

比較一下：

可見函數的係數對應著矩陣的元（entries）。說具體點，

函數對 FLF 的作用，是把係數 a,b,c,d 分別變為 a^2+bc,b(a+d),c(a+d),bc+d^2 ；而

矩陣對矩陣的作用，是把元 a,b,c,d 分別變為 a^2+bc,b(a+d),c(a+d),bc+d^2 ，兩個不同的作用，產生相同結果。

所以，推而廣之，欲找　 $f(f(f\dots f(x))\dots )$ （共個），記之曰 $f^{[n]}(x)$ ，可透過尋找　 M^n 　達成。

但如何尋找　 M^n 　？

比如　 $M=\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)^n$ 　是甚麼？

又係那句：用 wolframalpha 啦～

去

http://www.wolframalpha.com/

輸入

{{2,-1},{-1,2}}^n

拍一拍 Enter，得：

於是，若 $f(x)=\frac{2x-1}{-x+2}$ ，則 $f^{[n]}(x)=\frac{(1+3^n)x+(1-3^n)}{(1-3^n)x+(1+3^n)}$ 。

其實，修 M2 的同學，應見慣尋找 M^n 的題目，用 wolframalpha，不用 1 秒做完這類長題目～

好了，談回數學，尋找 M^n ，通常是透過把矩陣對角化（diagonalize）來達成。

何謂把矩陣對角化？即把寫成

$M=PDP^{-1}$

當中是形如 $\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)$ 　的對角矩陣（diagonal matrix）。

如何把矩陣對角化？

上網便可，先去

https://www.symbolab.com/solver/matrix-diagonalization-calculator

點擊紅圈那格：

在彈出的小視窗 Select matrix size，用 mouse 揀 2×2 個格子：

輸入矩陣各元，再按紅色的 Go：

得出答案：

即

$M=\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)$
$P=\left(\begin{array}{rcl}-1& 1\\1& 1\\\end{array}\right)$
$P^{-1}=\left(\begin{array}{rcl}-\frac{1}{2}& \frac{1}{2}\\\frac{1}{2}& \frac{1}{2}\\\end{array}\right)$
$D=\left(\begin{array}{rcl}3& 0\\0& 1\\\end{array}\right)$

修 M2 的同學，有了 $M=PDP^{-1}$ ，我們便有 $M^n=PD^nP^{-1}$ ，大家試驗算一下

$\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)^n=\frac{1}{2}\left(\begin{array}{rcl}1+3^n& 1-3^n\\1-3^n& 1+3^n\\\end{array}\right)$

吧。

嗯，真正談回數學，不上網，如何把矩陣對角化？

因為是 M2 程度，我只談 2×2 矩陣，高手見諒。

首先，命

$M\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\lambda\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ ………. (1)

當中的 $\lambda$ 是純量（scalar），即是一個數字。

先停一停，看清楚 (1)。

等號左邊是一個矩陣作用在一支列向量（column vector） $\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ 上，運算是較複雜的矩陣乘法；但右邊卻是簡單的數字乘以矩陣。

當然不是所有列向量　 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ 　都滿足 (1)，但肯定存在一支可以，就是　 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ 。

但這是無聊的，我們希望有支非零的列向量　 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ 　滿足 (1)，即使到作用在這支列向量　 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ 　上的效果，相當於 $\lambda$ 乘以　 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ 。

要有非零的　 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ 　滿足 (1)，即

要有非零的　 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)$ 　滿足

$M\left(\begin{array}{rcl}x\\y\\\end{array}\right)-\lambda\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

$\Rightarrow M\left(\begin{array}{rcl}x\\y\\\end{array}\right)-\lambda I\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

$\Rightarrow (M-\lambda I)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ ………. (2)

即線性方程組 (2) 有非平凡解（non-trivial solution），故 $\Delta =0$ ，亦即　 $|M-\lambda I|=0$ 。

現在代入　 $M=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)$ ，得

$|\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)-\left(\begin{array}{rcl}\lambda & 0\\0& \lambda\\\end{array}\right)|=0$

$\Rightarrow (a-\lambda)(d-\lambda)-bc=0$

$\Rightarrow \lambda^2-(a+d)\lambda+(ad-bc)=0$ ………. (3)

上式稱為對應的特徵方程（characteristics equation），它的根（roots）被稱為的特徵值（eigenvalues）。

因 (3) 是二次方程，設其根（特徵值）為 $\lambda_1,\lambda_2$ 。

把 $\lambda=\lambda_1$ 代入 (1)，得方程

$M\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\lambda_1\left(\begin{array}{rcl}x\\y\\\end{array}\right)$

解出非平凡解（非零解） $\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)$ ，即

$M\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)=\lambda_1\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)$ ………. (4)

稱 $\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)$ 是對應 $\lambda_1$ 的特徵向量（eigenvector of corresponding to $\lambda_1$ ）

類似地，把 $\lambda=\lambda_2$ 代入 (1)，解得非零解 $\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)$ ，即

$M\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\lambda_2\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)$ ………. (5)

稱 $\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)$ 是對應 $\lambda_2$ 的特徵向量（eigenvector of corresponding to $\lambda_2$ ）

把 (4) 和 (5) 略略作些變化，把所有東西變作 2ｘ2 矩陣，即

$M\left(\begin{array}{rcl}x_1& 0\\y_1& 0\\\end{array}\right)=\lambda_1\left(\begin{array}{rcl}x_1& 0\\y_1& 0\\\end{array}\right)=\left(\begin{array}{rcl}\lambda_1x_1& 0\\\lambda_1y_1& 0\\\end{array}\right)$ ………. (6)

$M\left(\begin{array}{rcl}0& x_2\\0& y_2\\\end{array}\right)=\lambda_2\left(\begin{array}{rcl}0& x_2\\0& y_2\\\end{array}\right)=\left(\begin{array}{rcl}0& \lambda_2x_2\\0& \lambda_2y_2\\\end{array}\right)$ ………. (7)

(6)+(7) 得

$M\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)=\left(\begin{array}{rcl}\lambda_1x_1& \lambda_2x_2\\\lambda_1y_1& \lambda_2y_2\\\end{array}\right)=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)$

之後，最希望把上式進一步寫成：

$M=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}$

便完成把對角化過程。問題是， $\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}$ 　存在嗎？

原來，若 $\lambda_1\neq \lambda_2$ ，則　 $\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}$ 　存在。

解說：

要證明　 $\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}$ 　存在，

即證明　 $\det\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\ne 0$ ，

亦即證明以下方程組

$\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

只有唯一解　 $\left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ 。

把上述方程組寫成

$\alpha\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ ………. (8)

等號兩邊同時左乘，即

$M(\alpha\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right))=M\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

$\alpha M\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta M\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

$\alpha \lambda_1\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta \lambda_2\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ ………. (9)

把 (8) 式等號兩邊同時乘以 $\lambda_1$ ，得

$\alpha \lambda_1\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)+\beta \lambda_1\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ ………. (10)

(9)-(10) 得

$\beta (\lambda_2-\lambda_1)\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

由於 $\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)$ 是非零矩陣，且 $\lambda_1 \ne \lambda_2$ ，故推得 $\beta =0$ 。

把 $\beta =0$ 代入 (8)，由於 $\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)$ 是非零矩陣，得 $\alpha =0$ 。

故此，方程組　 $\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ 　只有唯一解　 $\left(\begin{array}{rcl}\alpha\\\beta\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$ ，從而　　 $\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}$ 　存在。

我們才敢說　 $M=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}$ 。

好了，先總結一下對角化程序：

步驟 1：解特徵方程 $|M-\lambda I|=0$ ，得出特徵值 $\lambda_1,\lambda_2$ 。（其中 $\lambda_1\ne\lambda_2$ ）
步驟 2：把 $\lambda_1,\lambda_2$ 分別代入方程組 (1)，解出特徵向量 $\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)$ 及 $\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)$ 。
步驟 3：把對角化為　 $M=\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)\left(\begin{array}{rcl}\lambda_1& 0\\0& \lambda_2\\\end{array}\right)\left(\begin{array}{rcl}x_1& x_2\\y_1& y_2\\\end{array}\right)^{-1}$ 。

e.g.1

$M=\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)$

步驟 1：

$\left|\begin{array}{rcl}2-\lambda & -1\\-1& 2-\lambda \\\end{array}\right|=0\Rightarrow \lambda =3,1$

步驟 2：

若 $\lambda =3$ ，(1) 變為　 $\left(\begin{array}{rcl}2-3& -1\\-1& 2-3\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

得 x+y=0 ，可知 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}-t\\t\\\end{array}\right)$ ，其中 $t\in \mathbb{R}$ 。

取　 $\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)=\left(\begin{array}{rcl}-1\\1\\\end{array}\right)$ 。（為何可隨意取值？）

若 $\lambda =1$ ，(1) 變為　 $\left(\begin{array}{rcl}2-1& -1\\-1& 2-1\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

得 x-y=0 ，可知 $\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}t\\t\\\end{array}\right)$ ，其中 $t\in \mathbb{R}$ 。

取 $\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}1\\1\\\end{array}\right)$ 。

步驟 3：

$\left(\begin{array}{rcl}2& -1\\-1& 2\\\end{array}\right)=\left(\begin{array}{rcl}-1& 1\\1& 1\\\end{array}\right)\left(\begin{array}{rcl}3& 0\\0& 1\\\end{array}\right)\left(\begin{array}{rcl}-1& 1\\1& 1\\\end{array}\right)^{-1}$ 。

e.g.2

$M=\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)$

步驟 1：

$\left|\begin{array}{rcl}3-\lambda & -2\\4& -1-\lambda \\\end{array}\right|=0\Rightarrow \lambda =1\pm 2i$

步驟 2：

若 $\lambda =1+2i$ ，(1) 變為　 $\left(\begin{array}{rcl}3-1-2i& -2\\4& 2-1-2i\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

取 $\left(\begin{array}{rcl}x_1\\y_1\\\end{array}\right)=\left(\begin{array}{rcl}1\\1-i\\\end{array}\right)$ 。

若 $\lambda =1-2i$ ，(1) 變為　 $\left(\begin{array}{rcl}3-1+2i& -2\\4& 2-1+2i\\\end{array}\right)\left(\begin{array}{rcl}x\\y\\\end{array}\right)=\left(\begin{array}{rcl}0\\0\\\end{array}\right)$

取 $\left(\begin{array}{rcl}x_2\\y_2\\\end{array}\right)=\left(\begin{array}{rcl}1\\1+i\\\end{array}\right)$ 。

步驟 3：

$\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)=\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)\left(\begin{array}{rcl}1+2i& 0\\0& 1-2i\\\end{array}\right)\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)^{-1}$ 。

注意， $\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)^n$ 的元不可能出現非實數（unreal numbers），讓我進一步化簡看看。

$\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)^{-1}=\frac{1}{1+i-1+i}\left(\begin{array}{rcl}1+i& -(1-i)\\-1& 1\\\end{array}\right)^T=\frac{1}{2}\left(\begin{array}{rcl}1-i& 1\\1+i& -i\\\end{array}\right)$

故

$\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)^n$

$=\frac{1}{2}\left(\begin{array}{rcl}1& 1\\1-i& 1+i\\\end{array}\right)\left(\begin{array}{rcl}(1+2i)^n& 0\\0& (1-2i)^n\\\end{array}\right)\left(\begin{array}{rcl}1-i& i\\1+i& -i\\\end{array}\right)$ 。

以下，對一般 M2 同學要「行人止步」了，因為將要利用 pure mathematics 課程內學的 De Moivre’s formula，見諒。

把上式矩陣內的複數寫作 polar form，即

$1+i=cis\frac{\pi}{4}$
$1-i=cis(-\frac{\pi}{4})$
$1+2i=\sqrt{5}cis\theta$
$1-2i=\sqrt{5}(-cis\theta)$

其中 $\theta=\tan^{-1}(2)$ 。

由 De Moivre’s formula，得

$(1+2i)^n=\sqrt{5^n}cis(n\theta)$
$(1-2i)^n=\sqrt{5^n}cis(-n\theta)$

於是，

$\left(\begin{array}{rcl}3& -2\\4& -1\\\end{array}\right)^n$

$=\frac{1}{2}\left(\begin{array}{rcl}\sqrt{5^n}cis(n\theta)& \sqrt{5^n}cis(-n\theta)\\\sqrt{2\cdot 5^n}cis(n\theta-\frac{\pi}{4})& \sqrt{2\cdot 5^n}cis(n\theta+\frac{\pi}{4})\\\end{array}\right)\left(\begin{array}{rcl}1-i& i\\1+i& -i\\\end{array}\right)$

$=\left(\begin{array}{rcl}\sqrt{2\cdot 5^n}\cos(n\theta-\frac{\pi}{4})& -\sqrt{5^n}\sin(n\theta)\\2\sqrt{5^n}\sin(n\theta)& -\sqrt{2\cdot 5^n}\sin(n\theta-\frac{\pi}{4})\\\end{array}\right)$

於是，若 $f(x)=\frac{3x-2}{4x-1}$ ，則 $f^{[n]}(x)=\frac{\sqrt{2\cdot 5^n}\cos(n\theta-\frac{\pi}{4})x-\sqrt{5^n}\sin(n\theta)}{2\sqrt{5^n}\sin(n\theta)x-\sqrt{2\cdot 5^n}\sin(n\theta-\frac{\pi}{4})}$ ，其中 $\theta=\tan^{-1}(2)$ 。

後話

1. 一些矩陣會出現 M^m=kM 的情況，對應的 FLF 就是周期性（periodic），例如 $\left(\begin{array}{rcl}1& 1\\2& -1\\\end{array}\right)^3=3\left(\begin{array}{rcl}1& 1\\2& -1\\\end{array}\right)$ ，故 $f^{[3]}(x)\equiv f(x)$ ，其中 $f(x)=\frac{x+1}{2x-1}$ 。

2. 對一般的 nxn 矩陣，若其特徵值各異（distinct），則它必能被對角化，從而找到 M^n 。

3. 當的特徵值並非各異，仍有可能被對角化。

4. 就算不能被對角化，我們當然仍可找 M^n 。

5. M2 不似 pure mathematics 課程，沒有強調矩陣乘法對應線性變換，故學生大抵不清楚有關特徵向量的圖像意義。

習題

1. 設 $f(x)=\frac{x+2}{x+3}$ ，求 $f^{[n]}(x)$ 。

2. 設 $f(x)=\frac{2x-1}{x+4}$ ，求 $f^{[n]}(x)$ 。

3. 已知 $\left \{ \begin{array}{ll} \frac{dx}{dt}=ax+by\\\frac{dy}{dt}=cx+dy\end{array}\right.$ 。證明 $A\frac{d^2x}{dt^2}+B\frac{dx}{dt}+Cx=0$ ，其中 A,B,C 是常數。比較上述式子與 $M=\left(\begin{array}{rcl}a& b\\c& d\\\end{array}\right)$ 的特徵方程，有甚麼發現？