고유값 문제를 해결하기 위해서는 꼭 특성다항식을 풀 수 있어야 합니다. 그런데 특성다항식이 왜 0이 되어야 하는지, 곧 행렬식이 왜 0이 되어야 하는지를 이해하기 위해서는 행렬의 가역성 또는 선형변환의 영공간에 관한 지식이 반드시 필요합니다. 무작정 외우지 말고 그에 대해서 모두 정리를 해 두었으니 차근차근 이해를 해보시기 바랍니다.
1. 특성다항식
1) 정의와 기본 정리
정의($L.A$) 5.3
유한차원 벡터공간 $V$ 위에서 정의된 선형연산자 $T$ 에 대해 $V$의 임의의 순서기저 $\beta$ 를 택하자. $\det (T)$ 로 표기하는 $T$ 의 행렬식이란 $T$ 의 순서기저에 대한 행렬표현 $[T]_{\beta}:=A$ 의 행렬식 $\det (A)$ 로 정의한다.
정리($L.A$) 5.12
유한차원 벡터공간 $V$ 위에서 정의된 선형연산자 $T$ 에 대해 $V$의 임의의 순서기저 $\beta$ 를 택하자. $A:=[T]_{\beta}\in M_n(F)$ 라 하자. $\lambda\in F$ 가 $A$ 의 고유값이 되기 위한 필요충분조건은
$$\det \left( A-\lambda I_n \right)=\det \left( \lambda I_n-A \right)=0$$ 인 것이다. 여기서 다항식 $f(t)=\det \left( A-\lambda I_n \right)$ 는 행렬 $A$ 또는 선형연산자 $T$의 '특성다항식(Characteristic polynomial)' 이라 부르고, $\mathrm{char}(A)$ 또는 $\mathrm{char}(T)$ 로 쓰기도 한다.
고찰해 봅시다. 고유값과 고유벡터가 존재하기 위해서 왜 행렬식(determinant)이 0이 되어야 할까요? 행렬식이 0이 된다는 말은 주어진 고유값 방정식
$$T(v)=\lambda v \;\;\; \mathrm{or}\;\;\; Av=\lambda v$$
에 대해 $v\neq 0$ 인 해가 존재해야 한다는 것입니다. 자명해 이외의 비자명해가 존재해야 한다는 것이죠. 그러니 행렬의 입장에서 역행렬이 존재하지 않아야 한다는 것이고, 선형변환의 입장에서 비가역이어야 한다는 것입니다. 그래서 행렬식은 0이 되어야 한다는 것입니다. 1
이 논리를 이해하지 않고 무작정 외우는 분들이 많은 것 같은데 그러지 않았으면 합니다.
따름정리($L.A$) 5.12.1
$A\in M_n(F)$ 에 대하여 $v\in F^n$ 이 고유값 $\lambda$ 에 대응하는 고유벡터이기 위한 필요충분조건은 $v\neq 0$ 이고 $(A-\lambda I_n)v=0$ 인 것이다. 즉, 특성다항식 $\det(A-\lambda I_n)=0$ 인 것이다.
위 정리의 행렬 버전입니다.
2) 특성다항식의 성질
정리($L.A$) 5.13
$A\in M_n(F)$ 또는 벡터공간 $V$ 상에서 정의된 선형연산자 $T$ 의 행렬표현 $A:=[T]_{\beta}$ 에 대하여 다음이 성립한다.
① $A$ 의 특성다항식은 최고차항(leading coefficient)이 $(-1)^n$ 인 $n$ 차 다항식이다.
② $A$ 는 최대 $n$ 개의 서로 다른 고유값을 갖는다.
증명) 수학적 귀납법을 사용한다.
i) $n=2\; : \; A=\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{pmatrix}$
$$\left| A-tI_n \right|=\begin{vmatrix}
a_{11}-t & a_{12} \\
a_{21} & a_{22}-t
\end{vmatrix}=(-1)^2(t-a_{11})(t-a{22})=(t-a_{11})(t-a_{22})$$
여기서 $a_{11}\neq a_{22}$ 이라면 최대의 $n=2$ 개의 서로 다른 고유값이 존재한다.
ii) $n=k \; : \; A=\begin{pmatrix}
a_{11} & & \\
& \ddots & \\
& & a_{kk}
\end{pmatrix}$
$$\left| A-tI_n \right|=(-1)^n(t-a_{11})(t-a_{22})\cdot \;\cdots \;\cdot(t-a_{kk})$$
여기서 $a_{ii}\;(i=1,2,\cdots , k)$ 끼리 값이 모두 다르다면 최대 $n=k$ 의 서로 다른 고유값들이 존재한다.
정리($L.A$) 5.14
벡터공간 $V$ 위에서 정의된 선형연산자 $T$, 그리고 $T$의 서로 다른 고유값을 $\lambda_1,\cdots ,\lambda_k$ 라고 하자. 각각의 $i=1,\cdots ,k$ 에 대하여 $S_i$ 가 고유값 $\lambda_i$ 에 대응되는 고유벡터들로 이루어진 유한집합이라고 하였을 때, 만약 각각의 $S_i$ 가 일차독립이면 $S_1\cap S_2\cap \cdots \cap S_k$ 또한 일차독립이다.
증명은 생략합니다. 일차독립의 정의와, 고유벡터가 일차독립인 경우가 어떤 효과를 발휘하는지를 떠올리면 직관적으로 납득 가능할 것이고 그래야만 합니다.
따름정리($L.A$) 5.14.1
$T$가 $n$차원 벡터공간 $V$ 위에서 정의된 선형연산자라고 하자. $T$ 가 서로 다른 $n$개의 고유벡터를 가지면, $T$는 반드시 대각화가능하다.
증명) $T$ 의 서로 다른 고유값을 $\lambda_1, \cdots ,\lambda_n$ 이라 하자. 각각의 $\lambda_i$ 에 해당하는 고유벡터 $v_i$ 를 고르면 위의 정리($L.A$) 5.14에 의하여 $\left\{ v_1,\cdots ,v_n \right\}$ 는 일차독립이며 $\mathrm{dim}(V)=n$ 이므로 결국 $\left\{ v_1,\cdots ,v_n \right\}$ 는 $V$ 의 기저를 이룬다. 따라서 정리($L.A$) 5.11 에 의하여 $T$ 는 대각화가능하다.
이제 제대로 예제 하나를 통해 대각화 문제를 풀어보도록 하겠습니다.
예제 2) 주어진 행렬 $A=\begin{pmatrix}
1 & 1 \\
1 & 4
\end{pmatrix}$ 의 고유값은 $\lambda_1=3\;,\;\lambda_2=-1$ 을 예제 1) 에서 다루었다. 이들의 고유벡터를 모두 구해보고 행렬 $A$ 가 대각화가능한지 여부를 밝혀라.
Sol)
i) $$\begin{pmatrix}
1 &1 \\
4 & 1
\end{pmatrix}-\begin{pmatrix}
3 &0 \\
0 & 3
\end{pmatrix}=\begin{pmatrix}
-2 &1 \\
4 & -2
\end{pmatrix}:=B_1$$
라 하자.
$\lambda_1$ 에 대응되는 고유벡터를 $v_1=\begin{pmatrix}
x_1 \\
y_1
\end{pmatrix}$ 이라 하면,
$$\left( A-\lambda_1I_2 \right)v_1=B_1v_1=0 \;\; \Rightarrow \;\; \begin{pmatrix}
-2 &1 \\
4 & -2
\end{pmatrix}\begin{pmatrix}
x_1 \\
y_1
\end{pmatrix}=\begin{pmatrix}
0 \\
0
\end{pmatrix}$$
이를 풀면 $y_1=2x_1$ 이 되므로 $v_1=\begin{pmatrix}
x_1 \\
y_1
\end{pmatrix}=t\begin{pmatrix}
1 \\
2
\end{pmatrix}\;\;,\;\;(t\in \mathbb{R})$ 이라 쓸 수 있다. 즉 $\lambda_1=3$ 에 대응되는 고유벡터일 필요충분조건은 $v_1=t\begin{pmatrix}
1 \\
2
\end{pmatrix}\;\;,\;\;(t\in \mathbb{R})$ 인 것이다. 해집합은 $\left\{ t\begin{pmatrix}
1 \\
2
\end{pmatrix} \mid\in\mathbb{R} \right\}$
ii) $$\left( A-\lambda_2I_2 \right)v_2=B_2v_2=0 \;\; \Rightarrow \;\; \begin{pmatrix}
2 &1 \\
4 & 2
\end{pmatrix}\begin{pmatrix}
x_2 \\
y_2
\end{pmatrix}=\begin{pmatrix}
0 \\
0
\end{pmatrix}$$
라 하자. 그러면 $y_2=-2x_2$ 를 얻고 $v_1=\begin{pmatrix}
x_2 \\
y_2
\end{pmatrix}=s\begin{pmatrix}
1 \\
-2
\end{pmatrix}\;\;,\;\;(s\in \mathbb{R})$ 가 된다. 해집합은 $\left\{ s\begin{pmatrix}
1 \\
-2
\end{pmatrix} \mid\in\mathbb{R} \right\}$ 이다.
정리하면 집합 $\left\{ \begin{pmatrix}
1 \\
-2
\end{pmatrix},\begin{pmatrix}
1 \\
2
\end{pmatrix} \right\}$ 는 $A$ 의 고유벡터로 이루어진 $\mathbb{R}^2$ 의 기저이므로 $L_A$ 와 $A$ 는 모두 대각화가능하다.
2. 완전 분해, 완전 인수분해(Split over)
특성다항식은 벡터공간의 차원과 같은 숫자인 $n$ 차 다항식임을 알았습니다. $n$개의 다항식 중 공통 고유값이 존재할 수 있습니다. 즉 항들이 모두 1차항들로만 $n$개가 구성되면 $n$개의 서로 다른 고유값이 존재하는 것이지만 중근, 삼중근, .. 등등이 발생하지 않아야 한다는 법은 없지요. 일단 어떻게든 특성다항식을 만들었을 때, 모든 고유값들(중복이 될 수도 있음)에 해당하는 곱들이 발생하는 경우는 눈여겨 볼 필요가 있습니다. 대각화가능 조건의 최소한의 필요조건이기 때문입니다.
정의($L.A$) 5.4
다항식 $f(t)\in P(F)$ 가 체 $F$ 위에서 '완전 분해(Split-over)' 된다는 것은 체 $F$ 의 원소 $c,a_1,\cdots ,a_n$ (반드시 서로 다를 필요는 없다) 가 존재하여
$$f(t)=c(t-a_{1})(t-a_{2})\cdot \cdots \cdot (t-a_n)$$ 가 성립하는 것이다.
우선 용어에 대해서, 'Split-over' 에 대응되는 적당한 한국어가 없습니다. 의미상으로는 인수분해(factoring)과 동일합니다. 하지만 굳이 원서에서 인수분해(factoring)라는 용어를 쓰지 않는 것을 보면, $(t-\lambda_i)$ 꼴들만의 곱으로 예쁘게 쪼개진다는 것을 강조한다고 볼 수 있습니다. 왜냐하면 예컨대 항이 $(t^2-at+b)$ 이런 식으로 묶이더라도 인수분해라고 말하기 때문이죠.
주의해야 할 것은 스플릿 오버, 곧 인수분해가 되더라도 항상 대각화가능한 것은 아니라는 점입니다. 역으로 대각화가능하면 스플릿 오버가 된다고 말할 수는 있지요. 이 역은 아래에서 증명합니다. 스플릿 오버의 가능 여부는 '체(field)'가 어느 범위인지에 달려있다고 보시면 됩니다. 예를 들어 특성다항식을 구했을 때 허근이 발생하면, 복소수 체에서는 스플릿 오버되지만 실수 체에서는 스플릿 오버가 되지 않는 것입니다.
스플릿 오버가 되는 한 대각화가능까지를 함의하지는 못하지만 적어도 조르당 표준형(Jordan canonical form)은 구할 수 있습니다. 조르당 표준형은 사실 학부 과정으로 보기에 살짝 애매한 점이 있기는 합니다. 하지만 조르당 표준형까지 알고 있어야 내적공간에서 쓸모있는 테크닉에 대한 이해가 수월하고, 스플릿 오버와 대각화가능의 차이를 매끄럽게 구분할 수 있는 도구이기는 하지만 개인적으로 굳이 관심이 없다면 학부 선형대수 수준에서 반드시 알 필요는 없다고 봅니다. 2
정리($L.A$) 5.15
체 $F$ 상에서 정의된 벡터공간 $V$의 대각화가능한 선형연산자의 특성다항식은 체 $F$ 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.
증명) $n$ 차원 벡터공간 $V$ 의 대각화가능한 선형연산자를 $T$ 라 하고 $D=[T]_{\beta}$ 가 되도록 하는 $V$ 의 순서기저를 $\beta$ 라 하면,
$$D=\begin{pmatrix}
\lambda_1 & \cdots & & 0 \\
0 & \lambda_2 & \cdots & \\
\vdots & & \ddots & 0 \\
0 & & \cdots & \lambda_n
\end{pmatrix}$$
가 되며,
$$\begin{align*}
\mathrm{char}(T):=f(t)&=\det (tI-D) =\begin{pmatrix}
t-\lambda_1 & \cdots & & 0 \\
\vdots& \ddots & & \vdots \\
& & & \\
0 & \cdots & & t-\lambda_n
\end{pmatrix}
\\\\&=(-1)^n\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot \cdots \cdot
\left( t-\lambda_n \right)
\end{align*}$$
따라서, $f(t)$ 는 체 $F$ 위에서 완전분해된다.
[참고문헌]
Linear Algebra : S.Friedberg, A.Insel, L.Spence, 5e, PEARSON
'선형대수학(Linear Algebra) > 고유치 문제' 카테고리의 다른 글
선형연산자로 고유값 문제를 해결하기(Eigenvalue problem with linear operator) (1) | 2023.02.03 |
---|---|
행렬의 대각화와 고유값 문제(Diagonalization of matrix with Eigenvalue problem) (0) | 2022.03.14 |
고유공간(Eigenspace) (0) | 2022.03.08 |
대각행렬과 행렬의 닮음 (Diagonal matrix and Similar of matrix) (0) | 2022.03.08 |
고유값과 고유벡터 (Eigenvalue and Eigenvector) (0) | 2022.01.05 |
댓글