본문 바로가기
선형대수학(Linear Algebra)/고유치 문제

특성다항식(Characteristic polynomial)

by Gosamy 2023. 2. 5.
반응형

고유값 문제를 해결하기 위해서는 꼭 특성다항식을 풀 수 있어야 합니다. 그런데 특성다항식이 왜 0이 되어야 하는지, 곧 행렬식이 왜 0이 되어야 하는지를 이해하기 위해서는 행렬의 가역성 또는 선형변환의 영공간에 관한 지식이 반드시 필요합니다. 무작정 외우지 말고 그에 대해서 모두 정리를 해 두었으니 차근차근 이해를 해보시기 바랍니다.


1. 특성다항식

 

1) 정의와 기본 정리

 

정의($L.A$) 5.3
유한차원 벡터공간 $V$ 위에서 정의된 선형연산자 $T$ 에 대해 $V$의 임의의 순서기저 $\beta$ 를 택하자. $\det (T)$
로 표기하는 $T$ 의 행렬식이란 $T$ 의 순서기저에 대한 행렬표현 $[T]_{\beta}:=A$ 의 행렬식 $\det (A)$ 로 정의한다.

정리($L.A$) 5.12
유한차원 벡터공간 $V$ 위에서 정의된 선형연산자 $T$ 에 대해 $V$의 임의의 순서기저 $\beta$ 를 택하자. $A:=[T]_{\beta}\in M_n(F)$ 라 하자. $\lambda\in F$ 가 $A$ 의 고유값이 되기 위한 필요충분조건은
$$\det \left( A-\lambda I_n \right)=\det \left( \lambda I_n-A \right)=0$$ 인 것이다. 여기서 다항식 $f(t)=\det \left( A-\lambda I_n \right)$ 는 행렬 $A$ 또는 선형연산자 $T$의 '특성다항식(Characteristic polynomial)' 이라 부르고, $\mathrm{char}(A)$ 또는 $\mathrm{char}(T)$ 로 쓰기도 한다.

 

고찰해 봅시다. 고유값과 고유벡터가 존재하기 위해서 왜 행렬식(determinant)이 0이 되어야 할까요? 행렬식이 0이 된다는 말은 주어진 고유값 방정식

 

$$T(v)=\lambda v \;\;\; \mathrm{or}\;\;\; Av=\lambda v$$ 

 

에 대해 $v\neq 0$ 인 해가 존재해야 한다는 것입니다.[각주:1] 자명해 이외의 비자명해가 존재해야 한다는 것이죠. 그러니 행렬의 입장에서 역행렬이 존재하지 않아야 한다는 것이고, 선형변환의 입장에서 비가역이어야 한다는 것입니다. 그래서 행렬식은 0이 되어야 한다는 것입니다.

 

이 논리를 이해하지 않고 무작정 외우는 분들이 많은 것 같은데 그러지 않았으면 합니다.

 

 

따름정리($L.A$) 5.12.1
$A\in M_n(F)$ 에 대하여 $v\in F^n$ 이 고유값 $\lambda$ 에 대응하는 고유벡터이기 위한 필요충분조건은 $v\neq 0$ 이고 $(A-\lambda I_n)v=0$ 인 것이다. 즉, 특성다항식 $\det(A-\lambda I_n)=0$ 인 것이다.

 

위 정리의 행렬 버전입니다.

 

 

2) 특성다항식의 성질

 

정리($L.A$) 5.13
$A\in M_n(F)$ 또는 벡터공간 $V$ 상에서 정의된 선형연산자 $T$ 의 행렬표현 $A:=[T]_{\beta}$ 에 대하여 다음이 성립한다.
① $A$ 의 특성다항식은 최고차항(leading coefficient)이 $(-1)^n$ 인 $n$ 차 다항식이다.
② $A$ 는 최대 $n$ 개의 서로 다른 고유값을 갖는다.

증명) 수학적 귀납법을 사용한다.

i) $n=2\; : \; A=\begin{pmatrix}
a_{11} & a_{12} \\
a_{21} & a_{22}
\end{pmatrix}$

$$\left| A-tI_n \right|=\begin{vmatrix}
a_{11}-t & a_{12} \\
a_{21} & a_{22}-t
\end{vmatrix}=(-1)^2(t-a_{11})(t-a{22})=(t-a_{11})(t-a_{22})$$
여기서 $a_{11}\neq a_{22}$ 이라면 최대의 $n=2$ 개의 서로 다른 고유값이 존재한다.

ii) $n=k \; : \; A=\begin{pmatrix}
a_{11} &  &  \\
 & \ddots  &  \\
 &  & a_{kk}
\end{pmatrix}$

$$\left| A-tI_n \right|=(-1)^n(t-a_{11})(t-a_{22})\cdot \;\cdots \;\cdot(t-a_{kk})$$
여기서 $a_{ii}\;(i=1,2,\cdots , k)$ 끼리 값이 모두 다르다면 최대 $n=k$ 의 서로 다른 고유값들이 존재한다.

 

 

 

정리($L.A$) 5.14
벡터공간 $V$ 위에서 정의된 선형연산자 $T$, 그리고 $T$의 서로 다른 고유값을 $\lambda_1,\cdots ,\lambda_k$ 라고 하자. 각각의 $i=1,\cdots ,k$ 에 대하여 $S_i$ 가 고유값 $\lambda_i$ 에 대응되는 고유벡터들로 이루어진 유한집합이라고 하였을 때, 만약 각각의 $S_i$ 가 일차독립이면 $S_1\cap S_2\cap \cdots \cap S_k$ 또한 일차독립이다.

 

 

증명은 생략합니다. 일차독립의 정의와, 고유벡터가 일차독립인 경우가 어떤 효과를 발휘하는지를 떠올리면 직관적으로 납득 가능할 것이고 그래야만 합니다.

 

 

따름정리($L.A$) 5.14.1
$T$가 $n$차원 벡터공간 $V$ 위에서 정의된 선형연산자라고 하자. $T$ 가 서로 다른 $n$개의 고유벡터를 가지면, $T$는 반드시 대각화가능하다.

증명) $T$ 의 서로 다른 고유값을 $\lambda_1, \cdots ,\lambda_n$ 이라 하자. 각각의 $\lambda_i$ 에 해당하는 고유벡터 $v_i$ 를 고르면 위의 정리($L.A$) 5.14에 의하여 $\left\{ v_1,\cdots ,v_n \right\}$ 는 일차독립이며 $\mathrm{dim}(V)=n$ 이므로 결국 $\left\{ v_1,\cdots ,v_n \right\}$ 는 $V$ 의 기저를 이룬다. 따라서 정리($L.A$) 5.11 에 의하여 $T$ 는 대각화가능하다.

이제 제대로 예제 하나를 통해 대각화 문제를 풀어보도록 하겠습니다.

 

예제 2) 주어진 행렬 $A=\begin{pmatrix}
1 & 1 \\
1 & 4
\end{pmatrix}$ 의 고유값은 $\lambda_1=3\;,\;\lambda_2=-1$ 을 예제 1) 에서 다루었다. 이들의 고유벡터를 모두 구해보고 행렬 $A$ 가 대각화가능한지 여부를 밝혀라.

 

Sol)

 

i) $$\begin{pmatrix}
1 &1  \\
4 & 1
\end{pmatrix}-\begin{pmatrix}
3 &0  \\
0 & 3
\end{pmatrix}=\begin{pmatrix}
-2 &1  \\
4 & -2
\end{pmatrix}:=B_1$$

 

라 하자.

 

$\lambda_1$ 에 대응되는 고유벡터를 $v_1=\begin{pmatrix}
x_1 \\
y_1
\end{pmatrix}$ 이라 하면,

 

$$\left( A-\lambda_1I_2 \right)v_1=B_1v_1=0 \;\; \Rightarrow \;\; \begin{pmatrix}
-2 &1  \\
4 & -2
\end{pmatrix}\begin{pmatrix}
x_1 \\
y_1
\end{pmatrix}=\begin{pmatrix}
0 \\
0
\end{pmatrix}$$

 

이를 풀면 $y_1=2x_1$ 이 되므로 $v_1=\begin{pmatrix}
x_1 \\
y_1
\end{pmatrix}=t\begin{pmatrix}
1 \\
2
\end{pmatrix}\;\;,\;\;(t\in \mathbb{R})$ 이라 쓸 수 있다. 즉 $\lambda_1=3$ 에 대응되는 고유벡터일 필요충분조건은 $v_1=t\begin{pmatrix}
1 \\
2
\end{pmatrix}\;\;,\;\;(t\in \mathbb{R})$ 인 것이다. 해집합은 $\left\{ t\begin{pmatrix}
1 \\
2
\end{pmatrix} \mid\in\mathbb{R} \right\}$

 

 

ii) $$\left( A-\lambda_2I_2 \right)v_2=B_2v_2=0 \;\; \Rightarrow \;\; \begin{pmatrix}
2 &1  \\
4 & 2
\end{pmatrix}\begin{pmatrix}
x_2 \\
y_2
\end{pmatrix}=\begin{pmatrix}
0 \\
0
\end{pmatrix}$$

 

라 하자. 그러면 $y_2=-2x_2$ 를 얻고 $v_1=\begin{pmatrix}
x_2 \\
y_2
\end{pmatrix}=s\begin{pmatrix}
1 \\
-2
\end{pmatrix}\;\;,\;\;(s\in \mathbb{R})$ 가 된다. 해집합은 $\left\{ s\begin{pmatrix}
1 \\
-2
\end{pmatrix} \mid\in\mathbb{R} \right\}$ 이다.

 

정리하면 집합 $\left\{ \begin{pmatrix}
1 \\
-2
\end{pmatrix},\begin{pmatrix}
1 \\
2
\end{pmatrix} \right\}$ 는 $A$ 의 고유벡터로 이루어진 $\mathbb{R}^2$ 의 기저이므로 $L_A$ 와 $A$ 는 모두 대각화가능하다.


2. 완전 분해, 완전 인수분해(Split over)

 

특성다항식은 벡터공간의 차원과 같은 숫자인 $n$ 차 다항식임을 알았습니다. $n$개의 다항식 중 공통 고유값이 존재할 수 있습니다. 즉 항들이 모두 1차항들로만 $n$개가 구성되면 $n$개의 서로 다른 고유값이 존재하는 것이지만 중근, 삼중근, .. 등등이 발생하지 않아야 한다는 법은 없지요. 일단 어떻게든 특성다항식을 만들었을 때, 모든 고유값들(중복이 될 수도 있음)에 해당하는 곱들이 발생하는 경우는 눈여겨 볼 필요가 있습니다. 대각화가능 조건의 최소한의 필요조건이기 때문입니다.

 

 

정의($L.A$) 5.4
다항식 $f(t)\in P(F)$ 가 체 $F$ 위에서 '완전 분해(Split-over)' 된다는 것은 체 $F$ 의 원소 $c,a_1,\cdots ,a_n$ (반드시 서로 다를 필요는 없다) 가 존재하여
$$f(t)=c(t-a_{1})(t-a_{2})\cdot \cdots \cdot (t-a_n)$$ 가 성립하는 것이다.

 

우선 용어에 대해서, 'Split-over' 에 대응되는 적당한 한국어가 없습니다. 의미상으로는 인수분해(factoring)과 동일합니다. 하지만 굳이 원서에서 인수분해(factoring)라는 용어를 쓰지 않는 것을 보면, $(t-\lambda_i)$ 꼴들만의 곱으로 예쁘게 쪼개진다는 것을 강조한다고 볼 수 있습니다. 왜냐하면 예컨대 항이 $(t^2-at+b)$ 이런 식으로 묶이더라도 인수분해라고 말하기 때문이죠.

 

주의해야 할 것은 스플릿 오버, 곧 인수분해가 되더라도 항상 대각화가능한 것은 아니라는 점입니다. 역으로 대각화가능하면 스플릿 오버가 된다고 말할 수는 있지요. 이 역은 아래에서 증명합니다. 스플릿 오버의 가능 여부는 '체(field)'가 어느 범위인지에 달려있다고 보시면 됩니다. 예를 들어 특성다항식을 구했을 때 허근이 발생하면, 복소수 체에서는 스플릿 오버되지만 실수 체에서는 스플릿 오버가 되지 않는 것입니다.

 

스플릿 오버가 되는 한 대각화가능까지를 함의하지는 못하지만 적어도 조르당 표준형(Jordan canonical form)은 구할 수 있습니다. 조르당 표준형은 사실 학부 과정으로 보기에 살짝 애매한 점이 있기는 합니다.[각주:2] 하지만 조르당 표준형까지 알고 있어야 내적공간에서 쓸모있는 테크닉에 대한 이해가 수월하고, 스플릿 오버와 대각화가능의 차이를 매끄럽게 구분할 수 있는 도구이기는 하지만 개인적으로 굳이 관심이 없다면 학부 선형대수 수준에서 반드시 알 필요는 없다고 봅니다.

 

 

정리($L.A$) 5.15
체 $F$ 상에서 정의된 벡터공간 $V$의 대각화가능한 선형연산자의 특성다항식은 체 $F$ 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.

증명) $n$ 차원 벡터공간 $V$ 의 대각화가능한 선형연산자를 $T$ 라 하고 $D=[T]_{\beta}$ 가 되도록 하는 $V$ 의 순서기저를 $\beta$ 라 하면,

$$D=\begin{pmatrix}
\lambda_1 & \cdots  &  & 0 \\
0 & \lambda_2 & \cdots &  \\
\vdots &  & \ddots  & 0 \\
0 &  & \cdots & \lambda_n
\end{pmatrix}$$
가 되며,

$$\begin{align*}

\mathrm{char}(T):=f(t)&=\det (tI-D) =\begin{pmatrix}
t-\lambda_1 & \cdots  &  & 0 \\
 \vdots& \ddots &  & \vdots   \\
 &  &   &  \\
0 & \cdots  & & t-\lambda_n
\end{pmatrix}
\\\\&=(-1)^n\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot \cdots \cdot 
\left( t-\lambda_n \right)
\end{align*}$$
따라서, $f(t)$ 는 체 $F$ 위에서 완전분해된다.

 

 

 

 

 

 

[참고문헌]

Linear Algebra : S.Friedberg, A.Insel, L.Spence, 5e, PEARSON

 

 

 

 

 

  1. 고유벡터는 정의상 영벡터가 될 수 없음에 주의. [본문으로]
  2. 그래서 임용고시에도 등장하지 않습니다. [본문으로]

댓글