Processing math: 3%
본문 바로가기
선형대수학(Linear Algebra)/고유치 문제

특성다항식(Characteristic polynomial)

by Gosamy 2023. 2. 5.
반응형

고유값 문제를 해결하기 위해서는 꼭 특성다항식을 풀 수 있어야 합니다. 그런데 특성다항식이 왜 0이 되어야 하는지, 곧 행렬식이 왜 0이 되어야 하는지를 이해하기 위해서는 행렬의 가역성 또는 선형변환의 영공간에 관한 지식이 반드시 필요합니다. 무작정 외우지 말고 그에 대해서 모두 정리를 해 두었으니 차근차근 이해를 해보시기 바랍니다.


1. 특성다항식

 

1) 정의와 기본 정리

 

정의(L.A) 5.3
유한차원 벡터공간 V 위에서 정의된 선형연산자 T 에 대해 V의 임의의 순서기저 β 를 택하자. det
로 표기하는 T 의 행렬식이란 T 의 순서기저에 대한 행렬표현 [T]_{\beta}:=A 의 행렬식 \det (A) 로 정의한다.

정리(L.A) 5.12
유한차원 벡터공간 V 위에서 정의된 선형연산자 T 에 대해 V의 임의의 순서기저 \beta 를 택하자. A:=[T]_{\beta}\in M_n(F) 라 하자. \lambda\in FA 의 고유값이 되기 위한 필요충분조건은
\det \left( A-\lambda I_n \right)=\det \left( \lambda I_n-A \right)=0 인 것이다. 여기서 다항식 f(t)=\det \left( A-\lambda I_n \right) 는 행렬 A 또는 선형연산자 T의 '특성다항식(Characteristic polynomial)' 이라 부르고, \mathrm{char}(A) 또는 \mathrm{char}(T) 로 쓰기도 한다.

 

고찰해 봅시다. 고유값과 고유벡터가 존재하기 위해서 왜 행렬식(determinant)이 0이 되어야 할까요? 행렬식이 0이 된다는 말은 주어진 고유값 방정식

 

T(v)=\lambda v \;\;\; \mathrm{or}\;\;\; Av=\lambda v 

 

에 대해 v\neq 0 인 해가 존재해야 한다는 것입니다.[각주:1] 자명해 이외의 비자명해가 존재해야 한다는 것이죠. 그러니 행렬의 입장에서 역행렬이 존재하지 않아야 한다는 것이고, 선형변환의 입장에서 비가역이어야 한다는 것입니다. 그래서 행렬식은 0이 되어야 한다는 것입니다.

 

이 논리를 이해하지 않고 무작정 외우는 분들이 많은 것 같은데 그러지 않았으면 합니다.

 

 

따름정리(L.A) 5.12.1
A\in M_n(F) 에 대하여 v\in F^n 이 고유값 \lambda 에 대응하는 고유벡터이기 위한 필요충분조건은 v\neq 0 이고 (A-\lambda I_n)v=0 인 것이다. 즉, 특성다항식 \det(A-\lambda I_n)=0 인 것이다.

 

위 정리의 행렬 버전입니다.

 

 

2) 특성다항식의 성질

 

정리(L.A) 5.13
A\in M_n(F) 또는 벡터공간 V 상에서 정의된 선형연산자 T 의 행렬표현 A:=[T]_{\beta} 에 대하여 다음이 성립한다.
A 의 특성다항식은 최고차항(leading coefficient)이 (-1)^nn 차 다항식이다.
A 는 최대 n 개의 서로 다른 고유값을 갖는다.

증명) 수학적 귀납법을 사용한다.

i) n=2\; : \; A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}

\left| A-tI_n \right|=\begin{vmatrix} a_{11}-t & a_{12} \\ a_{21} & a_{22}-t \end{vmatrix}=(-1)^2(t-a_{11})(t-a{22})=(t-a_{11})(t-a_{22})
여기서 a_{11}\neq a_{22} 이라면 최대의 n=2 개의 서로 다른 고유값이 존재한다.

ii) n=k \; : \; A=\begin{pmatrix} a_{11} &  &  \\  & \ddots  &  \\  &  & a_{kk} \end{pmatrix}

\left| A-tI_n \right|=(-1)^n(t-a_{11})(t-a_{22})\cdot \;\cdots \;\cdot(t-a_{kk})
여기서 a_{ii}\;(i=1,2,\cdots , k) 끼리 값이 모두 다르다면 최대 n=k 의 서로 다른 고유값들이 존재한다.

 

 

 

정리(L.A) 5.14
벡터공간 V 위에서 정의된 선형연산자 T, 그리고 T의 서로 다른 고유값을 \lambda_1,\cdots ,\lambda_k 라고 하자. 각각의 i=1,\cdots ,k 에 대하여 S_i 가 고유값 \lambda_i 에 대응되는 고유벡터들로 이루어진 유한집합이라고 하였을 때, 만약 각각의 S_i 가 일차독립이면 S_1\cap S_2\cap \cdots \cap S_k 또한 일차독립이다.

 

 

증명은 생략합니다. 일차독립의 정의와, 고유벡터가 일차독립인 경우가 어떤 효과를 발휘하는지를 떠올리면 직관적으로 납득 가능할 것이고 그래야만 합니다.

 

 

따름정리(L.A) 5.14.1
Tn차원 벡터공간 V 위에서 정의된 선형연산자라고 하자. T 가 서로 다른 n개의 고유벡터를 가지면, T는 반드시 대각화가능하다.

증명) T 의 서로 다른 고유값을 \lambda_1, \cdots ,\lambda_n 이라 하자. 각각의 \lambda_i 에 해당하는 고유벡터 v_i 를 고르면 위의 정리(L.A) 5.14에 의하여 \left\{ v_1,\cdots ,v_n \right\} 는 일차독립이며 \mathrm{dim}(V)=n 이므로 결국 \left\{ v_1,\cdots ,v_n \right\}V 의 기저를 이룬다. 따라서 정리(L.A) 5.11 에 의하여 T 는 대각화가능하다.

이제 제대로 예제 하나를 통해 대각화 문제를 풀어보도록 하겠습니다.

 

예제 2) 주어진 행렬 A=\begin{pmatrix} 1 & 1 \\ 1 & 4 \end{pmatrix} 의 고유값은 \lambda_1=3\;,\;\lambda_2=-1예제 1) 에서 다루었다. 이들의 고유벡터를 모두 구해보고 행렬 A 가 대각화가능한지 여부를 밝혀라.

 

Sol)

 

i) \begin{pmatrix} 1 &1  \\ 4 & 1 \end{pmatrix}-\begin{pmatrix} 3 &0  \\ 0 & 3 \end{pmatrix}=\begin{pmatrix} -2 &1  \\ 4 & -2 \end{pmatrix}:=B_1

 

라 하자.

 

\lambda_1 에 대응되는 고유벡터를 v_1=\begin{pmatrix} x_1 \\ y_1 \end{pmatrix} 이라 하면,

 

\left( A-\lambda_1I_2 \right)v_1=B_1v_1=0 \;\; \Rightarrow \;\; \begin{pmatrix} -2 &1  \\ 4 & -2 \end{pmatrix}\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}

 

이를 풀면 y_1=2x_1 이 되므로 v_1=\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}=t\begin{pmatrix} 1 \\ 2 \end{pmatrix}\;\;,\;\;(t\in \mathbb{R}) 이라 쓸 수 있다. 즉 \lambda_1=3 에 대응되는 고유벡터일 필요충분조건은 v_1=t\begin{pmatrix} 1 \\ 2 \end{pmatrix}\;\;,\;\;(t\in \mathbb{R}) 인 것이다. 해집합은 \left\{ t\begin{pmatrix} 1 \\ 2 \end{pmatrix} \mid\in\mathbb{R} \right\}

 

 

ii) \left( A-\lambda_2I_2 \right)v_2=B_2v_2=0 \;\; \Rightarrow \;\; \begin{pmatrix} 2 &1  \\ 4 & 2 \end{pmatrix}\begin{pmatrix} x_2 \\ y_2 \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}

 

라 하자. 그러면 y_2=-2x_2 를 얻고 v_1=\begin{pmatrix} x_2 \\ y_2 \end{pmatrix}=s\begin{pmatrix} 1 \\ -2 \end{pmatrix}\;\;,\;\;(s\in \mathbb{R}) 가 된다. 해집합은 \left\{ s\begin{pmatrix} 1 \\ -2 \end{pmatrix} \mid\in\mathbb{R} \right\} 이다.

 

정리하면 집합 \left\{ \begin{pmatrix} 1 \\ -2 \end{pmatrix},\begin{pmatrix} 1 \\ 2 \end{pmatrix} \right\}A 의 고유벡터로 이루어진 \mathbb{R}^2 의 기저이므로 L_AA 는 모두 대각화가능하다.


2. 완전 분해, 완전 인수분해(Split over)

 

특성다항식은 벡터공간의 차원과 같은 숫자인 n 차 다항식임을 알았습니다. n개의 다항식 중 공통 고유값이 존재할 수 있습니다. 즉 항들이 모두 1차항들로만 n개가 구성되면 n개의 서로 다른 고유값이 존재하는 것이지만 중근, 삼중근, .. 등등이 발생하지 않아야 한다는 법은 없지요. 일단 어떻게든 특성다항식을 만들었을 때, 모든 고유값들(중복이 될 수도 있음)에 해당하는 곱들이 발생하는 경우는 눈여겨 볼 필요가 있습니다. 대각화가능 조건의 최소한의 필요조건이기 때문입니다.

 

 

정의(L.A) 5.4
다항식 f(t)\in P(F) 가 체 F 위에서 '완전 분해(Split-over)' 된다는 것은 체 F 의 원소 c,a_1,\cdots ,a_n (반드시 서로 다를 필요는 없다) 가 존재하여
f(t)=c(t-a_{1})(t-a_{2})\cdot \cdots \cdot (t-a_n) 가 성립하는 것이다.

 

우선 용어에 대해서, 'Split-over' 에 대응되는 적당한 한국어가 없습니다. 의미상으로는 인수분해(factoring)과 동일합니다. 하지만 굳이 원서에서 인수분해(factoring)라는 용어를 쓰지 않는 것을 보면, (t-\lambda_i) 꼴들만의 곱으로 예쁘게 쪼개진다는 것을 강조한다고 볼 수 있습니다. 왜냐하면 예컨대 항이 (t^2-at+b) 이런 식으로 묶이더라도 인수분해라고 말하기 때문이죠.

 

주의해야 할 것은 스플릿 오버, 곧 인수분해가 되더라도 항상 대각화가능한 것은 아니라는 점입니다. 역으로 대각화가능하면 스플릿 오버가 된다고 말할 수는 있지요. 이 역은 아래에서 증명합니다. 스플릿 오버의 가능 여부는 '체(field)'가 어느 범위인지에 달려있다고 보시면 됩니다. 예를 들어 특성다항식을 구했을 때 허근이 발생하면, 복소수 체에서는 스플릿 오버되지만 실수 체에서는 스플릿 오버가 되지 않는 것입니다.

 

스플릿 오버가 되는 한 대각화가능까지를 함의하지는 못하지만 적어도 조르당 표준형(Jordan canonical form)은 구할 수 있습니다. 조르당 표준형은 사실 학부 과정으로 보기에 살짝 애매한 점이 있기는 합니다.[각주:2] 하지만 조르당 표준형까지 알고 있어야 내적공간에서 쓸모있는 테크닉에 대한 이해가 수월하고, 스플릿 오버와 대각화가능의 차이를 매끄럽게 구분할 수 있는 도구이기는 하지만 개인적으로 굳이 관심이 없다면 학부 선형대수 수준에서 반드시 알 필요는 없다고 봅니다.

 

 

정리(L.A) 5.15
F 상에서 정의된 벡터공간 V의 대각화가능한 선형연산자의 특성다항식은 체 F 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.

증명) n 차원 벡터공간 V 의 대각화가능한 선형연산자를 T 라 하고 D=[T]_{\beta} 가 되도록 하는 V 의 순서기저를 \beta 라 하면,

D=\begin{pmatrix} \lambda_1 & \cdots  &  & 0 \\ 0 & \lambda_2 & \cdots &  \\ \vdots &  & \ddots  & 0 \\ 0 &  & \cdots & \lambda_n \end{pmatrix}
가 되며,

\begin{align*} \mathrm{char}(T):=f(t)&=\det (tI-D) =\begin{pmatrix} t-\lambda_1 & \cdots  &  & 0 \\  \vdots& \ddots &  & \vdots   \\  &  &   &  \\ 0 & \cdots  & & t-\lambda_n \end{pmatrix} \\\\&=(-1)^n\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot \cdots \cdot  \left( t-\lambda_n \right) \end{align*}
따라서, f(t) 는 체 F 위에서 완전분해된다.

 

 

 

 

 

 

[참고문헌]

Linear Algebra : S.Friedberg, A.Insel, L.Spence, 5e, PEARSON

 

 

 

 

 

  1. 고유벡터는 정의상 영벡터가 될 수 없음에 주의. [본문으로]
  2. 그래서 임용고시에도 등장하지 않습니다. [본문으로]

댓글