고유값 문제를 해결하기 위해서는 꼭 특성다항식을 풀 수 있어야 합니다. 그런데 특성다항식이 왜 0이 되어야 하는지, 곧 행렬식이 왜 0이 되어야 하는지를 이해하기 위해서는 행렬의 가역성 또는 선형변환의 영공간에 관한 지식이 반드시 필요합니다. 무작정 외우지 말고 그에 대해서 모두 정리를 해 두었으니 차근차근 이해를 해보시기 바랍니다.
1. 특성다항식
1) 정의와 기본 정리
정의(L.A) 5.3
유한차원 벡터공간 V 위에서 정의된 선형연산자 T 에 대해 V의 임의의 순서기저 β 를 택하자. det 로 표기하는 T 의 행렬식이란 T 의 순서기저에 대한 행렬표현 [T]_{\beta}:=A 의 행렬식 \det (A) 로 정의한다.
정리(L.A) 5.12
유한차원 벡터공간 V 위에서 정의된 선형연산자 T 에 대해 V의 임의의 순서기저 \beta 를 택하자. A:=[T]_{\beta}\in M_n(F) 라 하자. \lambda\in F 가 A 의 고유값이 되기 위한 필요충분조건은
\det \left( A-\lambda I_n \right)=\det \left( \lambda I_n-A \right)=0 인 것이다. 여기서 다항식 f(t)=\det \left( A-\lambda I_n \right) 는 행렬 A 또는 선형연산자 T의 '특성다항식(Characteristic polynomial)' 이라 부르고, \mathrm{char}(A) 또는 \mathrm{char}(T) 로 쓰기도 한다.
고찰해 봅시다. 고유값과 고유벡터가 존재하기 위해서 왜 행렬식(determinant)이 0이 되어야 할까요? 행렬식이 0이 된다는 말은 주어진 고유값 방정식
T(v)=\lambda v \;\;\; \mathrm{or}\;\;\; Av=\lambda v
에 대해 v\neq 0 인 해가 존재해야 한다는 것입니다. 자명해 이외의 비자명해가 존재해야 한다는 것이죠. 그러니 행렬의 입장에서 역행렬이 존재하지 않아야 한다는 것이고, 선형변환의 입장에서 비가역이어야 한다는 것입니다. 그래서 행렬식은 0이 되어야 한다는 것입니다. 1
이 논리를 이해하지 않고 무작정 외우는 분들이 많은 것 같은데 그러지 않았으면 합니다.
따름정리(L.A) 5.12.1
A\in M_n(F) 에 대하여 v\in F^n 이 고유값 \lambda 에 대응하는 고유벡터이기 위한 필요충분조건은 v\neq 0 이고 (A-\lambda I_n)v=0 인 것이다. 즉, 특성다항식 \det(A-\lambda I_n)=0 인 것이다.
위 정리의 행렬 버전입니다.
2) 특성다항식의 성질
정리(L.A) 5.13
A\in M_n(F) 또는 벡터공간 V 상에서 정의된 선형연산자 T 의 행렬표현 A:=[T]_{\beta} 에 대하여 다음이 성립한다.
① A 의 특성다항식은 최고차항(leading coefficient)이 (-1)^n 인 n 차 다항식이다.
② A 는 최대 n 개의 서로 다른 고유값을 갖는다.
증명) 수학적 귀납법을 사용한다.
i) n=2\; : \; A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}
\left| A-tI_n \right|=\begin{vmatrix} a_{11}-t & a_{12} \\ a_{21} & a_{22}-t \end{vmatrix}=(-1)^2(t-a_{11})(t-a{22})=(t-a_{11})(t-a_{22})
여기서 a_{11}\neq a_{22} 이라면 최대의 n=2 개의 서로 다른 고유값이 존재한다.
ii) n=k \; : \; A=\begin{pmatrix} a_{11} & & \\ & \ddots & \\ & & a_{kk} \end{pmatrix}
\left| A-tI_n \right|=(-1)^n(t-a_{11})(t-a_{22})\cdot \;\cdots \;\cdot(t-a_{kk})
여기서 a_{ii}\;(i=1,2,\cdots , k) 끼리 값이 모두 다르다면 최대 n=k 의 서로 다른 고유값들이 존재한다.
정리(L.A) 5.14
벡터공간 V 위에서 정의된 선형연산자 T, 그리고 T의 서로 다른 고유값을 \lambda_1,\cdots ,\lambda_k 라고 하자. 각각의 i=1,\cdots ,k 에 대하여 S_i 가 고유값 \lambda_i 에 대응되는 고유벡터들로 이루어진 유한집합이라고 하였을 때, 만약 각각의 S_i 가 일차독립이면 S_1\cap S_2\cap \cdots \cap S_k 또한 일차독립이다.
증명은 생략합니다. 일차독립의 정의와, 고유벡터가 일차독립인 경우가 어떤 효과를 발휘하는지를 떠올리면 직관적으로 납득 가능할 것이고 그래야만 합니다.
따름정리(L.A) 5.14.1
T가 n차원 벡터공간 V 위에서 정의된 선형연산자라고 하자. T 가 서로 다른 n개의 고유벡터를 가지면, T는 반드시 대각화가능하다.
증명) T 의 서로 다른 고유값을 \lambda_1, \cdots ,\lambda_n 이라 하자. 각각의 \lambda_i 에 해당하는 고유벡터 v_i 를 고르면 위의 정리(L.A) 5.14에 의하여 \left\{ v_1,\cdots ,v_n \right\} 는 일차독립이며 \mathrm{dim}(V)=n 이므로 결국 \left\{ v_1,\cdots ,v_n \right\} 는 V 의 기저를 이룬다. 따라서 정리(L.A) 5.11 에 의하여 T 는 대각화가능하다.
이제 제대로 예제 하나를 통해 대각화 문제를 풀어보도록 하겠습니다.
예제 2) 주어진 행렬 A=\begin{pmatrix} 1 & 1 \\ 1 & 4 \end{pmatrix} 의 고유값은 \lambda_1=3\;,\;\lambda_2=-1 을 예제 1) 에서 다루었다. 이들의 고유벡터를 모두 구해보고 행렬 A 가 대각화가능한지 여부를 밝혀라.
Sol)
i) \begin{pmatrix} 1 &1 \\ 4 & 1 \end{pmatrix}-\begin{pmatrix} 3 &0 \\ 0 & 3 \end{pmatrix}=\begin{pmatrix} -2 &1 \\ 4 & -2 \end{pmatrix}:=B_1
라 하자.
\lambda_1 에 대응되는 고유벡터를 v_1=\begin{pmatrix} x_1 \\ y_1 \end{pmatrix} 이라 하면,
\left( A-\lambda_1I_2 \right)v_1=B_1v_1=0 \;\; \Rightarrow \;\; \begin{pmatrix} -2 &1 \\ 4 & -2 \end{pmatrix}\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}
이를 풀면 y_1=2x_1 이 되므로 v_1=\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}=t\begin{pmatrix} 1 \\ 2 \end{pmatrix}\;\;,\;\;(t\in \mathbb{R}) 이라 쓸 수 있다. 즉 \lambda_1=3 에 대응되는 고유벡터일 필요충분조건은 v_1=t\begin{pmatrix} 1 \\ 2 \end{pmatrix}\;\;,\;\;(t\in \mathbb{R}) 인 것이다. 해집합은 \left\{ t\begin{pmatrix} 1 \\ 2 \end{pmatrix} \mid\in\mathbb{R} \right\}
ii) \left( A-\lambda_2I_2 \right)v_2=B_2v_2=0 \;\; \Rightarrow \;\; \begin{pmatrix} 2 &1 \\ 4 & 2 \end{pmatrix}\begin{pmatrix} x_2 \\ y_2 \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}
라 하자. 그러면 y_2=-2x_2 를 얻고 v_1=\begin{pmatrix} x_2 \\ y_2 \end{pmatrix}=s\begin{pmatrix} 1 \\ -2 \end{pmatrix}\;\;,\;\;(s\in \mathbb{R}) 가 된다. 해집합은 \left\{ s\begin{pmatrix} 1 \\ -2 \end{pmatrix} \mid\in\mathbb{R} \right\} 이다.
정리하면 집합 \left\{ \begin{pmatrix} 1 \\ -2 \end{pmatrix},\begin{pmatrix} 1 \\ 2 \end{pmatrix} \right\} 는 A 의 고유벡터로 이루어진 \mathbb{R}^2 의 기저이므로 L_A 와 A 는 모두 대각화가능하다.
2. 완전 분해, 완전 인수분해(Split over)
특성다항식은 벡터공간의 차원과 같은 숫자인 n 차 다항식임을 알았습니다. n개의 다항식 중 공통 고유값이 존재할 수 있습니다. 즉 항들이 모두 1차항들로만 n개가 구성되면 n개의 서로 다른 고유값이 존재하는 것이지만 중근, 삼중근, .. 등등이 발생하지 않아야 한다는 법은 없지요. 일단 어떻게든 특성다항식을 만들었을 때, 모든 고유값들(중복이 될 수도 있음)에 해당하는 곱들이 발생하는 경우는 눈여겨 볼 필요가 있습니다. 대각화가능 조건의 최소한의 필요조건이기 때문입니다.
정의(L.A) 5.4
다항식 f(t)\in P(F) 가 체 F 위에서 '완전 분해(Split-over)' 된다는 것은 체 F 의 원소 c,a_1,\cdots ,a_n (반드시 서로 다를 필요는 없다) 가 존재하여
f(t)=c(t-a_{1})(t-a_{2})\cdot \cdots \cdot (t-a_n) 가 성립하는 것이다.
우선 용어에 대해서, 'Split-over' 에 대응되는 적당한 한국어가 없습니다. 의미상으로는 인수분해(factoring)과 동일합니다. 하지만 굳이 원서에서 인수분해(factoring)라는 용어를 쓰지 않는 것을 보면, (t-\lambda_i) 꼴들만의 곱으로 예쁘게 쪼개진다는 것을 강조한다고 볼 수 있습니다. 왜냐하면 예컨대 항이 (t^2-at+b) 이런 식으로 묶이더라도 인수분해라고 말하기 때문이죠.
주의해야 할 것은 스플릿 오버, 곧 인수분해가 되더라도 항상 대각화가능한 것은 아니라는 점입니다. 역으로 대각화가능하면 스플릿 오버가 된다고 말할 수는 있지요. 이 역은 아래에서 증명합니다. 스플릿 오버의 가능 여부는 '체(field)'가 어느 범위인지에 달려있다고 보시면 됩니다. 예를 들어 특성다항식을 구했을 때 허근이 발생하면, 복소수 체에서는 스플릿 오버되지만 실수 체에서는 스플릿 오버가 되지 않는 것입니다.
스플릿 오버가 되는 한 대각화가능까지를 함의하지는 못하지만 적어도 조르당 표준형(Jordan canonical form)은 구할 수 있습니다. 조르당 표준형은 사실 학부 과정으로 보기에 살짝 애매한 점이 있기는 합니다. 하지만 조르당 표준형까지 알고 있어야 내적공간에서 쓸모있는 테크닉에 대한 이해가 수월하고, 스플릿 오버와 대각화가능의 차이를 매끄럽게 구분할 수 있는 도구이기는 하지만 개인적으로 굳이 관심이 없다면 학부 선형대수 수준에서 반드시 알 필요는 없다고 봅니다. 2
정리(L.A) 5.15
체 F 상에서 정의된 벡터공간 V의 대각화가능한 선형연산자의 특성다항식은 체 F 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.
증명) n 차원 벡터공간 V 의 대각화가능한 선형연산자를 T 라 하고 D=[T]_{\beta} 가 되도록 하는 V 의 순서기저를 \beta 라 하면,
D=\begin{pmatrix} \lambda_1 & \cdots & & 0 \\ 0 & \lambda_2 & \cdots & \\ \vdots & & \ddots & 0 \\ 0 & & \cdots & \lambda_n \end{pmatrix}
가 되며,
\begin{align*} \mathrm{char}(T):=f(t)&=\det (tI-D) =\begin{pmatrix} t-\lambda_1 & \cdots & & 0 \\ \vdots& \ddots & & \vdots \\ & & & \\ 0 & \cdots & & t-\lambda_n \end{pmatrix} \\\\&=(-1)^n\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot \cdots \cdot \left( t-\lambda_n \right) \end{align*}
따라서, f(t) 는 체 F 위에서 완전분해된다.
[참고문헌]
Linear Algebra : S.Friedberg, A.Insel, L.Spence, 5e, PEARSON
'선형대수학(Linear Algebra) > 고유치 문제' 카테고리의 다른 글
선형연산자로 고유값 문제를 해결하기(Eigenvalue problem with linear operator) (1) | 2023.02.03 |
---|---|
행렬의 대각화와 고유값 문제(Diagonalization of matrix with Eigenvalue problem) (0) | 2022.03.14 |
고유공간(Eigenspace) (0) | 2022.03.08 |
대각행렬과 행렬의 닮음 (Diagonal matrix and Similar of matrix) (0) | 2022.03.08 |
고유값과 고유벡터 (Eigenvalue and Eigenvector) (0) | 2022.01.05 |
댓글