본문 바로가기
선형대수학(Linear Algebra)/고유치 문제

행렬의 대각화와 고유값 문제(Diagonalization of matrix with Eigenvalue problem)

by Gosamy 2022. 3. 14.
반응형

고유값 문제의 기본적인 해석과 대각행렬 및 대각화의 뜻, 닮음행렬의 개념을 장착하면 이제 대각화와 고유값 문제의 연관성을 제대로 파해쳐 볼 시간입니다. 이들은 사실상 동치의 관계이 있다는 것을 알게 될 것입니다. 때문에 오늘 증명할 세 정리는 고유값 문제에서 가장 중요한 정리들이며 마지막 정리에 별표를 5개 박으시기 바랍니다. 


1) 대각화가능과 고유값

 

정리($L.A$) 5.8

$A\in M_n(F)$ 가 대각화가능이면 $A$는 중복을 허락하여 $n$개의 고유값 $\lambda_1,\cdots ,\lambda_n \in F$ 를 가지며, $A$의 고유다항식은 $\left| tI_n-A \right|=\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot\, \cdots \,\cdot \left( t-\lambda_n \right)$ 으로 주어진다.

 

증명) 행렬 $A$가 대각화가능하면 $D=P^{-1}AP$ 가 되는 가역행렬 $P\in M_n(F)$ 와 대각행렬

$D=\begin{pmatrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_n \end{pmatrix}$ 이 존재한다. 행렬 $A$와 $D$는 닮음관계이므로 둘은 고유다항식이 동일하여
$$\left| tI_n-A \right|=\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot\, \cdots \,\cdot \left( t-\lambda_n \right)=\left| tI_n-D \right|$$ 가 성립한다.

 

 

2) 고유벡터는 선형독립이다.

 

정리($L.A$) 5.9

$A\in M_n(F)$ 의 서로 다른 고유값이 $\lambda_1,\cdots ,\lambda_k \in F$ 이고, 이에 대응되는 벡터 $\mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_k \in F^n$ 가 각 고유값에 대응되는 고유벡터라면, $\mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_n \in F^n$ 는 선형독립이다.

 

증명) $k$에 관한 수학적 귀납법(Mathematical Induction)을 사용하자. (단, $x_i\in V$ 이다.[각주:1])

i) $k=1$ : $\mathbf{x}_1\neq \mathbf{0}$ 이므로 $\lambda_1$ 의 고유벡터 $\mathbf{x}_1$ 은 선형독립이다.

ii) $k=2$ : 서로 다른 고유값 $\lambda_1,\cdots \lambda_{k-1}$ 의 고유벡터 $x_1,\cdots x_{k-1}$ 이 선형독립이라고 가정하자. 그리고 나서

$$b_1x_1+\cdots b_{k-1}x_{k-1}+b_kx_k=\mathbf{0}\;\;\; \cdots \;\;\; (1)$$
라 하자. 그러면

$$\begin{align*} \mathbf{0}=A\cdot \mathbf{0}&=A\left( b_1x_1+\cdots b_{k-1}x_{k-1}+b_kx_k \right) \\\\&= b_1\left( Ax_1 \right)+\cdots + b_{k-1}\left( Ax_{k-1} \right)+b_k\left( Ax_k \right) \\\\&= b_1\left( \lambda_1x_1 \right)+\cdots + b_{k-1}\left( \lambda_{k-1}x_{k-1} \right)+b_k\left( \lambda_{k}x_k \right) \;\;\;\cdots \;\;\;(2) \end{align*}$$

$(1)\times \lambda_k - (2)$ 를 계산하면,

$$b_1\left( \lambda_k-\lambda_1 \right)+b_2\left( \lambda_k-\lambda_2 \right)+\cdots + b_{k-1}\left( \lambda_k-\lambda_{k-1} \right)=0$$

를 얻는다. 그런데 $\lambda_1,\cdots ,\lambda_k$ 는 서로 다른 고유값이므로 위 식의 우변 $0$을 만족하기 위해서는 계수들 $b_1=b_2=\cdots =b_{k-1} =0$ 을 만족해야 한다. 따라서 $(1)$ 에서 $b_kx_k=0$ 이고, 고유벡터는 영벡터가 아니므로 $b_k=0$ 이다. 고로 $x_1,\cdots x_k$ 는 선형독립이다.

3) 필요충분조건은?

 

위 두 정리를 통해 보이고 싶은 것은 결국 아래 정리입니다. 아래 정리는 고유값 문제에서 가장 중요한 정리로 필요충분관계를 설명하고 있습니다. 마침 딱 정리 5.10번입니다. 앞으로 10번 정리라는 말을 종종 쓸 것입니다.

 

정리($L.A$) 5.10

$A\in M_n(F)$ 가 대각화가능일 필요충분조건은 $A$가 중복을 허락하여 $n$개의 고유값 $\lambda_1,\cdots ,\lambda_n\in F$ 를 갖고 이에 대응되는 선형독립인 고유벡터 $\mathbf{p}_1,\cdots \mathbf{p}_n$ 이 존재하는 것이다.

 

증명)

1) $\Rightarrow$ : 행렬 $A$가 대각화가능이면 $D=P^{-1}AP$ 를 만족하는 가역행렬 $P\in M_n(F)$ 가 존재한다. 그러면 $AP=DP$ 가 성립하며, 여기서 행렬 $D$는 적당한 $\lambda_1,\cdots ,\lambda_k$ 에 대해 $D=\begin{pmatrix}
\lambda_1 &  &  \\
 & \ddots  &  \\
 &  & \lambda_n
\end{pmatrix}$ 를 만족하는 행렬이다. 이 때 $P$의 열들을 열벡터 $p_1,\cdots p_n \in V$ 라 적으면,

$$AP=A\left( p_1\;\;p_2\;\;\cdots \;\;p_n \right)=\left( Ap_1,Ap_2,\cdots ,Ap_n \right)$$
$$PD=\left( p_1,\cdots p_n \right)\begin{pmatrix}
\lambda_1 &  &  \\
 & \ddots  &  \\
 &  & \lambda_n
\end{pmatrix}=\left( \lambda_1p_1,\cdots ,\lambda_np_n \right)$$

두 식은 같으므로, 이로부터

$$Ap_1=\lambda_1p_1, \cdots , Ap_n=\lambda_np_n$$

를 얻는다. 즉 $\lambda_1,\cdots \lambda_n$ 은 행렬 $A$의 고유값이고 $p_1,\cdots ,p_n$ 은 $A$의 고유벡터이며, 행렬 $P$는 가역이니 가역행렬의 정리에 따라 열벡터 $p_1,\cdots p_n$ 들은 선형독립이다.


2) $\Leftarrow$ : 행렬 $A$가 고유값 $\lambda_1,\cdots \lambda_n$ 을 갖고 $p_1,\cdots p_n$ 은 각각의 고유값에 대응되는 고유벡터라 하면  $Ap_1=\lambda_1p_1,\cdots , Ap_n=\lambda_np_n$ 이 성립한다. 이 때 대각행렬 $D$를 $D=\begin{pmatrix}
\lambda_1 &  &  \\
 & \ddots  &  \\
 &  & \lambda_n
\end{pmatrix}$ 로 둔다고 하면

$$AP=AP=A\left( p_1\;\;p_2\;\;\cdots \;\;p_n \right)=\left( Ap_1,Ap_2,\cdots ,Ap_n \right)
=\left( \lambda_1p_1,\cdots ,\lambda_np_n \right)=PD$$
가 되며, $P=\left( p_1,\cdots p_n \right)$ 를 이루는 고유벡터 $p_1,\cdots p_n$ 들은 위의 정리 ($L.A$) 5.9 에 의하여 선형독립이므로 $P\in M_n(F)$ 은 가역이다.

따라서 $D=P^{-1}AP$ 가 되어 $A$는 대각화가능한 행렬이다.

 

 

고유값 문제에서 가장 중요한 정리입니다. 선형대수학을 제대로 공부하지 않고 다른 수학 과목에서 간단히 학습하고 넘어가는 경우에 이 정리만 그냥 외워서 넘어가는 경우가 많은데, 정확한 증명을 하면 이와 같습니다. 이 정리는 직접 해보면 알겠지만 여태까지 선형변환이나 행렬이론에서 보였던 정리들보다 놀라울 정도로 쉽습니다. 사실상 고유값, 고유벡터의 정의 그리고 가역행렬에 대한 몇가지 지식만 있으면 되지 술술 읽혀 내려가는 수준이며 추상적인 벡터공간 따위의 지식도 딱히 필요가 없습니다.[각주:2] 어쩌다 이 정리의 결론만 파헤치려고 들어오신 분들도 증명을 꼭 해보고 왜 고유값과 고유벡터를 찾는 행위가 대각화가능성과 연결되는 것인지 얽힌 끈을 스스로 풀어냈으면 좋겠습니다.

 

 

 

[참고 문헌]

선형대수학, 청문각, 강경태 및 송석준 지음

 

 

 

  1. 언제나 그랬듯 벡터 볼드체를 굳이 하지 않겠다는 겁니다. 수식 쓰기가 불편해서 그렇습니다.. [본문으로]
  2. 물론, 단원 소개에서 말씀드렸다시피 고유값 문제를 선형변환의 관점에서 다루려면 또다시 벡터공간의 추상적인 이미지를 떠올려야 합니다. [본문으로]

댓글