본문 바로가기
선형대수학(Linear Algebra)/고유치 문제

고유값과 고유벡터 (Eigenvalue and Eigenvector)

by Gosamy 2022. 1. 5.
반응형

고유값 문제는 행렬과 벡터의 곱이 그 벡터의 실수배와 등호로 이어져 있는 간단한 형태를 띠고 있습니다. 주저리 첨언할 필요도 없이 고유값 문제는 굳이 선형대수학을 따로 공부하지 않아도 자연계 학생들이 전공과목에서 거의 필연적으로 마주하는 문제입니다. 특히 물리학에서는 고전역학에서 연성진동(Coupled Oscillation)이나 관성 텐서의 대각화를 할 때 등장하고, 양자역학에서야 말할 것도 없습니다. 이처럼 공학과 물리에서 매우 폭넓게 응용되기 때문에 공대생들에게 꼭 필요한 도구입니다. 이 경우 99%의 확률로 고유값 문제를 행렬의 관점에서 다가가게 됩니다. 

 

하지만 행렬과 선형변환은 동형이고, 따라서 고유값 문제를 선형변환스럽게 다룰 수도 있습니다. 그렇게 되면 의미 해석이 조금씩 달라지고 약간 더 어려워집니다. 수학과에 가까울수록 선형변환으로도 고유값 문제를 다루지만 공대 수준이라면 행렬 방법만 익히면 됩니다. 그것이 조금 더 간단하기에, 본 포스팅도 행렬 위주로 고유값 문제를 풀어나가긴 하지만 선형변환에 대한 이야기도 종종 되도록 뒤쪽에서 하겠습니다. 선형변환을 몰라도 고유값 문제를 풀 수 있기 때문에, 선형변환을 필수적으로 학습하진 않아도 됩니다. 그러나 행렬과 행렬식에 대한 이해는 반드시 갖추어져 있어야 고유값 문제를 해결할 수 있습니다. 대각행렬에 대해서도 학습이 필요합니다. (링크를 달아두긴 하였으나 다음 글에 준비되어 있습니다.)

 

 

참고로 물리러들에게 고유값 문제는 굉장히 중요한데, 알고 있으면 좋을 것이 있습니다. 양자역학에서 고유값 문제는 행렬(연산자)의 형태로 고려하여 풀어낼 수는 있으나, 고유값 문제라고 해서 반드시 행렬을 대각화하거나 후술할 특성방정식을 풀어야 하는 것은 아닙니다. 오히려 그보다도 미분방정식을 풀어내는 테크닉이 중요합니다. 그런데 굳이 고유값 문제라고 강조하는 이유는 그 고유값들과 고유벡터가 내적공간의 특별한 Hermitian 연산자로 기능을 할 수 있기 때문이라고 볼 수 있습니다. 그 덕분에, 슈뢰딩거 방정식 등에서 발생하는 고유값 문제에 대한 포괄적 이해를 위해서는 이 글을 넘어서 내적공간에서의 행렬의 유니타리 대각화, '스투름-리우빌 이론(Sturm–Liouville theory)'을 공부하는 것이 좋습니다. 그래서 선형대수학 책에 스투름-리우빌 이론은 없지만 수리물리학 책에는 반드시 그것이 수록되어 있습니다.


1. 고유값과 고유벡터

1) 정의

 

정의($L.A$) 5-1) 고유벡터와 고유값
$A\in M_n(F)$, $\lambda\in F$ 그리고 $\mathbf{x}\in F^n$ 에 대하여 다음을 고려하자.
$$A\mathbf{x}=\lambda\mathbf{x}\;\;\;\;\;(\mathbf{x}\neq \mathbf{0})$$ 만일 $\lambda$, $\mathbf{x}$ 가 위 방정식을 만족하면 $\lambda$ 는 $A$의 '고유값(Eigenvalue)'이라고 한다. 또 $\mathbf{x}$ 는 $\lambda$ 에 대응되는 '고유벡터(Eigenvector)'라 한다. 이 방정식은 이항하면 다음과 같이 나타낼 수도 있다.
$$\left( \lambda I_n-A \right)\mathbf{x}=\left( A-\lambda I_n \right)\mathbf{x}=\mathbf{0}$$

 

고유값 문제의 꼴을 보면 $A\mathbf{x}=\lambda\mathbf{x}$ 인데, 반드시 $\mathbf{x}\neq \mathbf{0}$ 여야 합니다. 그러니 $\left( \lambda I_n-A \right)\mathbf{x}=\left( A-\lambda I_n \right)\mathbf{x}=\mathbf{0}$ 는 자명해 이외의 해를 가져야 함을 뜻합니다. 자연스럽게 가역성에 관한 정리랑 연결되는데, 보통 선형대수학에서는 가역행렬을 비가역행렬보다 압도적으로 많이 다루지만 위 꼴은 비가역이 되어야 고유벡터를 찾을 수 있다는 결론에 도달합니다.

 

2) 특성다항식

 

때문에, $\mathbf{x}=\mathbf{0}$ 이라는 자명해가 아닌 $\mathbf{x}$를 찾아야 하니 고유값 문제는 행렬식으로 처리하게 됩니다. 이 정리의 증명은 굳이 하지 않겠습니다. 가역성에 관한 정리를 그대로 답습한 것이기 뿐이기 때문입니다.

 

정리($L.A$) 5.1

$\lambda\in F$ 가 $A\in M_n(F)$ 의 고유값일 필요충분조건은 $\lambda$가 특성방정식(Characteristic Equation) $\left| t I_n-A \right|=\left| A-t I_n  \right|=\mathbf{0}$ 의 해인 것이다.

증명) 고유값과 정의와 가역성에 대한 정리를 활용하자.

$$\begin{align*}
\lambda\;\;\mathrm{is\;eigenvalue\;of\;matrix}\;A \;\;&\Leftrightarrow \;\;\exists \;\; A\mathbf{x}=\lambda\mathbf{x}\;\;(\mathbf{x}\neq \mathbf{0})
\\\\ &\Leftrightarrow A-\lambda I_n\;\;\mathrm{is\;non-invertible}
\\\\ &\Leftrightarrow \det \left( A-\lambda I_n \right)=0
\\\\ &\Leftrightarrow \lambda\;\mathrm{is\;solution\;of\;equation}\;\;\det \left( tI_n-A \right)=0
\end{align*}$$

 

$\lambda \in F$가 $A\in M_n(F)$ 의 고유값이면 $\lambda$는 $\mathrm{det}\left( t I_n-A \right)$ 의 해가 되는 셈이니, $A$는 최대 $n$개의 고유값을 가질 수 있습니다. 일반적으로 위 특성방정식을 풀면 $n$차 다항식 고유벡터의 개수도 $n$개라 생각할 수 있으나, 이것은 주어진 체 $F$에 따라 달라집니다. 예컨대 실수체에서는 중근이나 허근이 걸리면 고유값을 구하지 못할 수도 있겠죠? 반면 복소수체라면 언제나 정확히 $n$개의 고유값을 구할 수 있습니다. 이 고유값에 개수에 대한 내용은 아래에서 다시 다루겠습니다.

 

반면 고유값과 달리 고유벡터는, 하나의 고유값 $\lambda$ 에 대해 무수히 많이 존재할 수 있습니다. 아래 정리를 봅시다.

 

 

정리($L.A$) 5.2

$\lambda\in F$ 와 $\mathbf{x}\in F^n$ 을 각각 $A\in M_n(F)$의 고유값과 고유벡터라 하자. 그러면 $\forall \alpha \in F^*$ 에 대하여 $\alpha\mathbf{x}$ 또한 $\lambda$의 고유벡터이다.

증명) 가정에 의해 $A\mathbf{x}=\lambda \mathbf{x}$ 이므로

$$A\left( \alpha\mathbf{x} \right)=\alpha A\mathbf{x}=\alpha \lambda \mathbf{x}=\lambda \left( \alpha \mathbf{x} \right)$$
이다. 여기서 $\alpha \neq 0,\mathbf{x}\neq \mathbf{0}$ 이므로 $\alpha \mathbf{x} \neq \mathbf{0}$ 으로부터 $\alpha \mathbf{x}$ 또한 $\lambda$ 의 고유벡터이다.

예제 1) $A=\begin{pmatrix}
7 & -4 \\
5 & 2
\end{pmatrix}$ 의 모든 고유값과 고유벡터를 구하라.

 

sol) 고유방정식을 풀면 됩니다.

 

$$\left| t I_n-A \right|=\begin{vmatrix}
t-7 &4  \\
-5 & t+2
\end{vmatrix}=(t^2-5t-14)+20=(t-2)(t-3)=0\;\; \Rightarrow \;\; \lambda_1=2\;,\;\lambda_2=3$$

 

i) $\lambda_1=2$ 일 때

$\left( 2I_n-A \right)\mathbf{x}=\mathbf{0}=\begin{pmatrix}
-5 &4  \\
-5 &4 
\end{pmatrix}\begin{pmatrix}
x \\y

\end{pmatrix}=\begin{pmatrix}
0\\0

\end{pmatrix}\;\;\rightarrow \;\; 5x=4y$ 이므로 $r\neq 0$ 일 때 $x=4r$ 로 두면, 고유벡터는

 

$$\mathbf{x}=\begin{pmatrix}
x \\y

\end{pmatrix}=\begin{pmatrix}
4r\\5r

\end{pmatrix}=r\begin{pmatrix}
4 \\5
\end{pmatrix}$$

 

ii) $\lambda_2=3$ 일 때

$\left( 3I_n-A \right)\mathbf{x}=\mathbf{0}=\begin{pmatrix}
-4 &4  \\
-5 &5 
\end{pmatrix}\begin{pmatrix}
x \\y

\end{pmatrix}=\begin{pmatrix}
0\\0

\end{pmatrix}\;\;\rightarrow \;\; x=y$ 이므로 $s\neq 0$ 일 때 $x=s$ 로 두면, 고유벡터는


$$\mathbf{x}=\begin{pmatrix}
x \\y

\end{pmatrix}=\begin{pmatrix}
s\\s

\end{pmatrix}=s\begin{pmatrix}
1 \\1
\end{pmatrix}$$

 

고유방정식을 푸는 과정은 2차 정사각행렬에선 이차방정식의 근을 구하는 문제로 귀결됩니다. 그러면 이차방정식은 본질적으로 서로 다른 두 근, 중근, 서로 다른 허근을 가질 수 있습니다. 위의 예제 1)에서는 서로 다른 실근을 가졌지만, 중근이나 허근도 충분히 가질 수 있습니다. 이럴 때는 $n$차 정사각행렬을 복소행렬로 취급하면, 곧 $\mathbb{C}$ 에서는 정확히 중복을 허락하여 $n$개의 고유값이 발생하게 됩니다. (중근은 2개로 셉니다.) 이에 대해서는 추후에 다시 떠들 기회가 있을 겁니다.


2. 고유값에 관한 몇가지 정리들

 

정리($L.A$) 5.3

$A\in M_n(F)$ 의 고유다항식이 다음과 같을 때, 아래의 두 성질이 성립한다.
$$\det \left( tI_n-A \right)=t^n+c_{n-1}t^{n-1}+\cdots c_1t+c_0$$ ① $\det A = (-1)^nc_0$
② $\mathrm{tr}A=-c_{n-1}$

증명) ① $\det \left( tI_n-A \right)=t^n+c_{n-1}t^{n-1}+\cdots c_1t+c_0$ 에서 $t=0$ 을 대입하면, $\det (-A)=c_0$ 이다. 행렬식의 성질 $\det (kA)=k^n\det A$ 를 이용하면 $c_0=\det (-A) = (-1)^n \det A$ 이다.

② $\det \left( tI_n-A \right)=\begin{vmatrix}
t-a_{11} &-a_{12}  & \cdots & -a_{1n} \\
 -a_{21} &t-a_{22}  &\cdots  &-a_{2n}  \\
\vdots &\vdots  &  & \vdots  \\
 -a_{n1}&-a_{n2}  & \cdots  & t-a_{nn}
\end{vmatrix}$ 를 1행에 대해 여인수 전개하자. 그 때 $t^{n-1}$ 항은 오로지 $\left( t-a_{11} \right)\left( t-a_{22} \right)\cdot\; \cdots \;\cdot\left( t-a_{nn} \right)$ 의 전개에서만 얻을 수 있다. 그러면 여기서 $t^{n-1}$ 의 계수는 주대각성분들의 합에 마이너스 기호를 취한 $-\left( a_{11}+a_{22}+\cdots a_{nn} \right)=-\mathrm{tr}A$ 가 된다. 이는 $\det \left( tI_n-A \right)=t^n+c_{n-1}t^{n-1}+\cdots c_1t+c_0$ 에서 $t^{n-1}$ 의 계수 $c_{n-1}$ 과 같다.

 

 

이를 바탕으로 아래의 따름정리를 이끌어 낼 수 있습니다. 행렬식과 주대각합을 고유값과 연결해주는 매우 중요한 정리로, 고유값 문제 방정식 $A\mathbf{x}=\lambda \mathbf{x}$ 에서 등장하는 행렬 $A$의 행렬식은 모든 고유값의 곱과 같고 모든 고유값의 합은 이 행렬 $A$의 주대각합과 같다는 정리입니다.

 

 

따름정리($L.A$) 5.3.1

$A\in M_n(F)$ 가 $\mathbb{C}$ 에서 중복을 허락하여 $n$개의 고유값 $\lambda_1,\cdots ,\lambda_n$ 을 가지면 다음이 성립한다.

① $\det A= \lambda_1\lambda_2\;\cdots\; \lambda_n$
② $\mathrm{tr}A=\lambda_1+\lambda_2+\cdots +\lambda_n$

증명) $n$개의 고유값을 가지면 특성다항식은

$$\det (tI_n-A)=\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot\; \cdots \;\cdot\left( t-\lambda_n \right)$$
여기서 이 식의 전개식과 위의 정리($L.A$) 5.3 을 활용하면 $(-1)^nc_0$ 는 모든 $n$개의 고유값의 곱이며 $t^{n-1}$ 의 계수 $-c_{n-1}$ 은 모든 $n$개의 고유값의 합과 같다. 그러므로 위의 정리가 성립한다.

 

 

정리($L.A$) 5.4

$\lambda \in F$ 가 $A\in M_n(F)$ 의 고유값이면

① $\forall k\in \mathbb{N}$ , $\lambda^k$ 는 $A^k$ 의 고유값이다.
② $A$ 가 가역이면 $\lambda^{-1}=\displaystyle\frac{1}{\lambda}$ 는 $A^{-1}$ 의 고유값이다.

증명) $\lambda \in F$ 가 $A\in M_n(F)$ 의 고유값이면 $A\mathbf{x}=\lambda \mathbf{x}\;\;(\mathbf{x}\neq \mathbf{0}, \mathbf{x}\in F)$ 인 고유벡터 $\mathbf{x}$ 가 존재한다. 편의상 고유벡터를 $x\in V$ 라 하자.

① 수학적 귀납법을 사용한다.

$$A^2x=A(Ax)=A(\lambda x)=\lambda (Ax)=\lambda^2 x$$
그러므로 $\lambda^2$ 는 $A^2$ 의 고유값이다. 반복하면

$$A^kx=A(A^{k-1}x)=A(\lambda^{k-1}x)=\lambda^{k-1}(Ax)=\lambda^{k-1}\lambda x=\lambda^k x$$
고로 $\lambda^k$ 는 $A^k$ 의 고유값이다.
이는 임의의 $n=k\in\mathbb{N}$ 에 대하여 성립한다.

② $A$가 가역이면 $\det A\neq 0$ 에서 $\lambda\neq 0$ 이다. $Ax=\lambda x$ 의 양변에 $A^{-1}$ 를 곱하면 $x=A^{-1}\lambda x=\lambda A^{-1}x$ 이고, 이로부터 $\lambda^{-1}x=\frac{1}{\lambda}x=A^{-1}x$ 가 성립한다. 즉 $\lambda^{-1}=\frac{1}{\lambda}$ 는 $A^{-1}$ 의 고유값이다.

 

 

[참고문헌]

선형대수학, 청문각, 강경태 및 송석준 지음

댓글