본문 바로가기
선형대수학(Linear Algebra)/고유치 문제

대각행렬과 행렬의 닮음 (Diagonal matrix and Similar of matrix)

by Gosamy 2022. 3. 8.
반응형

고유값 문제는 행렬의 대각화(Diagonalization)과 아주 밀접한 연관성을 갖습니다. 대각화를 하려면 고유값 문제를 풀어야 하고, 그 때 발생하는 고유값과 고유벡터가 특별한 성질을 만족해야 합니다. 그리고 여기서 행렬 사이의 닮음 관계도 등장합니다. 대각화란 행렬을 대각행렬로 만든다는 것인데, 이에 대해 간단히 짚어보고 가겠습니다.


1. 대각행렬(Diagonal matrix)

 

1) 정의

 

정의($L.A$) 5-2) 대각행렬
$M_n(F)$ 에서 주대각성분은 $\lambda_1, \cdots \lambda_n$ 이고 나머지 모든 성분들은 0인 행렬을 '대각행렬(Diagonal matrix)' 이라 하고 $D=\mathrm{diag}(\lambda_1,\cdots ,\lambda_n)$ 으로 나타낸다.

$$D=\begin{pmatrix}
\lambda_1 & 0 & \cdots & 0 \\
0 & \lambda_2 &\cdots  &0  \\
 \vdots&\vdots  &  & \vdots \\
 0& 0 & \cdots & \lambda_n
\end{pmatrix}$$

 

주대각성분은 행번호와 열번호가 같은 위치에 있는 성분입니다. 이 값들이 모두 1이면 항등행렬이 되겠지요? 그러니 항등행렬은 대각행렬의 특수한 예라고 볼 수 있습니다.

 

정의($L.A$) 5-3) 대각화가능
$A\in M_n(F)$ 일 때 행렬 $P^{-1}AP$ 가 대각행렬이 되게 하는 가역행렬 $P\in M_n(F)$ 가 존재하면 $A$는 '대각화가능(diagonalizable)' 이라 하고, 그렇지 않으면 $A$는 '대각화불가능(non-diagonalizable)' 이라 한다.

 

어떤 행렬 $A$를 대각화한다는 것은 양쪽에 $P$의 역행렬과 $P$를 곱했을 때 대각행렬이 되도록 만든다는 것입니다. 이런 $P$가 존재할 수도 있고, 존재하지 않을 수도 있겠죠. $P$의 존재성을 찾는 방법이 고유값 문제이고 차후에 천천히 소개될 것이니 조금 미뤄두고, 대각화는 어떤 장점이 있길래 시행하는 것일까요?

 

순수 행렬 관점에서 행렬을 대각화하는 것의 장점은, 행렬의 거듭제곱 $A^k\;\;(k\geq 1)$ 의 값을 쉽게 구할 수 있기 때문입니다. 만일 가역행렬 $P$에 대하여

 

$$A=PDP^{-1}\;,\; D=P^{-1}AP$$
가 성립하는 경우, 


$$A=PDP^{-1}\;,\; D=P^{-1}AP \\\\ A^2=\left( PDP^{-1} \right)\left( PDP^{-1} \right)=PD^2P^{-1}$$
으로 $A^2$ 을 손쉽게 계산할 수 있습니다. 이는 $k$의 값이 아무리 커지더라도 $A^k$ 을 계산할 때 가운데 낀 $D^k$ 만 처리하면 됩니다. 그리고 이 $D^k$ 대각행렬의 거듭제곱 행렬은 주대각성분만 거듭제곱을 하기 때문에 산수가 그리 복잡하지 않게 됩니다. 따라서

 

$$A^k=PD^kP^{-1}$$
으로 행렬의 거듭제곱 계산이 수월해집니다.

 


예제 1) 행렬 $P=\begin{pmatrix}
1 &1  \\
1 & 2
\end{pmatrix}$에 대하여 $A=\begin{pmatrix}
1 & 1 \\
 -2& 4
\end{pmatrix}$ 일 때, $A^{100}$ 을 계산하여라.

 

 

$P$ 의 역행렬을 구하면 $P^{-1}=\begin{pmatrix}
2 &-1  \\
-1 & 1
\end{pmatrix}$ 임을 쉽게 얻습니다. 대각행렬 $D$를 먼저 계산하면

 

$$D=P^{-1}AP=\begin{pmatrix}
2 & -1 \\
-1 & 1
\end{pmatrix}\begin{pmatrix}
1 & 1 \\
 -2& 4
\end{pmatrix}\begin{pmatrix}
1 & 1 \\
1 & 2
\end{pmatrix}=\begin{pmatrix}
2 & 0 \\
0 &3 
\end{pmatrix}$$
그러므로

$$A^{100}=PD^{100}P^{-1}=\begin{pmatrix}
2 & -1 \\
-1 & 1
\end{pmatrix}\begin{pmatrix}
2^{100} & 0 \\
0 & 3^{100}
\end{pmatrix}\begin{pmatrix}
1 & 1 \\
1 & 2
\end{pmatrix}=\begin{pmatrix}
2^{101}-3^{100} & -2^{100}+3^{100} \\
2^{101}-2\cdot 3^{100} &-2^{100}+2\cdot 3^{100} 
\end{pmatrix}$$


2. 행렬의 닮음(Similar)

 

1) 정의

 

닮음은 다음과 같이 정의하고, 대각행렬의 꼴과 유사하긴 하지만 닮음에서 사이에 낀 행렬이 대각행렬이어야 하는 것은 아닙니다.

 

정의($L.A$) 5-4) 행렬의 닮음
$A,B\in M_(F)$ 에 대해, 가역행렬 $P\in M_n(F)$ 가 존재하여
$$B=P^{-1}AP$$ 를 만족하면 $A$와 $B$는 서로 '닮음(similar)' 이라 하고 $A\sim B$ 로 나타낸다.

 

수학에서 닮음은 여러 분야에 존재하지만 행렬 사이에서도 닮음 관계가 존재합니다.

 

그리고 행렬의 닮음 관계를 나타낼 때, 여기서 쓰는 기호 '~'는 수학에서 자주 등장하는데 명제나 조건에서는 'not'의 의미를 갖습니다. 그 까닭은 'N'자를 길게 늘여 쓴 모양이랑 비슷하기 때문입니다..

 

또 하나는 집합론에서 처음 배우는 편인데, 집합론에서 '~' 기호는 관계(Relation)을 뜻합니다. 즉 어떤 함수나 집합 사이에서 A~B 라고 하면 A,B 사이에 정해진 관계를 가리키는 것입니다. 관계는 그냥 'R'로 써서 ARB 등으로 나타내기도 하지만 여전히 '~' 기호를 많이 씁니다.

 

위와 같이 정의한 행렬의 닮음관계는, 놀랍게도 동치관계입니다.

 

정리($L.A$) 5.5

$M_n(F)$ 에서 닮음은 동치관계(equivalent realtion)이다. 즉 임의의 $A,B,C\in M_n(F)$ 에 대해 다음이 성립한다.
① 반사율(reflexive) : $A\sim A$
② 대칭성(symmetric) : $A\sim B$ 이면 $B\sim A$ 이다. 
③ 추이성(transitive) : $A\sim B$ 이고 $B\sim C$ 이면 $A\sim C$ 이다.

 

증명) ① $A=P^{-1}AP$ 이면 $PAP^{-1}=A=(P^{-1})^{-1}A(P^{-1})=RAR^{-1}$ 으로 가역행렬 $R$이 존재한다. 따라서 $A\sim A$ 이다.

② $A\sim B$ 이면 $B=P^{-1}AP$ 이고 $A=PBP^{-1} = (P^{-1})^{-1}B(P^{-1})$ 이다. $P$가 가역이므로 $P^{-1}$ 도 가역에서 $A=R^{-1}BR$ 을 만족하는 가역행렬 $R$이 존재한다. 따라서 $B\sim A$ 이다.

③ $A\sim B$ 이고 $B\sim C$ 이면 $B=P^{-1}AP,\;C=Q^{-1}BQ$ 인 가역행렬 $P,Q$ 가 존재한다. $C=Q^{-1}P^{-1}APQ$ 가 성립하는데 $PQ$ 및 $Q^{-1}P^{-1}$  은 가역행렬끼리의 곱이고 이는 결국 기본행렬끼리의 곱이니 가역이다. 따라서 $C=R^{-1}AR\;\;(R=PQ)$ 인 가역행렬 $R$이 존재하므로 $A\sim C$ 이다.
이상에서 $\sim$ 은 동치관계(equivalent realtion)이다.

 

 

2) 닮음행렬끼리의 고유다항식과 고유값

 

닮음 관계에서는 많은 닮은 특징들을 갖습니다. 아래 정리는 닮음 행렬끼리 고유다항식이 같고, 동일한 고유값을 가짐을 뜻합니다.

 

정리($L.A$) 5.6

$A,B\in M_n(F)$ 가 닮음 행렬이면 이들의 고유다항식 $\left| tI_n-A \right|$ 는 같다. 따라서 $A,B$는 중복을 허락하여 동일한 고유값을 갖는다.

 

증명) 어떤 행렬 $D$가 대각행렬이면 $D=P^{-1}DP$ 가 성립함을 활용하자.

$$\begin{align*}

\det\left( tI_n-B \right)&=\left| tI_n-P^{-1}AP \right|=\left| P^{-1}\left( tI_n \right)P-P^{-1}AP \right|
\\\\& =\left| P^{-1}\left( tI_n-A \right)P \right| = \left| P^{-1} \right|\left| tI_n-A \right|\left| P \right|
\\\\&=\left| P \right|^{-1}\left| P \right|\left| tI_n-A \right|=\left| tI_n-A \right|
\end{align*}$$

 

 

[참고 문헌]

선형대수학, 청문각, 강경태 및 송석준 지음

댓글