특성다항식(Characteristic polynomial)

고유값 문제를 해결하기 위해서는 꼭 특성다항식을 풀 수 있어야 합니다. 그런데 특성다항식이 왜 0이 되어야 하는지, 곧 행렬식이 왜 0이 되어야 하는지를 이해하기 위해서는 행렬의 가역성 또는 선형변환의 영공간에 관한 지식이 반드시 필요합니다. 무작정 외우지 말고 그에 대해서 모두 정리를 해 두었으니 차근차근 이해를 해보시기 바랍니다.

1. 특성다항식

1) 정의와 기본 정리

로 표기하는 $T$ 의 행렬식이란 $T$ 의 순서기저에 대한 행렬표현 $[T]_{\beta}:=A$ 의 행렬식 $\det (A)$ 로 정의한다.

정리( $L.A$ ) 5.12
유한차원 벡터공간 $V$ 위에서 정의된 선형연산자 $T$ 에 대해 $V$ 의 임의의 순서기저 $\beta$ 를 택하자. $A:=[T]_{\beta}\in M_n(F)$ 라 하자. $\lambda\in F$ 가 $A$ 의 고유값이 되기 위한 필요충분조건은
$\det \left( A-\lambda I_n \right)=\det \left( \lambda I_n-A \right)=0$ 인 것이다. 여기서 다항식 $f(t)=\det \left( A-\lambda I_n \right)$ 는 행렬 $A$ 또는 선형연산자 $T$ 의 '특성다항식(Characteristic polynomial)' 이라 부르고, $\mathrm{char}(A)$ 또는 $\mathrm{char}(T)$ 로 쓰기도 한다.

고찰해 봅시다. 고유값과 고유벡터가 존재하기 위해서 왜 행렬식(determinant)이 0이 되어야 할까요? 행렬식이 0이 된다는 말은 주어진 고유값 방정식

$T(v)=\lambda v \;\;\; \mathrm{or}\;\;\; Av=\lambda v$

에 대해 $v\neq 0$ 인 해가 존재해야 한다는 것입니다.^[각주:1] 자명해 이외의 비자명해가 존재해야 한다는 것이죠. 그러니 행렬의 입장에서 역행렬이 존재하지 않아야 한다는 것이고, 선형변환의 입장에서 비가역이어야 한다는 것입니다. 그래서 행렬식은 0이 되어야 한다는 것입니다.

이 논리를 이해하지 않고 무작정 외우는 분들이 많은 것 같은데 그러지 않았으면 합니다.

따름정리( $L.A$ ) 5.12.1
$A\in M_n(F)$ 에 대하여 $v\in F^n$ 이 고유값 $\lambda$ 에 대응하는 고유벡터이기 위한 필요충분조건은 $v\neq 0$ 이고 $(A-\lambda I_n)v=0$ 인 것이다. 즉, 특성다항식 $\det(A-\lambda I_n)=0$ 인 것이다.

위 정리의 행렬 버전입니다.

2) 특성다항식의 성질

정리( $L.A$ ) 5.13
$A\in M_n(F)$ 또는 벡터공간 $V$ 상에서 정의된 선형연산자 $T$ 의 행렬표현 $A:=[T]_{\beta}$ 에 대하여 다음이 성립한다.
① $A$ 의 특성다항식은 최고차항(leading coefficient)이 $(-1)^n$ 인 $n$ 차 다항식이다.
② $A$ 는 최대 $n$ 개의 서로 다른 고유값을 갖는다.

증명) 수학적 귀납법을 사용한다.

i) $n=2\; : \; A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}$

$\left| A-tI_n \right|=\begin{vmatrix} a_{11}-t & a_{12} \\ a_{21} & a_{22}-t \end{vmatrix}=(-1)^2(t-a_{11})(t-a{22})=(t-a_{11})(t-a_{22})$
여기서 $a_{11}\neq a_{22}$ 이라면 최대의 $n=2$ 개의 서로 다른 고유값이 존재한다.

ii) $n=k \; : \; A=\begin{pmatrix} a_{11} & & \\ & \ddots & \\ & & a_{kk} \end{pmatrix}$

$\left| A-tI_n \right|=(-1)^n(t-a_{11})(t-a_{22})\cdot \;\cdots \;\cdot(t-a_{kk})$
여기서 $a_{ii}\;(i=1,2,\cdots , k)$ 끼리 값이 모두 다르다면 최대 $n=k$ 의 서로 다른 고유값들이 존재한다.

정리( $L.A$ ) 5.14
벡터공간 $V$ 위에서 정의된 선형연산자 $T$ , 그리고 $T$ 의 서로 다른 고유값을 $\lambda_1,\cdots ,\lambda_k$ 라고 하자. 각각의 $i=1,\cdots ,k$ 에 대하여 $S_i$ 가 고유값 $\lambda_i$ 에 대응되는 고유벡터들로 이루어진 유한집합이라고 하였을 때, 만약 각각의 $S_i$ 가 일차독립이면 $S_1\cap S_2\cap \cdots \cap S_k$ 또한 일차독립이다.

증명은 생략합니다. 일차독립의 정의와, 고유벡터가 일차독립인 경우가 어떤 효과를 발휘하는지를 떠올리면 직관적으로 납득 가능할 것이고 그래야만 합니다.

따름정리( $L.A$ ) 5.14.1
$T$ 가 $n$ 차원 벡터공간 $V$ 위에서 정의된 선형연산자라고 하자. $T$ 가 서로 다른 $n$ 개의 고유벡터를 가지면, $T$ 는 반드시 대각화가능하다.

증명) $T$ 의 서로 다른 고유값을 $\lambda_1, \cdots ,\lambda_n$ 이라 하자. 각각의 $\lambda_i$ 에 해당하는 고유벡터 $v_i$ 를 고르면 위의 정리( $L.A$ ) 5.14에 의하여 $\left\{ v_1,\cdots ,v_n \right\}$ 는 일차독립이며 $\mathrm{dim}(V)=n$ 이므로 결국 $\left\{ v_1,\cdots ,v_n \right\}$ 는 $V$ 의 기저를 이룬다. 따라서 정리( $L.A$ ) 5.11 에 의하여 $T$ 는 대각화가능하다.

이제 제대로 예제 하나를 통해 대각화 문제를 풀어보도록 하겠습니다.

예제 2) 주어진 행렬 $A=\begin{pmatrix} 1 & 1 \\ 1 & 4 \end{pmatrix}$ 의 고유값은 $\lambda_1=3\;,\;\lambda_2=-1$ 을 예제 1) 에서 다루었다. 이들의 고유벡터를 모두 구해보고 행렬 $A$ 가 대각화가능한지 여부를 밝혀라.

Sol)

i) $\begin{pmatrix} 1 &1 \\ 4 & 1 \end{pmatrix}-\begin{pmatrix} 3 &0 \\ 0 & 3 \end{pmatrix}=\begin{pmatrix} -2 &1 \\ 4 & -2 \end{pmatrix}:=B_1$

라 하자.

$\lambda_1$ 에 대응되는 고유벡터를 $v_1=\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}$ 이라 하면,

$\left( A-\lambda_1I_2 \right)v_1=B_1v_1=0 \;\; \Rightarrow \;\; \begin{pmatrix} -2 &1 \\ 4 & -2 \end{pmatrix}\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}$

이를 풀면 $y_1=2x_1$ 이 되므로 $v_1=\begin{pmatrix} x_1 \\ y_1 \end{pmatrix}=t\begin{pmatrix} 1 \\ 2 \end{pmatrix}\;\;,\;\;(t\in \mathbb{R})$ 이라 쓸 수 있다. 즉 $\lambda_1=3$ 에 대응되는 고유벡터일 필요충분조건은 $v_1=t\begin{pmatrix} 1 \\ 2 \end{pmatrix}\;\;,\;\;(t\in \mathbb{R})$ 인 것이다. 해집합은 $\left\{ t\begin{pmatrix} 1 \\ 2 \end{pmatrix} \mid\in\mathbb{R} \right\}$

ii) $\left( A-\lambda_2I_2 \right)v_2=B_2v_2=0 \;\; \Rightarrow \;\; \begin{pmatrix} 2 &1 \\ 4 & 2 \end{pmatrix}\begin{pmatrix} x_2 \\ y_2 \end{pmatrix}=\begin{pmatrix} 0 \\ 0 \end{pmatrix}$

라 하자. 그러면 $y_2=-2x_2$ 를 얻고 $v_1=\begin{pmatrix} x_2 \\ y_2 \end{pmatrix}=s\begin{pmatrix} 1 \\ -2 \end{pmatrix}\;\;,\;\;(s\in \mathbb{R})$ 가 된다. 해집합은 $\left\{ s\begin{pmatrix} 1 \\ -2 \end{pmatrix} \mid\in\mathbb{R} \right\}$ 이다.

정리하면 집합 $\left\{ \begin{pmatrix} 1 \\ -2 \end{pmatrix},\begin{pmatrix} 1 \\ 2 \end{pmatrix} \right\}$ 는 $A$ 의 고유벡터로 이루어진 $\mathbb{R}^2$ 의 기저이므로 $L_A$ 와 $A$ 는 모두 대각화가능하다.

2. 완전 분해, 완전 인수분해(Split over)

특성다항식은 벡터공간의 차원과 같은 숫자인 $n$ 차 다항식임을 알았습니다. $n$ 개의 다항식 중 공통 고유값이 존재할 수 있습니다. 즉 항들이 모두 1차항들로만 $n$ 개가 구성되면 $n$ 개의 서로 다른 고유값이 존재하는 것이지만 중근, 삼중근, .. 등등이 발생하지 않아야 한다는 법은 없지요. 일단 어떻게든 특성다항식을 만들었을 때, 모든 고유값들(중복이 될 수도 있음)에 해당하는 곱들이 발생하는 경우는 눈여겨 볼 필요가 있습니다. 대각화가능 조건의 최소한의 필요조건이기 때문입니다.

정의( $L.A$ ) 5.4
다항식 $f(t)\in P(F)$ 가 체 $F$ 위에서 '완전 분해(Split-over)' 된다는 것은 체 $F$ 의 원소 $c,a_1,\cdots ,a_n$ (반드시 서로 다를 필요는 없다) 가 존재하여
$f(t)=c(t-a_{1})(t-a_{2})\cdot \cdots \cdot (t-a_n)$ 가 성립하는 것이다.

우선 용어에 대해서, 'Split-over' 에 대응되는 적당한 한국어가 없습니다. 의미상으로는 인수분해(factoring)과 동일합니다. 하지만 굳이 원서에서 인수분해(factoring)라는 용어를 쓰지 않는 것을 보면, $(t-\lambda_i)$ 꼴들만의 곱으로 예쁘게 쪼개진다는 것을 강조한다고 볼 수 있습니다. 왜냐하면 예컨대 항이 $(t^2-at+b)$ 이런 식으로 묶이더라도 인수분해라고 말하기 때문이죠.

주의해야 할 것은 스플릿 오버, 곧 인수분해가 되더라도 항상 대각화가능한 것은 아니라는 점입니다. 역으로 대각화가능하면 스플릿 오버가 된다고 말할 수는 있지요. 이 역은 아래에서 증명합니다. 스플릿 오버의 가능 여부는 '체(field)'가 어느 범위인지에 달려있다고 보시면 됩니다. 예를 들어 특성다항식을 구했을 때 허근이 발생하면, 복소수 체에서는 스플릿 오버되지만 실수 체에서는 스플릿 오버가 되지 않는 것입니다.

스플릿 오버가 되는 한 대각화가능까지를 함의하지는 못하지만 적어도 조르당 표준형(Jordan canonical form)은 구할 수 있습니다. 조르당 표준형은 사실 학부 과정으로 보기에 살짝 애매한 점이 있기는 합니다.^[각주:2] 하지만 조르당 표준형까지 알고 있어야 내적공간에서 쓸모있는 테크닉에 대한 이해가 수월하고, 스플릿 오버와 대각화가능의 차이를 매끄럽게 구분할 수 있는 도구이기는 하지만 개인적으로 굳이 관심이 없다면 학부 선형대수 수준에서 반드시 알 필요는 없다고 봅니다.

정리( $L.A$ ) 5.15
체 $F$ 상에서 정의된 벡터공간 $V$ 의 대각화가능한 선형연산자의 특성다항식은 체 $F$ 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.

증명) $n$ 차원 벡터공간 $V$ 의 대각화가능한 선형연산자를 $T$ 라 하고 $D=[T]_{\beta}$ 가 되도록 하는 $V$ 의 순서기저를 $\beta$ 라 하면,

$D=\begin{pmatrix} \lambda_1 & \cdots & & 0 \\ 0 & \lambda_2 & \cdots & \\ \vdots & & \ddots & 0 \\ 0 & & \cdots & \lambda_n \end{pmatrix}$
가 되며,

$\begin{align*} \mathrm{char}(T):=f(t)&=\det (tI-D) =\begin{pmatrix} t-\lambda_1 & \cdots & & 0 \\ \vdots& \ddots & & \vdots \\ & & & \\ 0 & \cdots & & t-\lambda_n \end{pmatrix} \\\\&=(-1)^n\left( t-\lambda_1 \right)\left( t-\lambda_2 \right)\cdot \cdots \cdot \left( t-\lambda_n \right) \end{align*}$
따라서, $f(t)$ 는 체 $F$ 위에서 완전분해된다.

[참고문헌]

Linear Algebra : S.Friedberg, A.Insel, L.Spence, 5e, PEARSON

고유벡터는 정의상 영벡터가 될 수 없음에 주의. [본문으로]
그래서 임용고시에도 등장하지 않습니다. [본문으로]

저작자표시 비영리 변경금지

'선형대수학(Linear Algebra) > 고유치 문제' 카테고리의 다른 글

선형연산자로 고유값 문제를 해결하기(Eigenvalue problem with linear operator) (1)	2023.02.03
행렬의 대각화와 고유값 문제(Diagonalization of matrix with Eigenvalue problem) (0)	2022.03.14
고유공간(Eigenspace) (0)	2022.03.08
대각행렬과 행렬의 닮음 (Diagonal matrix and Similar of matrix) (0)	2022.03.08
고유값과 고유벡터 (Eigenvalue and Eigenvector) (0)	2022.01.05

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

단아한섭동

특성다항식(Characteristic polynomial)

1. 특성다항식

로 표기하는 $T$ 의 행렬식이란 $T$ 의 순서기저에 대한 행렬표현 $[T]_{\beta}:=A$ 의 행렬식 $\det (A)$ 로 정의한다.

따름정리( $L.A$ ) 5.12.1
$A\in M_n(F)$ 에 대하여 $v\in F^n$ 이 고유값 $\lambda$ 에 대응하는 고유벡터이기 위한 필요충분조건은 $v\neq 0$ 이고 $(A-\lambda I_n)v=0$ 인 것이다. 즉, 특성다항식 $\det(A-\lambda I_n)=0$ 인 것이다.

따름정리( $L.A$ ) 5.14.1
$T$ 가 $n$ 차원 벡터공간 $V$ 위에서 정의된 선형연산자라고 하자. $T$ 가 서로 다른 $n$ 개의 고유벡터를 가지면, $T$ 는 반드시 대각화가능하다.

2. 완전 분해, 완전 인수분해(Split over)

정의( $L.A$ ) 5.4
다항식 $f(t)\in P(F)$ 가 체 $F$ 위에서 '완전 분해(Split-over)' 된다는 것은 체 $F$ 의 원소 $c,a_1,\cdots ,a_n$ (반드시 서로 다를 필요는 없다) 가 존재하여
$f(t)=c(t-a_{1})(t-a_{2})\cdot \cdots \cdot (t-a_n)$ 가 성립하는 것이다.

정리( $L.A$ ) 5.15
체 $F$ 상에서 정의된 벡터공간 $V$ 의 대각화가능한 선형연산자의 특성다항식은 체 $F$ 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.

'선형대수학(Linear Algebra) > 고유치 문제' 카테고리의 다른 글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

특성다항식(Characteristic polynomial)

1. 특성다항식

따름정리(L.AL.A) 5.14.1TT가 nn차원 벡터공간 VV 위에서 정의된 선형연산자라고 하자. TT 가 서로 다른 nn개의 고유벡터를 가지면, TT는 반드시 대각화가능하다.

2. 완전 분해, 완전 인수분해(Split over)

정리(L.AL.A) 5.15체 FF 상에서 정의된 벡터공간 VV의 대각화가능한 선형연산자의 특성다항식은 체 FF 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.

'선형대수학(Linear Algebra) > 고유치 문제' 카테고리의 다른 글

관련글

댓글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

따름정리( $L.A$ ) 5.14.1
$T$ 가 $n$ 차원 벡터공간 $V$ 위에서 정의된 선형연산자라고 하자. $T$ 가 서로 다른 $n$ 개의 고유벡터를 가지면, $T$ 는 반드시 대각화가능하다.

정리( $L.A$ ) 5.15
체 $F$ 상에서 정의된 벡터공간 $V$ 의 대각화가능한 선형연산자의 특성다항식은 체 $F$ 위에서 완전분해(Split-over)된다. 즉 결과는 체(field)가 무엇인지에 따라 달라질 수 있다. 또한 역은 성립하지 않는다.