본문 바로가기
선형대수학(Linear Algebra)/선형변환

행렬의 선형변환 : 좌측 곱 변환 (Left-hand Multiplication)

by Gosamy 2022. 1. 1.
반응형

<이전 글 : 동형사상의 개념>

 

오늘은 $L_A$라는 친구를 파헤쳐 볼겁니다. 이 개념과 동형사상을 합치면 행렬과 선형변환의 구조적 동일성에 도달할 수 있습니다. 그런데 $L_A$에 대한 이해가 여러 선형대수학 책을 봐도 자세하지 않아 쉽지 않을 것이라 생각했을 뿐만 아니라 딱 요지를 정확하게 추출할 줄 알아야 하는데, 많은 책들이 혼란을 가중시키더군요. 그럴 것 같아서 또 이 글을 쓰게 되었습니다.

 

$L_A$는 이를 좌측 곱 변환(Left-hand Multiplication)이라 적어둔 것도 있는데, 이러한 용어보다는 행렬의 선형변환이라는 표현이 좀 더 적절하다고 생각합니다. 이걸 꼭 기억하면서 시작해 봅시다.


1) 행렬의 선형변환을 찾아라.

 

이 챕터에서 우리는 계속 선형변환(사상)을 공부하고 있습니다. 일종의 함수를 공부하고 있는 것이지, 행렬은 주된 논의의 대상이 아닙니다. 그래서 주로 선형변환을 다루었고, 물론 선형변환을 행렬로 표현할 수 있음을 배우기는 했습니다.

 

$$\left[ T \right]_\beta^\gamma$$
그런데 수학자들이 공부를 해본 결과 선형변환과 행렬이 동형임을 알아냈습니다. [각주:1] 분석은 차후에 하고, 동형이라는 것은 아무튼 동치관계임을 내포하기 때문에 선형변환에 해당하는 행렬표현이 있다면 거꾸로 어떤 행렬에 대응되는 선형변환도 존재해야 한다는 논의에 자연스럽게 도달하게 되었습니다. 이를 다음과 같이 정의합니다.

 

벡터공간 $V,W$의 기저를 각각 $\beta =\left\{ v_1,\,\cdots \,v_n \right\}\;,\;\gamma=\left\{ w_1,\,\cdots \,w_n \right\}$ 라 하고 행렬 $A\in M_{m,n}(F)$가 주어졌다고 하자. 정리 $(L.A)$ 4.7에 의하여 다음을 만족하는 선형사상 $L_A:V\rightarrow W$가 유일하게 존재한다.

$$L_A(v_1)=a_{11}w_1+a_{21}w_2+\cdots +a_{m1}w_m \\\\
L_A(v_2)=a_{12}w_1+a_{22}w_2+\cdots +a_{m2}w_m \\\\
\vdots \\\\
L_A(v_n)=a_{1n}w_1+a_{2n}w_2+\cdots +a_{mn}w_m$$
이 $L_A$를 '기저 $\beta,\,\gamma$ 에 관한 행렬 $A$의 선형변환(Linear transformation of A with respect to the bases $\beta$ and $\gamma$)' 또는 '좌측 곱 변환(Left-hand multiplication)'라 한다.

 

여기까지만 보면 그냥 선형변환의 행렬표현에 반대되는 과정을 이행한 것이 아닌지 하는 생각만 들 수 있습니다. 하지만 $L_A$에서 정말 중요한 것은 따로 있습니다.

 

 

2) 행렬 연산으로 취급할 수 있다.

 

$L_A$를 선형변환 $L_A:F^n\rightarrow F^m$ 이라 하자. 그리고 두 벡터공간의 기저를 표준순서기저로 잡고, $F^n$과 $F^m$의 원소를 열벡터로 취급하면 $L_A$에 대하여 다음 관계식이 성립한다.

$$L_A(\mathbf{x})=A\mathbf{x}$$

 

일반적인 선형변환 $T$는 보통 $T:V\rightarrow W$ 라 씁니다. 그런데 유달리 $L_A$는 분명 선형변환인데도 여러분들이 들고 있는 책들을 보면 $L_A:V\rightarrow W$ 보다는 $L_A : F^n\rightarrow F^m$ 이라 적혀 있을 겁니다. 벡터공간을 $V$로 쓰나 $F^n$로 쓰나 벡터공간의 정의상에 큰 차이가 존재하는 것은 아닙니다. 그럼에도 불구하고 왜 저렇게 표기할까요? 이 둘의 차이가 무엇이라고 생각하시나요?

 

선형변환을 표기할 때, 일반적으로 $F^n\rightarrow F^m$라 쓰면 암묵적으로 표준순서기저를 선택한다는 조건이 내포된 것입니다. 이건 일종의 관례같은 것이기에 전공 책에 자세히 적혀 있진 않은 겁니다. 반면 $V\rightarrow W$라고 쓰는 경우, 기저가 지정된 것이 아니므로 보통 $\beta =\left\{ v_1,\,\cdots \,v_n \right\}\;,\;\gamma=\left\{ w_1,\,\cdots \,w_n \right\}$ 라고 써서 따로 꼭 설명을 해줍니다. 그래서 $F^n\rightarrow F^m$ 이라고 쓰는 $L_A$의 정의에서는 전자와 같이 기저벡터 집합 $\beta, \gamma$를 굳이 쓰지 않고 벡터공간의 기저에 대한 설명을 따로 하지 않습니다. [각주:2]

 

별것도 아닌 것처럼 보이는 이 설명은 $L_A$ 개념의 주축을 이룹니다. 표준순서기저는 매우 매우 특별한 기저이기 때문입니다. 좌표에 대한 설명 다음 정리를 봅시다.

 

정리($L.A$) 4.8

$\beta=\left \{ \mathbf{e}_1,\cdots ,\mathbf{e}_n \right \}$ 을 $F^n$의 표준순서기저라 하자. 그러면 기저 $\beta$에 대한 $\mathbf{v}=(a_1,a_2,\cdots ,a_n)\in F^n$ 의 좌표는
$$\left [ \mathbf{v} \right ]_\beta=\left ( a_1,a_2,\cdots ,a_n \right )=\mathbf{v}$$ 이다. 즉, 벡터 자체가 좌표(벡터)이다.

 

표준순서기저를 선택하는 경우, 우리는 벡터가 아닌 좌표만을 뽑아도 벡터처럼 취급하는 것이 가능합니다. 이 뜻의 중요성은 엄청나게 반복해서 말씀드렸지만 아직도 감이 안오신 분들이 계시죠? 더 쉽게 가겠습니다. 예를 들어서 데카르트 평면에서 $(2,5)$을 표현할 때 표준순서기저를 선택하면

 

$$(2,5)=2(1,0)+5(0,1)=2\mathbf{i}+5\mathbf{j}$$
라 쓸 수 있죠? 그러니 기저는 무시하고 좌표만 뽑아 $(2,5)$ 라고 써도 - 이것은 실제론 벡터에서 뽑아낸 좌표지만 -  벡터'처럼' 쓸 수 있습니다.

 

반면에 엉뚱한 기저 $(1,1),(-1,2)$를 택한다면

$$3(1,1)+1(-1,2)$$

가 되는데, 이 때 좌표는 $(3,1)$입니다. 그러나 실제로 데카르트 좌표계에서 우리는 $(2,5)$를 나타낸건데 기저를 표준순서기저로 잡지 않으면 좌표벡터만 추출했을 때 나온 $(3,1)$은 $(2,5)$와 같지 않습니다. 따라서 이 경우 벡터와 좌표는 같지 않습니다. 곧, 위 정리 ($L.A$) 4.8을 만족하진 않다는 겁니다.

 

그런데 선형대수학에서는 선형변환의 벡터공간을 $F^n\rightarrow F^m$ 라 쓰는 경우 별도 첨언이 없다면 기저를 표준순서기저로 선택한다는 뜻입니다. 따라서 $L_A$를 $L_A : F^n\rightarrow F^m$ 로 적는 순간, 표준순서기저만을 택한다는 뜻이며 어떤 점 $\mathbf{x}$ 을 새로운 변환된 점 $\mathbf{x}'$ 으로 이동시키는 선형변환이란 뜻인데, 공교롭게도 이 때 관여된 행렬 $A$와 $\mathbf{x}$의 곱이 새로운 변환된 점 $\mathbf{x}'$ 의 좌표와 같습니다! 따라서, $L_A(\mathbf{x})=A\mathbf{x}$ 로 '정의'한 것입니다. 왜 $L_A$가 행렬과 열벡터의 곱인가요? 라고 묻는 것은 정의니까 그렇다고 대답할 수는 있지만, 완벽한 대답은 아니며 [각주:3] 파고 들면 위와 같은 관계가 있다는 뜻입니다.

 

$L_A$ 는 2007 교육 과정, 다시 말해 2016학년도 수능까지 응시했던 16학번 학생들은 그 당시 <기하와 벡터> 교과목에서 <일차변환과 행렬>이라는 단원을 통해 학습한 적이 있을 겁니다. 그 때 일차변환이 바로 선형변환이며, 그 선형변환에 대응되었던 행렬이 바로 $L_A$ 입니다. 그러므로 이 행렬은 $\left[ T \right]_\beta^\gamma$ 와 같은 것이 아닙니다!

 

 

3) 선형변환의 행렬표현 : 행렬 곱으로 이동된 점의 좌표를 구할 수 있다.

 

$L_A$는 기하학적 변환을 나타내는데 훌륭하게 쓰입니다. 몇가지 예시들을 보겠습니다.

 

정리($L.A$) 4.21

다음은 $L_A:R^2\rightarrow R^2$ 인 선형변환 $L_A$ , 그리고 그를 나타내는 행렬을 적은 것이다.

① $x$축 대칭을 나타내는 행렬 : $\begin{pmatrix}
1 &0  \\
0 & -1
\end{pmatrix}$

② $y$축 대칭을 나타내는 행렬 : $\begin{pmatrix}
-1 &0  \\
0 & 1
\end{pmatrix}$

③ 원점 대칭을 나타내는 행렬 : $\begin{pmatrix}
-1 &0  \\
0 & -1
\end{pmatrix}$

④ $y=x$ 대칭을 나타내는 행렬 : $\begin{pmatrix}
0 &1  \\
1 & 0
\end{pmatrix}$

 

설명)
① $\begin{pmatrix}
x' \\
y'
\end{pmatrix}=\begin{pmatrix}
1 &0  \\
0 & -1
\end{pmatrix}\begin{pmatrix}
x \\
y
\end{pmatrix}=\begin{pmatrix}
x \\
-y
\end{pmatrix}$

② $\begin{pmatrix}
x' \\
y'
\end{pmatrix}=\begin{pmatrix}
-1 &0  \\
0 & 1
\end{pmatrix}\begin{pmatrix}
x \\
y
\end{pmatrix}=\begin{pmatrix}
-x \\
y
\end{pmatrix}$

③ $\begin{pmatrix}
x' \\
y'
\end{pmatrix}=\begin{pmatrix}
-1 &0  \\
0 & -1
\end{pmatrix}\begin{pmatrix}
x \\
y
\end{pmatrix}=\begin{pmatrix}
-x \\
-y
\end{pmatrix}$

④ $\begin{pmatrix}
x' \\
y'
\end{pmatrix}=\begin{pmatrix}
0 &1  \\
1 &0
\end{pmatrix}\begin{pmatrix}
x \\
y
\end{pmatrix}=\begin{pmatrix}
y \\
x
\end{pmatrix}$

 

 

4) 선형성과 성질

 

정리($L.A$) 4.22

성분이 체 $F$의 원소인 $m\times n$ 두 행렬 $A,B$를 생각하자. 선형변환 $L_A:F^n\rightarrow F^m$ 은 선형이다. 또한 $F^n,\,F^m$ 각각의 표준순서기저를 $\beta,\,\gamma$ 라 하면, 다음의 성질들이 성립한다.

① $\left[ L_A \right]_\beta^\gamma=A$
② $L_A=L_B\;\;\Leftrightarrow \;\;A=B$
③ $L_{A+B}=L_A+L_B$ 이고, 모든 $a\in F$ 에 대하여 $L_{aA}=aL_A$ 이다.
④ $T:F^n\rightarrow F^m$ 이 선형이면, $T=L_C$ 가 되도록 하는 $m\times n$ 행렬 $C$가 유일하게 존재한다. 이 때 $C=\left[ T \right]_\beta^\gamma$ 이다.
⑤ $E$가 $n\times p$ 행렬이면, $L_{AE}=L_AL_E$ 이다.

 

위 정리의 증명은 한 개만 하겠습니다. 하지만 그전에 우선 이 성질들을 확인하려면 $L_A$가 선형인지부터 따져주어야 합니다. 행렬은 선형이기 때문에 이를 보이는 것은 어렵지 않습니다.


$$L_A(ax+y)=A(ax+y)=aAx+Ay=aL_A(x)+L_A(y)$$

 

증명) ① $\left[ L_A \right]_\beta^\gamma$ 의 각 열을 생각하자. 이 행렬의 $j$열은 $L_A(e_j)=Ae_j$ 와 같다. 여기서 $Ae_j$는 곧 $A$의 $j$열과 같다. 즉, $A$와 $\left[ L_A \right]_\beta^\gamma$의 각 열은 모두 같으므로 둘은 같은 행렬이다.

①에 의하면 $\left[ L_A \right]_\beta^\gamma=A$ 이고, 만일 $L_A=L_B$ 이면 $\left[ L_A \right]_\beta^\gamma=\left[ L_B \right]_\beta^\gamma$ 이므로 $A=B$ 이다.
역으로 $A=B$ 이면 유사한 방법으로 $A=\left[ L_A \right]_\beta^\gamma=B$ 이므로 $\left[ L_A \right]_\beta^\gamma=\left[ L_B \right]_\beta^\gamma$ 임을 어렵지 않게 보일 수 있다.

③ $L_A$ 의 선형성(이 박스 바로 위)에서 나온다.

우선 $C=\left[ T \right]_\beta^\gamma$ 라 가정해보자. 정리 ($L.A$) 4.15 에서 $\left [ T(x) \right ]_\gamma=\left | T \right |_\beta^\gamma \left [ x \right ]_\beta$ 을 이용한다.
그러면 모든 $x\in F^n$ 에 대하여 $T(x)=Cx=L_C(x)$ 가 되어, $T=L_C$ 이다. 또한 ②에 의하면 이러한 $C$는 유일하게 존재한다.

 

 

[참고 문헌]

Linear Algebra : S.Friedberg, A.Insel, L.Spence, 5e, PEARSON

 

 

 

  1. 이 두 세계의 구조적 동일성에 관해서는 다음 포스팅에서 설명합니다. [본문으로]
  2. 많은 방문자분들께서 Friedburg 책을 보실 겁니다. 그 책의 $L_A$에 관한 설명은 상당히 불친절합니다. [본문으로]
  3. 정의에도 까닭이 있는 법이니까요. [본문으로]

댓글