본문 바로가기
선형대수학(Linear Algebra)/행렬과 행렬식

행렬의 곱셈(Multiplication of matrices)

by Gosamy 2020. 11. 28.
반응형

행렬의 곱셈은 행렬의 덧셈이나 스칼라 배와는 다르게 각각의 동일한 위치의 성분끼리 숫자를 단순히 더하는 행위로 정의되지 않고, 처음 봤을 때는 당황할 수 있을 정도로 특이하게 정의합니다. 오늘은 그 정의와 그렇게 정의를 하는 이유에 대해 분석해 보려고 합니다.


1. 행렬 곱셈의 정의

행렬은 행렬식과 더불어 연립일차방정식의 해를 구하기 위한 부단한 노력에서 탄생한 녀석입니다. 연립일차방정식의 좌변에는 상수 계수들이 곱해진 미지수들이 존재하고, 우변에는 단순 상수가 존재합니다. 이 연립일차방정식의 숫자와 미지수들을 간단히 표현하기 위해 행렬을 도입해 사용했는데, 그 방법은 미지수와 상수가 곱해져 있는 연립일차방정식의 좌변을 미지수와 상수 각각 따로 분리해 쓰는 것입니다.

 

$$ \left\{\begin{matrix}
ax+by+cz=p\\ \\
dx+ey+fz=q\\ \\
gx+hy+iz=r
\end{matrix}\right. \;\;\Leftrightarrow \;\;
\begin{pmatrix}
a & b &c \\ 
d & e & f\\ 
g & h &i 
\end{pmatrix}\begin{pmatrix}
x\\ 
y\\ 
z
\end{pmatrix}=\begin{pmatrix}
p\\ 
q\\ 
r
\end{pmatrix}\;\;\Leftrightarrow \;\;A\mathbf{x}=\mathbf{b}$$

 

행렬 $A$는 미지수의 계수들로 구성된 $3\times 3$ 행렬이고, 그 특징답게 '계수행렬(coefficient matirx)'라 부릅니다. 미지수 $3$개는 $x,y,z$ 는 열벡터로, 우변의 숫자 $p,q,r$ 도 열벡터로 쓰면 됩니다. 미지수 열벡터를 행렬에서는 $\mathbf{x}$로 쓰고 우변의 $p,q,r$ 열벡터를 $\mathbf{b}$라고 씁니다.

방정식에서 만일 미지수의 개수 n보다 방정식의 개수가 많으면 쓸모없는 식이 더 존재하는 것이고, 이 때 방정식이 유일해를 가진다면 주어진 방정식의 개수를 $n+a$ 라 했을 때 $a$개는 $n$개의 방정식과 종속(dependent) 관계를 가집니다. 반면에 미지수의 개수 > 식의 개수라면 그것은 '부정방정식(indeterminate equation)'으로 무수히 많은 해를 가질 것입니다. 이것으로 알 수 있는 사실은 연립일차방정식은 정확히 방정식 $n$개와 미지수 $n$개로 구성되어 있을 때, 곧 방정식의 개수와 미지수의 개수가 동일해야 해를 하나로 규정할 수 있다는 사실입니다. 그리하여 행렬표현으로 바꾼다고 했을 때 반드시 계수행렬의 열의 개수가 미지수 행벡터의 행 개수와 동일해야만 합니다.

이러한 특징을 염두에 보고 다음 행렬 곱의 정의를 들여다 봅시다.

 

두 행렬 $A$, $B$의 곱셈은 다음과 같이 정의된다. 
$$ C_{ij}=\left ( AB \right )_{ij}=\sum_{k=1}^{n}\,a_{ik}b_{kj}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots +a_{in}b_{nj} $$

 

두 행렬 $A,B$의 곱행렬을 $C$라고 하자면, $C$의 $(i,j)$성분은 앞행렬 $A$의 $i$행과 뒷행렬 $B$의 $j$열의 성분들의 선형결합입니다. $A$의 $i$행은 $k$개의 열로 구성되어 있고 $B$의 $j$열은 $k$개의 행으로 이루어져 있습니다. 따라서 이 $k$라는 숫자가 동일해야 행렬 곱을 정의할 수 있으므로 행렬의 곱셈은 곱의 앞행렬의 열의 개수와 곱의 뒷행렬의 행의 개수가 같아야만 정의됩니다. 다음의 예시에 주목해봅시다.

 

$$ \begin{pmatrix}
2 &1 \\ 
4 & 0
\end{pmatrix}\begin{pmatrix}
-3 &5 \\ 
1 &6 
\end{pmatrix}=\begin{pmatrix}
2(-3)+1(-1) & 2\times 5+1\times 6 \\ 
4(-3)+0(-1) & 4\times 5+0\times 6
\end{pmatrix}=\begin{pmatrix}
-7 &16 \\ 
-12 & 20
\end{pmatrix}$$

 

두 행렬은 각각 $2\times 2$ 행렬이므로 앞행렬의 열의 개수와 뒤행렬의 행의 개수가 동일합니다. 따라서 행렬의 곱셈을 수행할 수 있습니다.

 

$$ \begin{pmatrix}
2 & 1\\ 
4 & 0
\end{pmatrix} \begin{pmatrix}
3\\ 
5
\end{pmatrix}=\begin{pmatrix}
2\times 3+1\times 5\\ 
4\times 3+0\times 5
\end{pmatrix}=\begin{pmatrix}
11\\ 
12
\end{pmatrix}$$

 

위 예시 역시 $2\times 2$ 행렬과 $2\times 1$ 행렬이므로 행렬 곱셈을 할 수 있습니다. 그러나 순서를 뒤집으면 $2\times 1$ 행렬과 $2\times 2$ 행렬이 되고 앞행렬의 열의 개수는 1인 반면 뒤행렬의 행의 개수는 2이므로 행렬 곱을 정의할 수 없습니다.


2. 연립방정식에서 행렬 곱셈을 바라보는 두가지 관점

행렬의 곱셈은 나름대로 연립방정식을 효율적으로 표현하자는 의도에서 탄생한 것으로 받아들이면 그럭저럭 그 의도를 이해할 수는 있을 것입니다. 그런데 이렇게 정의했을 때, 연립방정식은 계수행렬과 미지수 벡터의 곱의 꼴로 이루어져 있어서 행렬 곱셈을 바라보는 2가지 관점을 제시할 수 있습니다.

먼저 다음과 같은 연립방정식을 푸는 상황을 예시로 들어봅시다.

 

$$ \left\{\begin{matrix}
x-2y=1\\
3x+2y=11
\end{matrix}\right.$$

 

 

1) 행곱셈 : 행렬의 곱셈은 앞행렬의 행들과 뒷행렬(=열벡터 $\mathbf{x}$ ) 열의 내적(inner product)이다.

 

$$A\mathbf{x}=\begin{pmatrix}
\left ( \mathrm{row\;1\;of}A \right )\cdot \mathbf{x}\\ 
\left ( \mathrm{row\;2\;of}A \right )\cdot \mathbf{x}\\ 
\left ( \mathrm{row\;3\;of}A \right )\cdot \mathbf{x}\\ \vdots
\end{pmatrix}$$

 

이것은 전통적으로 행렬의 곱셈을 계산하는 방법과 일맥상통하는 것으로 위에서 배웠던 행렬의 정의를 벡터 관점에서 풀이한 것입니다. 앞행렬의 행과 뒷행렬의 열을 각각 행벡터, 열벡터로 본 다음 그 둘을 내적시킨다고 생각하면 됩니다. 물론, 일반적으로 벡터들을 내적시킬 때는 모두 행벡터로 적어서 계산하기는 합니다. 위의 연립방정식에 적용하면,

 

$$\left\{\begin{matrix}
x-2y=1\\\\ 
3x+2y=11
\end{matrix}\right.\;\;\Leftrightarrow \;\; A\mathbf{x}=\begin{pmatrix}
(1,-2)\cdot (x,y)\\ 
(3,2)\cdot (x,y)
\end{pmatrix}=
\begin{pmatrix}
1\\ 
11
\end{pmatrix}$$

 

이 방법은 계수행렬의 각 가로줄을 따로 생각한다는 차원에서 공식적으로 사용되는 용어까진 아니지만 '행곱셈'이라 불리기도 합니다. 행별로 초점을 두고 생각하겠다는 겁니다. 이를 좌표평면에서 그래프의 기하적 의미로 해석하게 되면, 우리가 중학생 때 연립방정식을 풀고 일차함수와의 연관성을 떠올렸던 것처럼 두 직선의 교점이 연립방정식의 해에 해당하는 그림이 탄생합니다.

 

 

2) 열곱셈 : 행렬의 곱셈은 계수행렬(=앞행렬 $A$ )의 열벡터를 뒤행렬(=열벡터 $\mathbf{x}$ )의 성분들과 선형결합한 것이다.

 

$$ A\mathbf{x}=x\left ( \mathrm{column\;1\;of}\;A \right )+y\left ( \mathrm{column\;2\;of}\;A \right )
+z\left ( \mathrm{column\;3\;of}\;A \right )=\mathbf{b} $$

 

이 관점은 계수행렬의 열들을 어떤 (열)벡터들로 보고, 뒤행렬의 각 성분들과 선형결합 시킨 것입니다. 본디 선형결합은 벡터에 특정 상수를 곱해 더한 것이죠? 여기서 상수는 뒤행렬의 각 성분이며 벡터가 계수행렬의 열벡터입니다. 이 때 주어진 우변의 벡터 $\mathbf{b}$ 는 적절한 선형결합을 통해 만들어야 하겠죠? 그것은 바로 $A$ 의 열벡터 앞에 붙은 $x,y,z$ 계수들이며 이것들이 이 연립방정식의 해에 해당하는 값을 만들때 정확히 우변의 벡터$\mathbf{b}$ 를 가리키게 됩니다! 위의 예시에 적용하면, 연립방정식의 해가 $(3,1)$인데 이것은 $(x,y)=(3,1)$일때 선형결합이 $\mathbf{b}$ 를 만든다는 말입니다.

 


3. 행렬의 곱셈에 관한 특징

행렬 곱은 처음 배울 땐 익숙하지 않기 때문에 위와 같은 예시를 많이 풀어봐야 합니다. 행렬 곱셈의 특징을 총정리 해보면 다음과 같습니다.

① $m \times n $ 행렬과 $n \times p $ 행렬의 곱셈은 $m \times p $ 행렬이 된다.

 

② 체($F$)상에서 합과 곱이 가능한 행렬 $A,B,C$ 와 스칼라 $c$ 에 대하여 다음이 성립한다.

 

$$   1)\;\;\left ( AB \right )C=A\left ( BC \right )\;\;\;\;\; 2)\;\;A\left ( B+C \right )=AB+AC 
\\\\ 3)\;\;\left ( A+B \right )C=AC+BC\;\;\;\;\;4) \;\; c\left ( AB \right )=\left ( cA \right )B+A\left ( cB \right ) $$

 

③ 행렬 곱의 거듭제곱에 관한 다음 법칙이 성립한다.

 

$$ \left ( A^p \right )^q=A^{pq}$$

 

일반적으로 행렬의 곱셈은 교환법칙이 성립하지 않는다. 만약 곱셈에 대한 교환법칙이 성립한다면 그 둘은 '가환(commutative)'이라 한다.

어떤 행렬이 영행렬을 곱하면 반드시 영행렬이지만, 영행렬이 아닌 행렬들의 곱으로도 영행렬을 만들 수 있다. 이러한 관계(서로 곱해서 영행렬이 되는 관계)에 있을 때, 그 행렬들은 '영인자(Zero divisor)'라고 한다.

영인자의 예시는 다음과 같은 경우가 있습니다.

 

$$ \begin{pmatrix}
 1&0 \\ 
 3&0 
\end{pmatrix}\begin{pmatrix}
 0&0 \\ 
0 &-1 
\end{pmatrix}=\begin{pmatrix}
0 &0 \\ 
0 & 0
\end{pmatrix} $$

 

 

[참고서적]

Introduction to Linear Algebra, Gilbert Strang, 5e

댓글