스투름-리우빌 이론은 미분방정식을 아름답게 조작하고 해를 특별한 성질을 갖는 함수로 취급할 수 있게 미분방정식을 조작하는 기술을 다루고 있는 이론입니다. 이 탁월한 이론은 보통 공대생이나 수학과 학생보다 물리학과 학생이 먼저 마주할 가능성이 높습니다. 그 까닭은 스투름-리우빌 이론이 선형대수학에서 에르미트, 또는 허미션 연산자(Hermitian operator)에 대한 개념이 필요하고 그 개념은 수학과와 물리학과에서만 제대로 파내 활용하기 때문입니다. 에르미트 연산자만 놓고 보면 수학보다도 물리에서 무궁무진하게 쓰입니다.
따라서 스투름-리우빌 이론은 상미분방정식과 선형대수학을 공부하고나서 그 진가를 이해할 수 있는 마지막 보스급 문제입니다. 이는 내용이 무진장 어렵다는 뜻이 아니라 선수 요구 지식이 많다는 뜻입니다. 이렇게 말해두어도 혹시 '굳이 이걸 알아야할까?' 라고 생각하시면 스투름-리우빌 이론은 그냥 포기하시는 것이 낫습니다. 어차피 이 이론이 미분방정식을 푸는데 필수적인 도구는 아니기 때문입니다. 물론 이에 필요한 지식은 대부분 블로그에 올려두었는데, 몇가지 내용을 복기와 검토한 뒤 시작해보도록 하겠습니다.
구글링을 또 해본 결과 스투름-리우빌 이론에 대해 쉽게 설명하는 글이 많지 않은 것 같습니다. 여러분이 의지만 있다면 반드시 이 이론에 대한 기반을 닦는데 이 글이 꼭 도움이 될 것입니다.
1. 에르미트(허미션) 연산자
시작하기에 앞서 선형대수학에서의 에르미트 연산자가 무엇인지 반드시, 무조건 알고 가야 합니다. 에르미트 연산자를 모르고 스투름-리우빌 이론을 학습하겠다는 것은 미분을 모른채 적분을 하는 것과 동일한 수준입니다. 에르미트와 허미션은 모두 알파벳으로 'Hermitian'이라고 적으며 물리학에선 주로 '허미션'이라고 읽습니다. 반면 수학에서는 이 용어도 사용하지만 '자기수반(Self-adjoint)'라는 용어를 좀 더 많이 씁니다. 어차피 같은 뜻이고, 정리를 한 번 하고 가겠습니다.
참고로 내적공간이 뭔지는 굳이 몰라도 됩니다. 선형변환은 알아야 하지만, 그조차 모르시면 일반적인 함수를 떠올리면 됩니다.
1) 정의
$T$ 가 내적공간 $V$에서 정의된 선형연산자(선형변환)이라 하자. 만일 $T$가
$$T=T^{\dagger}$$ 를 만족하면, $T$ 는 '허미션 연산자(Hermitian operator)' 또는 '자기수반 연산자(Self-adjoint operator)' 이라 부른다. 고로 내적의 관점에서 이해하면
$$\left\langle v\mid T(u) \right\rangle=\left\langle T(v)\mid u \right\rangle$$ 인 연산자 $T$를 뜻한다.
또한 $n\times n$ 정사각행렬 $H\in M_n(F)$ 가
$$H=H^{\dagger}$$ 를 만족하는 경우에도 $H$를 '허미션 행렬(Hermitian matrix)' 또는 '자기수반 행렬(Self-adjoint matrix)' 라 부른다.
설명할 것이 있습니다. 먼저 선형변환과 행렬은 동형(isomorphism)이므로 선형변환에 대한 것이나 행렬에 대한 것이나 유사한 정의를 내릴 수 있는 것이고 그렇게 정의를 내려도 개념들이 연결된다는 뜻입니다.
두번째로, 연산자는 선형변환에 해당합니다. 정확히 말하면 $T$가 $V\rightarrow V$ 와 같이 동일한 벡터공간으로 변환되는 경우를 연산자라고 부릅니다. 그러니 내적공간은 연산자입니다. 또한 연산자는 무언가에 '작용'하여 상태를 바꾼다는 의미를 갖는 쪽에 가깝고, 선형변환은 단순히 수학에서 선형성을 갖는 사상(mapping) 을 뜻합니다.
2) 수반연산자란? (자기수반=Hermitian $\neq$ 수반)
위의 정의에서 연산자와 행렬 우측에 표시된 '$\dagger$' 는 '대거(dagger)'라 읽으며 행렬로 설명하자면 전치를 취하고 켤레처리를 한 것을 말합니다. 수학에서는 이 켤레전치 기호로 '*'을 쓰지만, 물리에서는 대거를 씁니다. 수학에서는 켤레복소수 기호로 '$\overline{z}$' 를 쓰지만, 물리에서는 $z^*$ 로 씁니다. 즉 주의할 것이 수학과에선 별 기호가 켤레전치지만 물리학과에선 별 기호가 켤레만을 뜻합니다. 저는 물리에서의 표기법을 쓸 것입니다. 이러한 차이는 이곳을 참고하시기 바랍니다.
그런데 연산자에서는 이 켤레전치행렬에 대응되는 개념이 무엇일까요? 이는 다음과 같이 정의할 수 있습니다.
$T$ 가 내적공간 $V$에서 정의된 선형연산자(선형변환)이라 하자. $u,v\in V$ 에 대하여, 만일 $T$가
$$\displaystyle\left\langle T(u)\mid v \right\rangle=\left\langle u\mid T^{\dagger}(v) \right\rangle$$ 를 만족하면, $T$는 '수반연산자(adjoint operator)'이라 부른다.
반면, 행렬 $A$에 대하여 $A^{\dagger}$는 '수반행렬(adjoint matrix)'이라고 부르고 다음과 같이 정의한다.
$$A^{\dagger}=\left( A^T \right)^*=\left( A^* \right)^T$$ 즉 수반행렬은 원래 행렬 $A$에 켤레 전치 또는 전치 켤레를 취한 행렬에 해당한다. 순서는 무관하다.
저 브라켓(bracket)은 내적을 의미합니다. 또다시, 수학과에서는 내적기호를 쓸 때 중앙에 쉼표를 박지만, 물리에서는 디랙 표기법(Dirac notation)에 따라 브라켓을 사용하고, 내적의 중앙에 쉼표 대신 짝대기(bar)를 넣습니다. 저는 물리에서의 표기법을 따를 것입니다. 정확히 브라켓 표기법을 마구잡이로 쓰진 않을 것이지만, 적어도 내적기호를 나타낼 땐 쉼표 대신 짝대기를 사용하겠습니다.
2. 미분방정식을 고유값 문제로 해결하자.
갑자기 왜 저런 선형대수학의 개념을 박아놨는지 어리둥절할 수 있지만, 이를 이해하지 못하면 스투름-리우빌 이론을 정확히 바라볼 수가 없습니다. Hermitian의 뜻을 반드시 알아야만 이 이론을 이해할 수 있습니다. 게다가, 고유값 문제에 대한 지식도 필요합니다. 간단한 개념은 밑에 적습니다만 자세한 것을 알고 싶으면 위 링크를 클릭해보시면 됩니다.
$A\in M_n(F)$, $\lambda\in F$ 그리고 $\mathbf{x}\in F^n$ 에 대하여 다음을 고려하자.
$$A\mathbf{x}=\lambda\mathbf{x}\;\;\;\;\;(\mathbf{x}\neq \mathbf{0})$$
만일 $\lambda$, $\mathbf{x}$ 가 위 방정식을 만족하면 $\lambda$ 는 $A$의 '고유값(Eigenvalue)'이라고 한다. 또 $\mathbf{x}$ 는 $\lambda$ 에 대응되는 '고유벡터(Eigenvector)'라 한다. 이 방정식은 이항하면 다음과 같이 나타낼 수도 있다.
$$\left( \lambda I_n-A \right)\mathbf{x}=\left( A-\lambda I_n \right)\mathbf{x}=\mathbf{0}$$
스투름-리우빌 이론은 미분방정식을 연산자가 고유벡터(함수)에 곱해져 있는 꼴로 만들고 그것이 고유값과 고유벡터의 곱으로 나타낼 수 있는 형태로 변형할 수 있다는 내용으로부터 시작합니다. 2계 선형 미분방정식을 고유값 문제의 일반적인 성질로 해결하고자 하는 이론을 '스투름-리우빌 이론(Sturm-Liouvelle Theory)'라고 부릅니다. 일반적인 고유값 문제의 형태는
$$\mathcal{L}\psi(x)=\lambda \psi\;\;\; \cdots \;\;\; (1)$$
여기서 $\mathcal{L}$ 은 '2계 선형 미분 연산자(Second-order differential operator)' 이라 부르며, 그 일반적인 형태는
$$\mathcal{L}(x)=p_0(x)\frac{d ^2}{dx^2}+p_1(x)\frac{d}{dx}+p_2(x)\;\;\;\cdots \;\;\; (2)$$
스투름-리우빌 이론에서 목적은 이 연산자 $\mathcal{L}$ 을 허미션 연산자로 만드는 것입니다!
3. 허미션/자기수반 미분방정식
1) 왜 하필 Hermitian인가?
어떻게 연산자를 Hermitian으로 만들 수 있다는 뜻일까요? 아니, 애초에 왜 Hermitian으로 만들려고 하는 것일까요? 그 이유를 먼저 찾아봅시다. Hermitian 연산자는 두가지 매우 중요한 성질을 갖습니다. 이 중 두번째 성질은 사실 연산자가 정규 연산자(Normal operator)이거나 유니타리 연산자(Unitary operator)이어도 성립합니다만, 첫번째 성질이 알파이자 오메가입니다. 첫번째 성질 때문에 물리에서는 Hermitian 연산자가 독보적인 쓰임새를 보여주는 것이기도 하고요. 이 세상의 현상은 복소수가 아닌 실수로 설명해야 하기 때문입니다.
$T$ 가 허미션/자기수반 연산자(Hermitian operator)면 이것은 다음 두 가지 중요한 성질을 갖는다.
① $T$의 모든 고유값은 실수이다 : $\forall \lambda \in \mathbb{R}$
② 서로 다른 고유값에 대응되는 모든 고유벡터들은 직교(orthogonal)한다.
선형대수학 시간은 아니니까 증명은 하지 않겠습니다. 어차피 증명 자체는 교과서나 인터넷에도 유명해서 많이 나와있기도 하고 내적공간을 알기만 하면 그리 어렵지는 않습니다.
그렇다면, 스투름-리우빌 이론의 목적에 걸맞게 미분연산자를 허미션으로 만들어봅시다. 그러면 미분방정식을 Hermitian으로 만드는 과정이 필요합니다. 미분방정식이 어떻게 Hermitian일 수 있을까요? 다음과 같이 정의를 합니다. 참고로, 스투름-리우빌 이론에서는 허미션 대신 자기수반이라는 용어를 좀 더 많이 씁니다. 어차피 같은 뜻이지만요.
미분 연산자 $\mathcal{L}$ 에 대하여 $\mathcal{L}$이 만일 다음 조건
$$p_0'(x)=p_1(x)$$ 을 만족하면, $\mathcal{L}$ 을 '자기수반(self-adjoint)' 이라 부른다. 그러면 이는
$$\mathcal{L}(x)=\frac{d }{dx}\left\{ p_0(x)\frac{d }{dx} \right\}+p_2(x)$$ 으로 다시 쓸 수 있다.
이제 미분방정식을 풀어보도록 합시다. $\mathcal{L}$ 이 어떤 함수 $u(x)$에 작용하게 되는 경우를 생각하면
$$\mathcal{L}u=\left( p_0u' \right)'+p_2u$$
위 방정식에 내적을 취할 것입니다. 쉽게 말해서 좌변을 $\left\langle v\mid\mathcal{L}u \right\rangle$ 으로 만든다는 것이고, 내적의 적분형태를 사용할 것입니다. 내적의 적분형태는 링크글에서 설명한 바 있으며 물리 방식대로 앞함수에 켤레를 취해서 뒤함수와 곱하고 적당한 구간 $[a,b]$ 에서 정적분을 걸면 됩니다.
$$\begin{align*}
\left\langle v\mid\mathcal{L}u \right\rangle&=\int_{a}^{b}v^*(x)\mathcal{L}u(x)dx=
\int_{a}^{b}\left\{ v^*(x)\left( p_0u' \right)'+v^*p_2u \right\}dx
\\\\&=\left[ v^*p_ou \right]_a^b
+\int_{a}^{b}\left\{ -(v^*)'(p_ou') \right\}dx+\int_{a}^{b}v^*p_2u\,dx
\end{align*}$$
여기서 둘째항은
$$\int_{a}^{b}\left\{ -(v^*)'(p_ou') \right\}dx=\left[ -\left( v^* \right)'p_0u \right]_a^b+
\int_{a}^{b}\left\{ p_0\left( v^* \right)' \right\}'u\,dx$$
이 되어, 대입하게 되면
$$\begin{align*}
\left\langle v\mid\mathcal{L}u \right\rangle&=\int_{a}^{b}v^*(x)\mathcal{L}u(x)dx
\\\\&=\left[ v^*p_0u'-\left( v^* \right)'p_0u\right]_a^b-\int_{a}^{b}\left( \mathcal{L}v(x) \right)^*u(x)dx
\end{align*}\;\;\;\cdots \;\;\;(3)$$
이것은 $(3)$의 첫 항이 만일 사라지게 된다면, 즉 $\left[ v^*p_0u'-\left( v^* \right)'p_0u\right]_a^b$ 이 되는 경우 좌변과 우변을 비교하면
$$\int_{a}^{b}v^*(x)\mathcal{L}u(x)dx=\int_{a}^{b}\left( \mathcal{L}v(x) \right)^*u(x)dx$$
이고, 이는 내적으로 다시 쓰면
$$ \therefore \;\;\; \left\langle v\mid\mathcal{L}u \right\rangle=\left\langle \mathcal{L}v\mid u \right\rangle$$
임을 뜻하는 것이니 연산자 $\mathcal{L}$ 이 자기수반 연산자임을 뜻합니다!!
3) 경계항(Boundary term)
식 $(3)$의 우변에서 첫 항은 적분이 이미 되어 있는 상태이며, 그것에 $b$를 대입한 값에서 $a$를 대입한 값을 빼야 하는 상황에 해당합니다. 이는 적분의 경계인 $a,b$에서의 값을 말하는 것이라서 경계값을 갖는 항이라는 뜻으로 '경계항(Boundary term)' 이라고 부릅니다. 우리가 원하는 대로 $\mathcal{L}$ 을 자기수반 연산자로 만들기 위해선 경계항을 0으로 만들어야 합니다. 이 때 주어지는 것이 물리학에서도 시도때도 없이 튀어나오는 '경계조건(Boundary condition)'에 해당합니다. 경계조건은 크게 다음과 같은 중요한 3가지 종류로 나눌 수 있습니다.
$\mathcal{L}$ 이 자기수반 연산자가 되기 위해 경계항이 갖추어야 할 경계조건은 크게 다음 세 가지로 나눌 수 있다.
① 디리클레 경계조건(Dirichlet boundary condition) : Endpoints(양끝점)에서 함수값이 0인 경우, 즉 $u(a)=v(a)=0\;,\;u(b)=v(b)=0$
② 노이만 경계조건(Neumann boundary condition) : Endpoints(양끝점)에서 미분계수가 0인 경우, 즉 $u'(a)=v'(a)=0\;,\;u'(b)=v'(b)=0$
③ 주기적 경계조건(Periodic boundary condition) : $\left[ v^*p_0u' \right]_a^b=\left[ \left( v^* \right)'p_0u \right]_a^b$
세 조건에 해당하면 경계항이 0이 된다는 것은 어렵지 않게 대입해봄으로서 확인하실 수 있을 것입니다. 그리고 이 경계조건 용어들은 굳이 스투름-리우빌 이론이 아니라도 사용됩니다.
4. 직교성(Orthogonality)
특수함수들은 항상 직교성에 관한 관계가 있고 많은 물리문제에서 직교성을 매우 빈번히 사용하고는 합니다. 이러한 직교성, 그리고 에르미트 연산자의 두가지 특징도 이 스트룸-리우빌 이론에서 이끌어낼 수 있습니다.
식 $(3)$에서 적분항과 경계항을 각각 한 변에 몰아 정리해봅시다. 그러면
$$\int_{a}^{b}\left[ v^*(x)\mathcal{L}u(x)+\left\{ \mathcal{L}v(x) \right\}^*u(x) \right]dx
=\left[ v^*p_0u'-\left( v^* \right)'p_0u\right]_a^b\;\;\;\cdots \;\;\;(4)$$
이 떄 $\mathcal{L}$ 은 고유값 문제로 볼 수 있는 연산자에 해당함을 가정했다는 사실을 복기하면,
$$\mathcal{L}u=\lambda_u u\;\;,\;\;\mathcal{L}v=\lambda_v v$$
로 둘 수 있습니다. (참고로 $\mathcal{L}$이 자기수반이기 때문에, 적분의 두번째 항에서 $\lambda_v^*=\lambda_v$ 로 취급할 수 있음을 기억합시다.) 이 관계를 대입하면 아래의 멋진 직교성에 관한 식이 탄생합니다.
$$\left( \lambda_u-\lambda_v \right)\int_{a}^{b}v^*u\, dx=
\left[ p_0\left( v^*u'-\left( v^* \right)'u \right) \right]_a^b$$
경계항이 0이 되고 두 고유값이 다른 경우, 곧 $\lambda_u\neq \lambda_v$ 라면, 고유함수(고유벡터) $u$와 $v$는 직교(orthogonal)한다. 다시 말해, $\mathcal{L}$ 이 자기수반 연산자면 이 연산자에 작용하는 서로 다른 고유값을 갖는 고유벡터들은 직교한다.
아주 아주 아름다운 관계입니다. 이 스투름-리우빌 이론을 바탕으로 특수함수들을 해로 갖는 특수한 상미분방정식들은 자기수반 연산자로 다룰 수 있고, 그 해들인 특수함수들은 고유함수에 해당하므로 직교하여 르장드르 함수, 베셀 함수, 에르미트 함수 등 이들의 직교성 관계들이 성립하는 것입니다.
그런데 직교성 식을 보면 가끔 두 함수를 곱한 요소 이외의 항이 붙어있는 경우가 있습니다. 그리고, 모든 상미분 방정식이 처음부터 자기수반 연산자로 표현할 수 있다고 단정할 수는 없겠지요? 아직 스투름-리우빌 이론의 절반밖에 나아가지 않았습니다. 나머지 반은, 자기수반이 아닌 상미분방정식을 자기수반으로 만드는 기가 막힌 방법으로 구성되어 있습니다. 이를 다음 글에서 확인해보도록 하겠습니다.
[참고문헌]
Mathematical Methods for Physicists, 7e, Arfken, Weber, Harris
댓글