물리를 전공하게 되면 대부분의 공대, 자대에서 필수적으로 듣는 일반물리학을 제외하고 만나는 첫 진짜 물리 과목이 바로 고전역학입니다. 그런데, 만약 일반물리학을 열심히 공부했다면 고전역학의 물리학 내용은 큰 막힘없이 해쳐나갈 수 있을 것입니다. 하지만 일반물리학을 아무리 열심히 공부했다고 할지라도 고전역학부터는 대부분의 개념이 수학이라는 도구를 심도있게 사용해서 난해해집니다.
고전역학 과목에서 등장하는 수학적 기법들은 미적분학을 기초로 하여 공업수학이나 수리물리학에서 제대로 체득하지 않으면 굉장히 이해하기 어렵습니다. 그 중 진짜 대부분이 수학인 단원이자 뉴턴역학에 견줄 정도로 고전역학의 거대한 지분을 차지하고 있는 것이 바로 '라그랑주 역학(Lagarangian Mechanics)'입니다. 그런데 문제는 '변분법(Calculus of Variation)' 이라는 해석학에 등장하는 수학적 도구를 알지 못하면 라그랑주 역학의 입장권도 끊을 수가 없다는 난관에 봉착하여 많은 이들이 학습을 포기하거나 제대로 이해하지 못한 채 넘어간다는 것입니다.
그리하여 라그랑주 역학을 본격적으로 시작하기 전에, 필수적으로 알아야 하는 세가지 수학적 도구를 정리하고 가겠습니다. 바로 변분법과 오일러방정식, 변분을 나타내는 기호 $\delta$ 입니다. 이에 대해 천천히 살펴보도록 하겠습니다.
1. 범함수(Functional)
1) 정의
독립변수가 변수(Variables)가 아니라 함수(Function) 그 자체인 것을 '범함수(Functional)' 이라고 하며, 보통 $J$ 로 표기한다. $J$ 는 함수 $y,y'$ 등의 선택에 의존하는 값을 가지며 이 때 함수 $y,y'$ 은 다시 $x$에 관한 함수이다.
범함수의 정확한 수학적 정의는 해석학에서 하고, 선형대수학에서도 합니다만, 지금은 수학 시간이 아니니 쉽게 말하자면 '함수의 함수'라고 할 수 있습니다. 고등학교때까지 배웠던 익숙했던 함수는$ y=f(x)$ 로 표현하는데, 이것은 $y$가 '$x$의 함수'라고 말합니다. 그런데 범함수 $J$는 $x$의 함수인 $y=y(x)$에 의해 값이 달라지는 것이라 일반 함수랑은 다른 점이 있어 새로운 용어인 범함수라 이름을 붙이게 된 것입니다.
범함수의 예를 볼까요? 가장 쉬운 것이 바로 정적분입니다.
$$J=J(y)=\int_{0}^{2}(x^{2}y-3)dx$$
이 값은 $y$에 어떤 것을 집어넣느냐에 따라 달라집니다. 물론 $J$가 범함수라면 $y$는 $x$에 대한 함수가 되어야 한다는 조건은 필요합니다. 예를 들어 $y=x$가 될 수도 있고 $y=ex^2$ 이 될 수도 있는 것이죠. 그 때 마다 정적분의 값이 달라지니 이 정적분은 범함수인 것입니다.
2) 범함수 vs 합성함수
함수의 함수라는 말 때문인지, 범함수는 합성함수와 비교되기도 합니다. 합성함수도 함수를 함수에 대입한 것이니 함수의 함수라고 부르기도 하기 때문이죠. 둘은 어떻게 다른 것일까요?
합성함수는 어쨌든 함수이고, 범함수는 함수가 아닙니다. 그냥 함수라고 하면, 어떤 숫자를 넣었을 때 그 답도 숫자가 나와야 합니다. 즉 입력값(input)이 숫자(스칼라)이면 출력값(output)도 숫자(스칼라)입니다. 물론, 함수에서도 변수(=벡터공간의 벡터)를 넣을 수 있기는 합니다. $y=f(x)$ 와 같이 표현한다는 것이 그 증거인데, 문제는 일반 함수의 경우 넣을 수 있는 변수는 오로지 독립변수 $x$ 뿐입니다. (다변수함수면 몇개 더 있겠지요)
그러나 범함수의 경우, 입력값으로 숫자(=스칼라)를 절대 넣을 수 없고 오로지 변수(=벡터)만 넣을 수 있습니다. 또한, 일반 함수는 변수를 넣으려면 독립변수만 $f$에 넣어 종속변수 $y$를 만들었다면, 범함수는 임의의 변수식들을 넣어서 나오는 값이 반드시 스칼라인 것을 말합니다. 예컨대 위의 적분식에서, $y$ 값에 $x,1-2x^{2},5x,7x^{9}$ 등 아주 많고 다양한 변수를 넣을 수 있지요. 범함수는 이러한 변수들을 넣어도 오직 상수만이 나옵니다. 반면 합성함수는 이런 변수를 넣어도 변수에 관한 식 $\left( f\circ g \right)=f(g(x))=h(x)$ 가 나오지요. 이러한 성질로 범함수를 선형대수학에선 벡터공간에서의 체로의 함수로 정의하기도 합니다. (이는 추후 선형대수학 카테고리에서 다룸)
2. 변분법(Calculus of Variation)
1) 변분법의 목적
일전에 미분의 목적은 함수를 몰라서 함수를 알고 싶을 때라고 하였고, 또 하나는 최적화(Optimazation) 이라고 했습니다. 함수의 최대·최소를 구하고 싶을 때 사용하는 압도적으로 빈번히 쓰이고 가장 강력한 도구는 단연 미분입니다. 미분을 사용하면 그래프의 개형을 그릴 수 있을 뿐만 아니라, 우리는 대부분의 경우 최대·최소가 극대·극소에서 발생한다는 것을 알고 있기 때문이죠. 그렇다면 범함수의 최대·최소는 어떻게 구할 수 있을까에 대해 고민해 볼 수 있고, 바로 그 방법에 해당하는 것이 변분법입니다. 변분법을 통해 우리는 범함수의 최적화를 할 수 있습니다.
정리($C.D$) 3.1
변분법의 전형적인 문제는 보통 어떤 몇가지의 구속조건(constraints)들 아래에서, 정의역이 임의의 또는 모든 곳에서 y의 작은 변화에 대해 범함수 J가 정상(stationary)이 되게 만드는 연속적이고 미분 가능한 함수 y=y(x)를 찾는 것이다
함수의 최대·최소를 찾을 때 우리는 미분을 사용하고 극대·극소를 찾은 뒤 'x=a에서 극대' 등의 표현을 사용합니다. 즉 극대나 극소가 되는 어떤 지점의 x값을 말하죠. 변분법에서도 동일하게, 범함수의 극대나 극소를 찾는 것이며 그 극대나 극소가 되는 어떤 지점의 y=y(x)값을 말해야 합니다. 이 y를 찾는 것이 목적입니다.
2) 범함수에 변분법을 적용
범함수의 일반적인 표현식은 다음과 같습니다.
$$J(y)=\int_{x_{1}}^{x_{2}}f\left \{ y(x),y'(x);x \right \}dx$$
이것을 바라볼 때 물리학적 색깔을 조금 주입해 보도록 합시다. 페르마 원리(Fermat's principle)에 의하면 빛의 진행 경로는 항상 최단경로이고, 두 점을 잇는 수많은 경로 중 가장 짧은 것은 직선입니다. 비슷한 관점에서 사이클로이드 곡선도 마찬가지인데, 이것들은 모두 변분법을 이용하면 증명해 낼 수 있습니다. 적분의 양 끝 $x_{1}, x_{2}$는 시작점과 도착점이고, 그것을 연결하는 식이 $f{ y,y';x }$ 인 것입니다. 즉 $x$의 함수 $y$와 $y'$로 구성되어 있는 것이죠. 따라서 정적분은 범함수이며, 우리는 최단경로 등의 최적화(Optimazation)를 위해 이 적분의 극값을 갖도록 $y=y(x)$를 정하는 것이 목표입니다.
계속해서 똑같은 말을 하고 있죠? 이제 무시무시한 수학 식들이 모습을 드러낼 순서입니다. 다음의 상황에 주목해 봅시다. 내가 하고 싶은 것은 그림처럼 두 점을 잇는 수많은 경로들 중 최적의 경로가 무엇인지 찾는 일입니다.
두 점을 잇는 최적의 경로는 제가 그림에 검은색으로 나타낸 경로로서, $J$가 극값이 되는 경로입니다. 범함수가 어떻게 주어졌는지 문제에 따라 꼭 여기서 말하는 최적의 경로가 최단거리를 의미하는 것이 아닐 수 있습니다. (그러나 그림상으론 직선처럼 그려서 혼동을 방지했습니다)
$J$의 값은 다양한 $y$값에 따라 여러 값이 존재할 것입니다. 이것은 그림상에서 주황색, 노란색, 파란색 경로들로 나타나 있습니다. 간단히 생각하면 이렇게 색깔이 있는 경로는 극값에서 일정량만큼 '변형'되었다고 볼 수 있고, 경로를 줄처럼 취급했을 때 극값의 경로는 원래 줄인데 '잡아당김'의 효과를 받아 변형되어 '잡아당긴 줄'이 되었다고 생각할 수 있습니다.
그래서 $y$라는 함수를 다음과 같은 관계식으로 나타냅니다.
$$y(\alpha ,x)=y(0,x)+\alpha \eta (x)$$
$y(0,x)$ : $J$가 극값이 되는 경로에서의 함수 $y$로, 변형되기 전 Original 끈이라는 느낌으로 받아들입시다.
$η(x)$ : 임의의 $x$에 대한 함수입니다. 이 함수에 특정 상수 $\alpha$ 배를 해서 Original path 에 더하면 변형경로가 탄생합니다. 이 함수는 연속이고 미분가능하며 끝점 $(x1,x2)$ 에서의 함수값이 0입니다. (왜냐하면 끝점 $x1,x2$ 에서는 그 어떤 변형된 경로들도 극값이 되는 경로와 함숫값이 동일하니까요) 이것은 이따가 경계조건으로 쓰이니 잘 기억해 둡시다.
$y(α,x)$ : 변형된 경로를 나타내는 함수입니다. 잡아당겨 늘린 상태의 줄입니다.
그렇다면, 우리의 목표는 수많은 $J$들 중에서 극값이 되는 경로를 찾는 것이며 이 경로는 단연 변형되지 않은 경로로 $\alpha=0$ 일 때 $y(0,x)$ 와 결부되어 있습니다. 따라서 경로를 나타내는 범함수 $J$가 극값을 갖기 위한 조건(= $J$가 정상적(stationary)가 되게 할 조건)은
$$\left [ \frac{\partial J(\alpha)}{\partial \alpha} \right ]_{\alpha=0}=0$$
가 된다는 결론을 얻습니다.
실제로 이 계산을 하다 보면 오일러 방정식(Euler Equation)을 획득합니다. 그래서 앞으로 변분법을 할 때는 범함수에 대해 오일러 방정식을 풀기만 하면 답을 건져낼 수 있게 되지요. 이에 대해서는 다음 시간에 배워보도록 하겠습니다.
'미분류 > 변분법' 카테고리의 다른 글
오일러 방정식의 제 2형태 : 벨트라미 항등식 (The Second form of the Euler Equation : Beltrami Identity) (0) | 2021.01.28 |
---|---|
변분법에서의 오일러 방정식 (Euler Equation in the Calculus of Variation) (3) | 2021.01.11 |
댓글