微分方程式と接続の話


こんばんは、satoです。

はじめに…

この記事では専門的な数学の話をします。

どちらかといえば「数学に興味がある」とか「数学を勉強している」人向けになります。

その辺りをご了承くださいませ(;’∀’)

今日の話は「微分方程式をどうやって解くのか?」ということについて、よく書かれている公式がどうして成り立つのかを考えてみたことをまとめてみました。

その中で「接続」という概念も出てくるので、その解説をします。

微分方程式の解法

たとえば、次の微分方程式を考えます。

    \[\frac{d^2y}{dx^2}=-y\]

このように方程式の中で高々2階微分で表されるものを2階微分方程式と言います。

2階微分すると-1倍されるような関数を求めよ、という話です。

これ、答えは\cos x, \sin xだということは知っていますが、どのように求めるのかご存知でしょうか?

教科書によくある解法

大学一年生とかで習う解法は次のようになります。

まず方程式を\frac{d^2y}{dx^2}+y=0とすると、\frac{d}{dx}\lambdaに置き換えてできる\lambda^2+1=0を解くと\lambda=\pm iとなります。

これを使うと微分方程式の解がy=C_1e^{ix}+C_2e^{-ix}となります。ただし、C_1,C_2は任意の定数です。

ここで、オイラーの公式e^{ix}=\cos x+i\sin xを用いると

    \[\frac{1}{2}(e^{ix}+e^{-ix})=\cos x, \frac{1}{2i}(e^{ix}-e^{-ix})=\sin x\]

となり、\cos x, \sin xが解になることが分かりました。

この解法の中で一つ方程式を解いたところがありますが、これを「特性方程式」と言います。

特性方程式を解いたら、その解から微分方程式の解が解けてしまうのです。

もう少し詳しく

ところで、どうしてこのように解答できるのでしょうか?それは次のような計算をしているからです。

    \begin{eqnarray*} &&\frac{d^2y}{dx^2}+y=0 \\ &&\(\frac{d^2}{dx^2}+1)y=0 \\ &&(\frac{d}{dx}-i)(\frac{d}{dx}+i)y=0\\ &&(\frac{d}{dx}-i)y=0\Leftrightarrow y=C_1e^{ix}, (\frac{d}{dx}+i)y=0\Leftrightarrow y=C_2e^{-ix} \\ &&\therefore y=C_1e^{ix}+C_2e^{-ix} \end{eqnarray*}

最後の方程式は「微分するとiが出てくる関数」ということで簡単に求められます。

特性方程式は「微分方程式を因数分解」するために使ったわけです。

また、最後の話は「重ね合わせの原理」というものを使っています。先ほどの簡単な微分方程式を満たす二つの解はどちらも、元々の微分方程式の解を満たします。

ここから、二つの解を足し合わせたものも解となるというのが重ね合わせの原理なのです。

特性方程式が重解を持つ場合

こうして、2階微分方程式を解けるのですが、この解法には問題が一つありまして…特性方程式が重解を持つ時にうまく行かないということです。

    \[\frac{d^2y}{dx^2}-2\frac{dy}{dx}+y=0\]

の特性方程式は\lambda^2-2\lambda+1=0です。この解は\lambda=1でこれを用いると

    \[(\frac{d}{dx}-1)y=0\Leftrightarrow y=C_1e^{x}\]

と一つの解しか出てきません。こういうとき教科書には二つ目の解としてy=C_2xe^xというものを持ってきます。これが解となることは割と簡単に示せて無事に微分方程式を解くことができた、というわけです。

が…どうしてこの解が出てきたのでしょうか?

疑問

そもそも、特性方程式がどうして出てきたのか?特性方程式と微分方程式にはどういう関係があるのか?

また、重ね合わせの原理がどうして成り立つのか?

など、いろいろ疑問が出てきます。

今日はこれについて自分なりに理解したことをまとめてみます。

行列の話が分かればある程度は分かるはず。大学一年生の線形代数の知識を前提としています。

微分方程式を行列で表す

というのが、これから話す解き方のコンセプトです。

記号の解説

二つの関数f,gがあったときに、

    \[\begin{pmatrix} f \\ g \end{pmatrix}\]

というようにベクトルで表示します。で、このベクトルに関して

    \[\nabla \begin{pmatrix} f \\ g \end{pmatrix} = \begin{pmatrix} \frac{df}{dx} \\ \frac{dg}{dx} \end{pmatrix}\]

というようにベクトルの変換を定義します。ようするに\nablaは各成分ごとに微分していくわけですね。

\nablaを行列で表す

さて、今

    \[\frac{d^2y}{dx^2}+y=0\]

を満たすような関数yに対して、

\begin{pmatrix}  y\\  y'  \end{pmatrix}\nablaによってどのように変換されるのかを考えます。

微分方程式から

    \[\frac{dy}{dx}=y', \frac{dy'}{dx}=-y\]

が成り立ちます。最初は当たり前、二番目の式は微分方程式の言いかえです。

これを使うと

    \[\nabla \begin{pmatrix} y \\ y' \end{pmatrix} = \begin{pmatrix} \frac{dy}{dx} \\ \frac{dy'}{dx} \end{pmatrix} = \begin{pmatrix} 0&&1 \\ -1&&0 \end{pmatrix} \begin{pmatrix} y\\ y' \end{pmatrix}\]

となります。

ここまで何をしたかと言いますと微分方程式を満たす関数とその導関数の組が\nablaがどのように変換されるかを行列で表現したというわけです。

行列と言えば…

大学一年生の時に「固有値」を嫌というほど計算させられたと思います。というわけで、さっき出てきた行列(Aとします)の固有値を求めましょう。

\det(A-\lambda E)=\lambda^2+1=0なので、\lambda=\pm iとなります。(Eは単位行列)

ここで「特性方程式」が出てきましたね!

さて、ついでに固有ベクトルを求めますと\lambda=iのときは

    \[c\begin{pmatrix} 1\\ i \end{pmatrix}\]

\lambda=-iのときは

    \[c\begin{pmatrix} 1\\ -i \end{pmatrix}\]

となります。ここで

    \[P= \begin{pmatrix} 1&&1\\ i&&-i \end{pmatrix}\]

と置くと、

    \[P^{-1}AP= \begin{pmatrix} i&&0\\ 0&&-i \end{pmatrix}\]

が成り立ちます。対角化ですね。ここから

    \[AP=PP^{-1}AP=P \begin{pmatrix} i&&0\\ 0&&-i \end{pmatrix}, A=APP^{-1}=P \begin{pmatrix} i&&0\\ 0&&-i \end{pmatrix}P^{-1},\]

となります。ちなみに余計な式を増やしたのは流行に乗りたかっただけです(笑)

微分方程式を変形する

さて、上を用いると

    \[\nabla \begin{pmatrix} y \\ y' \end{pmatrix} =A \begin{pmatrix} y\\ y' \end{pmatrix} =P \begin{pmatrix} i&&0\\ 0&&-i \end{pmatrix}P^{-1} \begin{pmatrix} y\\ y' \end{pmatrix}\]

となります。ここで、ベクトルv

    \[v=\begin{pmatrix} v_1\\ v_2 \end{pmatrix} =P^{-1}\begin{pmatrix} y\\ y' \end{pmatrix} =\begin{pmatrix} y+y'\\ iy-iy' \end{pmatrix}\]

とすると、

    \[\nabla v=\begin{pmatrix} i&&0\\ 0&&-i \end{pmatrix}v\]

となります。つまり、

    \[\frac{d}{dx}v_1=iv_1, \frac{d}{dx}v_2=-iv_2\]

となるのです!この方程式から

    \[v_1=C_1e^{ix}, v_2=C_2e^{-ix}\]

となるので、あとはPを掛けて変形すればy=C_1e^{ix}+C_2e^{-ix}が得られました!

いやー長かったですね…。

で、結局何をしたの?

先ほどの解法に比べると分かりにくいし面倒くさい気がするこの「微分方程式を行列に置き換える」という解法ですが、結局何をしたのでしょうか?まとめると

与えられた微分方程式の解とその導関数の組によるベクトルを、\nablaという作用がどのように変換するのかを考えます。

そうして、\nablaという変換によって動かない固有ベクトルを求めます。すると、この組に対しては微分方程式が簡単になります。
その簡単な微分方程式を解くことで元の微分方程式の解を得ました。

という流れです。で、この\nablaというのが接続と言われているものです。微分方程式とその導関数の組は一つの「幾何学」的なものがあるのですが、その間の変換を表しています。

で、その行列での表現を「接続行列」と言ったりします。

長いようですが、一つ一つの変形がどのようになっているのかをより深く理解できます。

特性方程式は接続行列の固有方程式

微分方程式の因数分解の正体は固有ベクトルによる\nablaでの変換

重ね合わせの原理は固有ベクトルから元の微分方程式の解を出す計算

に対応しているわけです。

さらに、特性方程式の解が重解の時にどうして二つ目の解がああなるのかについても説明できます。

特性方程式が重解を持つ場合

    \[\frac{d^2y}{dx^2}-2\frac{dy}{dx}+y=0\]

の時に先ほどの行列に置き換えてみましょう。

上と同様に

    \[\nabla \begin{pmatrix} f \\ g \end{pmatrix} = \begin{pmatrix} frac{df}{dx} \\ frac{dg}{dx} \end{pmatrix}\]

とすると、微分方程式の解とその導関数の組からなるベクトルに対して

    \[\nabla \begin{pmatrix} y \\ y' \end{pmatrix} = \begin{pmatrix} 0&&1 \\ -1&&2 \end{pmatrix} \begin{pmatrix} y\\ y' \end{pmatrix}\]

となります。ここで出てきた行列をBとすると、Bの固有方程式は(\lambda-1)^2=0となり、固有値は1のみになります。

この固有ベクトルを求めると

    \[c\begin{pmatrix} 1\\ 1 \end{pmatrix}\]

の一種類だけになります。あれ、これだと対角化できないぞ…(;’∀’)

広義固有ベクトル

そこで、広義固有ベクトルというものを使います。固有ベクトルはBv=\lambda vとなるベクトルですが、広義な固有ベクトルというのは適当な自然数mに対して(B-\lambda E)^mv=0となるベクトルを表します。

求めるときには固有ベクトルvを使って(B-\lambda E)v'=vとなるv'を求めて、あとは順次…という流れです。

この場合は計算すると、たとえば

    \[\begin{pmatrix} 0 \\ 1 \end{pmatrix}\]

が当てはまります。

で、

    \[Q= \begin{pmatrix} 1&&0 \\ 1&&1 \end{pmatrix}\]

とすると、次が成り立ちます。

    \[Q^{-1}BQ= \begin{pmatrix} 1&&1 \\ 0&&1 \end{pmatrix}\]

このように、対角化できない行列も上三角行列に変えることができます。

微分方程式を変形

これを用いると

    \[\nabla \begin{pmatrix} y \\ y' \end{pmatrix} =Q \begin{pmatrix} 1&&1 \\ 0&&1 \end{pmatrix}Q^{-1} \begin{pmatrix} y\\ y' \end{pmatrix}\]

が成り立ちます。よって、ベクトルu

    \[u=\begin{pmatrix} u_1\\ u_2 \end{pmatrix} =Q^{-1}\begin{pmatrix} y\\ y' \end{pmatrix} =\begin{pmatrix} y\\ -y+y' \end{pmatrix}\]

とすると、

    \[\nabla u = \begin{pmatrix} 1&&1 \\ 0&&1 \end{pmatrix}u\]

となるわけです。これで、

    \[\frac{d}{dx}u_1=u_1+u_2, \frac{d}{dx}u_2=u_2\]

という微分方程式が得られました。このうち二番目はすぐに計算できてu_2=C_2e^xとなります。

非線形微分方程式

さて、これを使うと一つ目の微分方程式が

    \[\frac{d}{dx}u_1=u_1+C_2e^x\]

となりますが、これは実を言いますと非線形微分方程式というものになります。今まで扱っていた「線形微分方程式」と違って、これを解くことは簡単ではありません。

この場合は(C_2-1)xe^xが解になります。これを「特殊解」と言います。実際にこれを求めるときにはラプラス変換とかを使えばいいのですが…私はまだ理解できてません(´・ω・`)

というわけで、一つ目の微分方程式の解はC_1e^x+(C_2-1)xe^xとなりました。y=u_1であることからこれが元の微分方程式の解となるわけです。

つまり、重解の時に出てくるもう一つの解の正体はこの非線形微分方程式の特殊解だったのでした。

まとめ

というわけで、2階線形微分方程式の解法を詳しく考えてみた結果を書きました。

まとめると、微分方程式を「接続」という概念を通して行列に置き換えて、固有方程式を解くことで固有値を求め簡単な形に帰着させるということでした。

ちなみに、微分方程式とその導関数の組は一つの「幾何学」的なものと書いた話は正確に表現しようとすると「D-加群」の話に繋がります。Dとは微分作用素環のことです。

ただ数式を当てはめるだけで解ける微分方程式。
だけど、その解法の奥底には線型代数の理論を駆使した世界、そして幾何学の世界があるのです。
このように、御言葉も奥深い世界があります。単に言葉だけ見るとなにも分からないですが、その奥にある霊の世界を見ると…とても深い次元の言葉だとわかるのです。

…初めて数式を交えた専門的な記事を書きましたが、とても長くなりましたね(;’∀’)ここまで読んでいただきありがとうございました。

今後もこういう研究メモを書いてみようと思うので、数学好きの方はチェックしてみてください(*‘∀‘)

ABOUTこの記事をかいた人

「素直に、深く、面白く」がモットーの摂理男子。霊肉ともに生粋の道産子。30代まであと一歩。数学者を志す大学院生で、教育系の仕事もしています。 軽度の発達障害(ADHD・PD)&HSP傾向あり。