はじめに

簡単に対角化できてしまう,2準位系のハミルトニアン(2次正方行列)を使って,量子力学の2次摂動計算とSchrieffer-Wolff変換の関係をみていきます.

Schrieffer-Wolff変換

ハミルトニアン$H$は,有限次元の対角行列$H_0$と,非対角成分だけを持つ行列$\lambda V$ ($|\lambda| \ll 1$)を使って,
$
\begin{aligned}
H=H_0 + \lambda V
\end{aligned}
$
と表せるとします(もしも$V$に対角成分がある場合には,それをすべて$H_0$に含めればよいので,この分解はいつでもできます).

このとき,ユニタリ行列
$
\begin{aligned}
U=e^{S}
\end{aligned}
$
をつかったユニタリ変換
$
\begin{aligned}
H’&=e^SHe^{-S} \\
&= H + [S,H] + \frac{1}{2} [S,[S,H]] + \dots \\
&= H_0 +\lambda V + [S,H_0] + [S,\lambda V] + \frac12[S,[S,H_0]] + \frac12[S,[S,\lambda V]] + \cdots
\end{aligned}
$
を考えます.
もしも$S$として,
$
\begin{aligned}
\lambda V + [S,H_0] =0
\end{aligned}
$
となるようなものを見つけることができたら,この$S$をつかうと,
$
\begin{aligned}
H’ = H_0 + \frac{1}{2}[S,\lambda V] + \mathcal{O}(\lambda^3)
\end{aligned}
$
という新しいハミルトニアン$H’$が得られます.
$\lambda V + [S,H_0] =0$によって,非対角成分$\lambda V$を消しているので,$S$は$\lambda$の1次であり,$\lambda$の2次のオーダーの対角行列$\frac{1}{2}[S,\lambda V]$が,新しい相互作用とみなせます.

これは,$H$から,$H’$という新しい対角行列を得る操作になっていて,この操作を繰り返すことで,対角行列を$\lambda$の高次まで求めることができる,というのがSchrieffer-Wolff変換です.
(一般にはこのような都合の良い性質をもつ$S$を見つけるのが難しい)

と,一般論を書いてみましたが,以下ではこれを簡単に手計算できてしまう2準位系のハミルトニアン,つまり2次正方行列について具体的に計算することで,納得することを目指します.

2準位系のハミルトニアン

次のハミルトニアン$H$で記述される2準位系の量子力学を考えます.
$
\begin{aligned}
H=H_0+\lambda V
\end{aligned}
$
ここで,
$
\begin{aligned}
H_0=
\begin{pmatrix}
E_1 & 0 \\
0 & E_2
\end{pmatrix},\,\,
V= v
\begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}
\end{aligned}
$
とし,$|\lambda| \ll1$, $E_1,E_2,v$は実数で,$E_1>E_2$とします.

対角化できている(あるいは性質がよくわかっている)$H_0$に対して,摂動(小さなパラメタ$\lambda$で特徴づけられる相互作用項)$\lambda V$が加わったときに,ハミルトニアン$H$を$\lambda$の級数として近似計算を行うのが量子論の摂動計算でした.

が,2行2列なので対角化してしまいましょう.

2準位系なので,対角化する

$H$は2次正方行列なので対角化しましょう.
固有値$\varepsilon$とすると,$I$を2次の単位行列として,次の固有方程式
$
\begin{aligned}
\det (\varepsilon I – H_0 – \lambda V)=0
\end{aligned}
$
をときます.これは$\varepsilon$の2次方程式
$
\begin{aligned}
\varepsilon^2 – 2\frac{E_1+E_2}{2} \varepsilon +E _1 E_2 -\lambda^2v^2 =0
\end{aligned}
$
なので,
$
\begin{aligned}
\varepsilon &= \frac{E_1+E_2}{2} \pm \sqrt{ \left(\frac{E_1-E_2}{2} \right)^2 +\lambda^2v^2}\\
&= \frac{E_1+E_2}{2} \pm \frac{E_1-E_2}{2}\sqrt{ 1 +\left(\frac{2}{E_1-E_2} \right)^2\lambda^2v^2}\\
&\approx
E_1 + \frac{\lambda^2v^2}{E_1-E_2},
E_2 – \frac{\lambda^2v^2}{E_1-E_2}
\end{aligned}
$
より,2次摂動の式(今回は省略)を使って得られる結果も再現されます.
$E_1, E_2$のエネルギーを持つ状態が$\lambda V$で相互作用をすると,エネルギー準位間隔が広がるという,有名な結果です.

この結果をSchrieffer-Wolff変換で再現することで,Schrieffer-Wolff変換に親しみたいというのが,今回の目標です.

2準位系に対するSchrieffer-Wolff変換

計算の見通しを良くするために,上記のハミルトニアンを2準位のエネルギーの平均値$(E_1+E_2)/2$を基準点に取り直した,以下のハミルトニアンで考察します.

$
\begin{aligned}
H=H_0+\lambda V
\end{aligned}
$
ここで,
$
\begin{aligned}
H_0=\frac{\Delta E}{2}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
=\frac{\Delta E}{2}\sigma_z
,\,\,
V= v
\begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}
=v \sigma_x
\end{aligned}
$
とし,$|\lambda| \ll1$, $\Delta E = E_1-E_2 (>0)$.
パウリ行列を
$
\begin{aligned}
\sigma_x = \begin{pmatrix}
0 & 1\\
1 & 0
\end{pmatrix},
\sigma_y = \begin{pmatrix}
0 & -i\\
i & 0
\end{pmatrix},
\sigma_z = \begin{pmatrix}
1 & 0\\
0 & -1
\end{pmatrix}
\end{aligned}
$
とします.

 

$
\begin{aligned}
U=e^{S}
\end{aligned}
$
をつかったユニタリ変換
$
\begin{aligned}
H’&=e^SHe^{-S} \\
&= H + [S,H] + \frac{1}{2} [S,[S,H]] + \dots \\
&= H_0 +\lambda V + [S,H_0] + [S,\lambda V] + \frac12[S,[S,H_0]] + \frac12[S,[S,\lambda V]] + \cdots
\end{aligned}
$
で,
$
\begin{aligned}
\lambda V + [S,H_0] =0
\end{aligned}
$
となるようなものを見つけてみましょう.
愚直に,$S$を
$
\begin{aligned}
S=
\begin{pmatrix}
x & y \\
z & w
\end{pmatrix}
\end{aligned}
$
とおいて,$x,y,z,w$を求めます.
$
\begin{aligned}
&\lambda V + [S,H_0] =0 \\
&
\lambda v \begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix}
+\begin{pmatrix}
x & y \\
z & w
\end{pmatrix}
\frac{\Delta E}{2}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
-\frac{\Delta E}{2}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
\begin{pmatrix}
x & y \\
z & w
\end{pmatrix} =0 \\
& \lambda v \begin{pmatrix}
0 & 1 \\
1 & 0
\end{pmatrix} + \Delta E \begin{pmatrix}
0 & -y \\
z & 0
\end{pmatrix} =0
\end{aligned}
$
よって,
$
\begin{aligned}
y = \frac{\lambda v}{ \Delta E}, z = -\frac{\lambda v}{ \Delta E}
\end{aligned}
$
$x,w$は任意なので,以下では$x=w=0$とします.
つまり,
$
\begin{aligned}
\lambda V + [S,H_0] =0
\end{aligned}
$
をみたす$S$として,
$
\begin{aligned}
S=\frac{\lambda v}{ \Delta E} \begin{pmatrix}
0 & 1 \\
-1 & 0
\end{pmatrix}
\end{aligned}
$
が得られました.
実は,
$
\begin{aligned}
S= \frac{\lambda v}{\Delta E}i\sigma_y
\end{aligned}
$
です(これは,Foldy-Wouthuysen-Tani変換を知っているひとはすぐに気づいたと思いますが,知らなくてもこのようにできます).
さて,この$S$を使うと,
$
\begin{aligned}
\frac{1}{2}[S,\lambda V] &= \frac{1}{2}\frac{\lambda^2v^2}{\Delta E} [i\sigma_y,\sigma_x]=\frac{1}{2}\frac{\lambda^2v^2}{\Delta E} 2i(-i)\sigma_z \\
& = \frac{\lambda^2v^2}{\Delta E} \sigma_z= \frac{\lambda^2v^2}{\Delta E}
\begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}
\end{aligned}
$
となって,確かに,”修正された摂動項”は対角行列になっています.
したがって,Schrieffer-Wolff変換によって,
$
\begin{aligned}
H’ &= H_0 + \frac{1}{2}[S,\lambda V] + \mathcal{O}(\lambda^3) \\
&= H_0 + \frac{\lambda^2v^2}{\Delta E} \sigma_z + \mathcal{O}(\lambda^3)\\
&=\left(\frac{\Delta E}{2}+\frac{\lambda^2v^2}{\Delta E}\right) \begin{pmatrix}
1 & 0 \\
0 & -1
\end{pmatrix}+ \mathcal{O}(\lambda^3)
\end{aligned}
$
のように,2準位系の2次摂動の結果である,「元のエネルギー準位がそれぞれ $\pm \frac{\lambda^2v^2}{\Delta E} $シフトする,レベル反発が起きていること」が再現されています.

あとがき

2準位系のハミルトニアンを使って,2次摂動の計算をユニタリ変換の一種であるSchrieffer-Wolff変換で再現することで,Schrieffer-Wolff変換を知ってもらおうという試みでした.

この変換を初めて知ったときは,量子論の2次摂動計算と同等の操作が,ハミルトニアンに対するユニタリ変換で表現できるというのは,とてもエレガントだと感じました.有効模型を作るための操作としても利用できる優れモノで,私の大好きな変換の一つです.

ディラック方程式の非相対論的極限によって電子の有効ハミルトニアンを導く場合にも,全く同様の手順で行えますので,この記事で手を動かして納得されたら,チャレンジしてみてください.

ディラックのハミルトニアンに対するFoldy-Wouthuysen-Tani変換は,電子と陽電子の相互作用(それらのエネルギーギャップ$2mc^2$の逆数を展開係数として)を電子の方程式に取り込んだ有効ハミルトニアンを導出する方法です.

これと同様に,Schrieffer-Wolff変換は,たとえば,着目している物質中の伝導電子が,近接するバンドにいる電子と相互作用しているときに,その相互作用の効果を伝導電子に取り込んだ有効ハミルトニアンを導くときに使えます.

(また気が向いたら,2次摂動のノートやFoldy-Wouthuysen-Tani変換のノートも公開できたらと思っています…)