この講義で使用する教科書は、丸善出版の熱力学・統計力学です。この講義が始まりまだ初年度のため、教科書は模索中です。言い訳にはなりますが、熱力学、統計力学は本来別々に1期ないしは1年通じて学ぶ必要のあるものです。なぜか本学では1期で熱力学・統計力学両方学ぶカリキュラムになっておりますので、大分無理があることをしているとご承知おきください。
統計力学とは、微視的なミクロな状態を記述する枠組みから、巨視的なマクロな状態を記述することを目指す分野です。具体例として、気体1粒子の運動量 \(mv\) (\(m\)は質量、\(v\)は速度、ミクロな式) から出発したとき、粒子が大多数集まった気体全体として、\(pV = NkT\) (\(p\)は圧力、\(V\)は体積、\(N\)は粒子数、\(k\)はボルツマンの比例係数、\(T\)は温度) というマクロな式を導くことが挙げられます (詳しくは後々触れていきます)。
熱力学とは、巨視的なマクロな状態を記述することを目指す分野です。例えば上記の例では \(pV = nRT\) という式から出発して、気体の性質はどのようなものがあるかを理解していく分野になります。
熱力学・統計力学、どちらも実験と理論、双方から理解を進めていく分野になります。実験から導かれた法則に基づき理論展開、その理論を実験的に実証…という流れです。
本講義資料はRMarkdownを利用して作成していく予定です。RMarkdownの仕様上、htmlのアップロードが標準仕様であり、無理やりpdfに変換した資料もアップロードします。
熱力学系は、巨視的な量 = 状態量 (例えば、エネルギー\(E\)、体積\(V\)、粒子数\(N\)、エントロピー\(S\)、温度\(T\)、圧力\(p\))、 により曖昧さなしに定義される系である。
状態量は 1) 示量状態量(系内の物質の量に依存する状態量、例えばエネルギー\(E\)、体積\(V\)、エントロピー\(S\)) と 2) 示強状態量(系内の物質の量に依存しない状態量、圧力\(p\)、温度\(T\)) に分類できる。
2つの物体の温度が等しいことが、これらの物体間で熱平衡が成り立つための条件である。熱力学における状態量は、平衡状態において定義され観測される量である。平衡状態とは、巨視的な状態量がこれ以上変化しないほど長時間たった後に自然に行きつく先として定義できる。
1つの系と熱平衡状態にある系はすべて互いにまた熱平衡状態にある。この経験的な事実を熱力学第0法則とよぶ。つまり、熱平衡状態にある系は互いに共通な示強変数をもつ。この示強変数を温度とよぶ(温度は計測可能なものとする)。理想的な条件下では、温度は粒子の平均運動エネルギーであることを後述する。
(教科書図1.1、1.2参照) 圧力と粒子数を一定にした希薄な気体の体積\(V\)を用いて、熱力学的温度\(T\)を、 \[\begin{equation} T = T_0 \frac{V}{V_0} \end{equation}\] と定義する。ただし、\(V_0\)、\(T_0\)は大気圧下の標準体積、基準温度である。氷の融点を\(273.15K\)と決めるのが一般的。
理想気体 = 原子を相互作用しない質点として記述する。理想化された模型ではあるが、多くの洞察をもたらす。希薄な気体はおおよそ理想気体であると想定できる。理想気体では、実験的に以下の性質が知られている(図1.3)。
\[\begin{equation} pV = p_0V_0 \end{equation}\] ただし、温度\(T\)は一定とする。
同様に、以下の性質も実験的に発見されている。 \[\begin{equation} V = \frac{T}{T_0}V_0 \end{equation}\] ただし、圧力\(p\)は一定とする。
上記の式を考察していく。任意に選んだ状態\((p_0, V_0, T_0)\)から最終状態\((p, V, T)\)に近づけていくことを想定する。第一に、\(T\)を一定として圧力を\(p\)に変化させる。すると、 \[\begin{equation} pV_0' = p_0V_0 \end{equation}\] が成り立つ(\(T_0 = \mathrm{const.}\))。ついで、\(p = \mathrm{const.}\)として、温度を変えていくと、 \[\begin{equation} V = \frac{T}{T_0}V_0' \end{equation}\] が成り立つ。第一の式から \(V_0' = \frac{p_0}{p}V_0\) を得、第二の式に代入すると、 \[\begin{equation} \frac{pV}{T} = \frac{p_0V_0}{T_0} \end{equation}\] が得られる。
\(p\)、\(T\)は物質の量に依存しない量、\(V\)は依存する量であった。したがって、\(\frac{pV}{T}\)は物質の量\(N\)に比例して増加するであろう。すなわち、 \[\begin{equation} \frac{pV}{T} = Nk \end{equation}\] もしくは \[\begin{equation} pV = NkT \end{equation}\] が成り立つであろう。これは理想気体の法則とよばれ、今後しばしば利用する状態方程式(状態を記述する方程式)である。
— (10/15はここから) —
(10/8のおさらい)
(Wikipediaより)示量状態量は、「系全体の量が部分系の量の和に等しくなること」という性質をもつ。容器を可動性の壁により2つの部分に分ける(部分1は粒子数\(N_1\)、体積\(V_1\)、圧力\(p_1\)、温度\(T_1\)、部分2は粒子数\(N_2\)、体積\(V_2\)、圧力\(p_2\)、温度\(T_2\)という状態量をもつとする)。容器全体の粒子数は\(N = N_1 + N_2\)、容器全体の体積は\(V = V_1 + V_2\)となり、粒子数と体積は「系全体の量が部分系の量の和に等しくなること」という性質をもつ。一方、壁が動かない状態が平衡状態であるため、\(|p_1| = |p_2|\)であり、容器全体の圧力\(|p|\)は、\(|p| \neq |p_1| + |p_2|\)であることは想像に難くない。温度も同様。このように、「系全体の量が部分系の量の和に等しくなること」という性質をもつ状態量は示量状態量、「系全体の量が部分系の量の和に等しくなること」という性質をもたない状態量は示強状態量である。
平衡状態とは、巨視的な状態量がこれ以上変化しないほど長時間たった後に自然に行きつく先として定義できる。
粒子間の距離が大きい、希薄な気体を理想気体という(粒子同士の位置によるポテンシャルエネルギーはないものと想定する)。理想気体は、圧力\(p\)、体積\(V\)、粒子数\(N\)、定数\(k\)、温度\(T\)をもちいて、状態方程式 \[\begin{equation} pV = NkT \end{equation}\] をみたす。
温度は温度計で測ることができる日常的なものである、と感じるであろう。それでは、温度とその他の物理量との関係性は何であろうか?(言い換えるならば、温度とは何か?という問題である)。ここでは、平衡状態の理想気体の温度 = 粒子の平均運動エネルギーであることを示す。気体の各粒子の速度ベクトルを\(\vec{v}\)とする。これは時間的に変化するものであるものの、平衡状態ではある速度範囲\(d^3\vec{v}\)には、時間平均的には同じ数の粒子が存在するものと想定できる。どの速度範囲に属する粒子が最も多いのか、という問いを考えるには速度分布\(f(\vec{v})\)を考える必要があるが、とりあえずそれはおいておく(教科書例1.2参照)。
確率分布の知識をおさらいしておくと、確率変数\(z\)が\(z \in (x, x + d x]\)に含まれる確率が\(f(x)dx\)として定義される。加えて、\(f(x) \ge 0\)かつ確率変数の定義域\(D\)において積分すると\(\int_D f(x)dx = 1\)である。
つまり、ある1粒子が速度\(\vec{v}\)周りの微小範囲に含まれる確率は\(f(\vec{v})d^3\vec{v}\)(速度ベクトルは3次元なので微小な立方体を考える)であるため、速度\(\vec{v}\)周りの微小範囲に含まれる平均的な粒子数\(dN\)は \[\begin{equation} dN = Nf(\vec{v})d^3\vec{v} \end{equation}\] である(例えば、\(\vec{v} = (1, 0, 0)\)、1粒子がこの速度ベクトルをもつ確率が\(f(\vec{v})d^3\vec{v} = 0.0001\)、粒子数が\(N = 10000\)とすると、おおよそ\(1\)個の粒子が速度ベクトル\(\vec{v} = (1, 0, 0)\)をもつと期待できる)。もしくは \[\begin{equation} f(\vec{v}) = \frac{1}{N}\frac{dN}{d^3\vec{v}} \end{equation}\] となる。
以降、とある容器に入った気体を考える。容器の壁には圧力が生じる。圧力は、単位が\(N/m^2\)であるように、平面の単位面積当たりにかかる力を意味する。ここでの圧力は粒子が壁にあたり跳ね返る際に生じる力であろう。
(図1.4参照)弾性衝突かつ\(z\)方向のみを想定すると、\(v_z\)にて壁にあたった粒子は速度が\(-v_z\)に変化するため、運動量\(2mv_z\)を壁に与える(\(m\)は粒子の質量)。
速度\(\vec{v}\)をもつ粒子の数は、平均的には\(Nf(\vec{v})d^3\vec{v}\)である。速度\(v_z\)をもち、微小時間\(dt\)内に壁にあたる粒子は\(z\)方向に距離\(v_zdt\)以内に存在する。\(x\), \(y\)方向にはどのような速度でもよいので、衝突する壁の面積を\(A\)とすると、速度\(v_z\)をもち体積\(Av_zdt\)に含まれる粒子が時間\(dt\)内に壁に衝突する。考えている容器の体積を\(V\)とすると、速度\(v_z\)をもち、今想定している壁にぶつかる粒子数の割合は\(\frac{Av_zdt}{V}\)。さらに速度\(\vec{v}\)をもつ粒子の数は(\(z\)方向には\(v_z\))、平均的には\(Nf(\vec{v})d^3\vec{v}\)であるため、速度\(v_z\)をもち、壁にぶつかる粒子数は、平均的には\(Nf(\vec{v})\frac{Av_zdt}{V}d^3\vec{v}\) (速度ベクトル\(\vec{v}\)をもつ粒子の内、体積\(Av_zdt\)に含まれる粒子のみが壁にぶつかる)。
つまり、速度\(\vec{v}\)をもつ粒子のうち、平均的には\(Nf(\vec{v})\frac{Av_zdt}{V}d^3\vec{v}\)個の粒子が壁に運動量を与える。例えば壁をいくつかの2次元グリッドに分けたとして、各領域が受ける力積は一定ではないため、力積を全壁領域で積分したもの\(\langle \int dF_A \rangle dt\)を考える。力積は運動量の変化\(2mv_z \times N f(v_z)\frac{Av_zdt}{V} d^3\vec{v}\)と等しい。ここで、\(\vec{v}\)は様々な値が存在するため、条件を満たす[=壁に当たる]、すべての場合について考える。すべての場合について考慮するには、周辺化が有効であり(統計・機械学習でしばしば利用する用語)、すべての場合の数について積分する(離散値の場合は足し算)。すると、 \[\begin{equation} \left(\int dF_A\right)dt = \int 2mv_z \times N f(\vec{v})\frac{Av_zdt}{V} d^3\vec{v} \end{equation}\] が成り立つと考えられる。両辺から\(dt\)を除くと、 \[\begin{equation} p = \frac{1}{A}\int dF_A = \int 2mv_z \times N f(\vec{v})\frac{v_z}{V} d^3\vec{v} \end{equation}\] となる(圧力は単位面積当たりに受ける力である(\(p = \frac{1}{A}\int dF_A\)))。壁に衝突するには壁に向かって動く粒子のみを考えること(この条件を満たす速度を\(v_z > 0\)と定義しよう)を踏まえて計算を進めると、 \[\begin{equation} p = \frac{N}{V} \int_{-\infty}^{\infty}dv_x \int_{-\infty}^{\infty}dv_y \int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z \end{equation}\] となり、式を書き直すと、 \[\begin{equation} pV = N \int_{-\infty}^{\infty}dv_x \int_{-\infty}^{\infty}dv_y \int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z \end{equation}\] となる。いま、平衡状態を想定しているため、\(v_z\)の値はまんべんなく観測できるはずである。つまり、\(\int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z = \int_{-\infty}^{\infty} mv_z^2 f(\vec{v}) dv_z\)であろう。加えて、平衡状態であれば\(x\), \(y\), \(z\)方向の速度もまんべんなく観測できるであろう。つまり、平均的な\(v_z^2\) (ここでは\(\langle v_z^2 \rangle = \int_{-\infty}^{\infty} mv_z^2 f(v_z) dv_z\)とする) は、\(v_x^2\)とも\(v_y^2\)とも等しいであろう。つまり、 \[\begin{equation} \int_{-\infty}^{\infty}dv_x \int_{-\infty}^{\infty}dv_y \int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z = m \langle v_z^2 \rangle = m \langle v_x^2 \rangle = m \langle v_y^2 \rangle \end{equation}\] であろう。速度ベクトルのノルムの2乗の平均を\(\langle \vec{v}^2\rangle\)とすると、\(x\), \(y\), \(z\)方向は平衡状態であれば無相関であると想定できるはずなので、\(\langle \vec{v}^2\rangle = \langle v_x^2\rangle + \langle v_y^2\rangle + \langle v_z^2\rangle\)となるであろう。すなわち、\(\langle v_z^2\rangle = \frac{1}{3}\langle \vec{v}^2\rangle\)と平均的にみなすことができ、最終的に \[\begin{equation} pV = \frac{1}{3}Nm\langle \vec{v}^2\rangle \end{equation}\] となる。今、一粒子あたりの運動エネルギーの平均値を\(\langle \epsilon_{\rm kin} \rangle = \frac{1}{2}m\langle \vec{v}^2\rangle\)とすると、 \[\begin{equation} pV = \frac{2}{3}N\langle \epsilon_{\rm kin} \rangle = NkT \end{equation}\] を得る(理想気体の状態方程式を用いた)。
以上より、 \[\begin{equation} \epsilon_{\rm kin} = \frac{3}{2}kT \end{equation}\] が平衡状態の理想気体においては成り立つことが示された。すなわち、温度に定数をかけた\(kT\)は、理想気体において一粒子の平均的な運動エネルギーを反映していることが明らかになった。
1: 温度と粒子の運動エネルギーとの関係性 \[\begin{equation} \epsilon_{\rm kin} = \frac{3}{2}kT \end{equation}\] を導け(i.e., 上記の式をもう一度自分で確認してください)。
–(10/22ここから)–
(10/15のおさらい)
理想気体において、温度と粒子の運動エネルギーとの間には、 \[\begin{equation} \epsilon_{\rm kin} = \frac{3}{2}kT \end{equation}\] という関係性が成り立つ。ただし、\(\epsilon_{\rm kin}\)とは運動エネルギーの平均である(i.e., 各粒子で異なる運動エネルギー[or 速度]をもつはずだが、すべての粒子間において平均した運動エネルギーを意味する)。重要な点は、粒子の運動エネルギーというミクロな世界の値と、温度というマクロな世界の状態量が結びつく点である。
温度は1粒子の平均的な運動エネルギーを反映していることを示した。それでは、他の状態量はどのようなことを反映しているのであろうか。特に、エネルギーについて考える。
エネルギーは物理学全般において欠かせない概念であり、熱力学においても同様である。今、系が外部に及ぼす力を\(\vec{F}_i\)、変位を\(d\vec{s}\)(縮むときは負、拡張するときは正)とすると(図1.5)、系が外部にする仕事は、 \[\begin{equation} \delta W = - \vec{F}_i\cdot d\vec{s} \end{equation}\] となる(ここではあくまで微小な仕事量を考える、また後述のように同じ仕事の量でも様々な状態の変化を反映するため、仕事は系を一意に決めるための状態量ではない。そのため、微小量を\(\delta W\)と表す)。熱力学では、系に与えられるエネルギーを正、系から奪われるエネルギーを負とする。
系に仕事をする例として、気体の圧縮を考える。とある面積\(A\)の壁、圧力\(p\)、そして外力を\(\vec{F}_a\)とする。平衡状態では、圧縮が止まっており、力が釣り合っているであろう。すなわち、平衡状態では\(\vec{F}_a = - \vec{F}_i = -pA\)である。系が外部に及ぼす仕事は、\(\delta W = - \vec{F}_i\cdot d\vec{s}\)である。ここで、系に加えられるエネルギーを正、系から奪われるエネルギーを負と想定している。すなわち、気体の圧縮ならば、\(\delta W = -\vec{F}_i\cdot d\vec{s} = pA|ds| > 0\)となる(\(ds\)は考えている方向に、面が動く距離とする[圧縮方向には負])。これは正であり、気体の圧縮により系にはエネルギーが蓄えられていることを意味する。気体の膨張ならば、\(ds > 0\)なので、\(\delta W = -\vec{F}_i\cdot d\vec{s} = -pAds < 0\)となり、系からエネルギーが奪われ外部に仕事をしていることがわかる。さらに、\(Ads\)とは気体の圧縮の場合は体積の減少分\(-dV\)を意味する。すなわち、 \[\begin{equation} \delta W = -pAds = -pdV \end{equation}\] と書くこともできる(\(p\)は示量変数、\(V\)は示強変数であることに留意)。
熱力学系に新たな粒子を加える場合を考える。粒子を加えた後も系は平衡にならなければいけない。粒子数を\(dN\)だけ変化させるために必要な仕事を \[\begin{equation} \delta W = \mu dN \end{equation}\] と書くことにする。\(\mu\)は一個あたりの粒子を加えるために必要なエネルギーであり、化学ポテンシャルと呼ばれる(示強変数である)。\(dN\)は物質の量に比例するため示量変数である。
熱力学においては、当然「熱」を扱う。この熱はエネルギーであり(熱は温度を上げるもの→温度は粒子の運動エネルギー→熱はエネルギー)、様々な性質をもつ。物質に熱を加えると温度が上昇する。このことを、 \[\begin{equation} \delta Q = C dT \end{equation}\] と書こう。\(\delta Q\)(単位はジュールとすることが多い)とは系の温度を\(dT\)上昇させるために必要な熱量であり、比例係数\(C\)を熱容量と呼ぶ。同じ熱を加えた場合、熱容量が高いものほど温まりにくいことを意味する。同様に、熱容量が高いものほど、温めるために多くの熱が必要であることを意味する。
熱容量\(C\)は示量変数である。まず温度とは1粒子あたりの平均的な運動エネルギーであることを思い出そう。イメージとしては、例えば1J加えたときに1粒子しかない場合はその粒子に熱が加えられ運動エネルギーが上昇するであろう。一方、1J加えたときに\(10^{10}\)個粒子が存在していた場合、熱はすべての粒子の運動エネルギーをそこまで上昇させることはないであろう(エネルギー保存則の観点から)。したがって。熱容量\(C\)は粒子の個数に依存する示量変数であり、示強変数としての比熱\(c\)を用いて \(C = mc\) (mは系の質量) として書き表すこともできる(示量変数ならば質量である必要はないが、ここでは便宜的にそうしている)。
比熱は外部環境に依存する(例えば体積可変の状況であれば、熱は仕事としても利用され[\(\delta W = -pdV\)より]、温度を上昇させにくくする)。しばしば利用される概念が圧力一定下の比熱である定圧比熱、体積一定下の比熱である定積比熱である(図1.11)。
前に見たように、理想気体であれば温度は粒子の平均的な運動エネルギーと一致し[\(\langle \epsilon_{\rm kin} \rangle = \frac{3}{2}kT\)]、エネルギーである熱は温度を上昇させる(その比例係数が熱容量ないしは比熱である)。つまり、比熱とは、熱エネルギーから運動エネルギーに変換する際に関わるものであり、比熱を統計的に分配された熱エネルギーを吸収する能力と考えると、粒子の自由度(個数など)により増加することが考えられる。例えば、前に述べたように示量変数を用いて\(C = mc\)と書き表すことができるであろう。
図1.11を見ると、定積比熱は、定圧比熱よりも常に大きい(縦軸の大きさが違う、もしくは例えば0Kのときの値を比べればわかる)。圧力一定のもとで熱\(\delta Q\)を加えると、その系は熱くなり、さらに一般に膨張して外部に仕事をする(外圧に抗して仕事をしてエネルギーが消費される)。つまり、熱エネルギーは一粒子あたりの平均的な運動エネルギーに変換されるだけではなく、外部への仕事にも変換されてしまう。一方、定積比熱は、定積であるため外部に仕事をすることがない。そのため、熱エネルギーから温度への変換効率が高く、\(\delta Q = C dT\)から\(\delta Q\)が一定のもと\(dT\)が大きければ\(C\)は小さくなることに起因する(定圧であれば外部に仕事をして\(dT\)が小さいため、\(C\)が大きくなる)。
加えて、気体から液体に相転移する場合、\(c_p\)、\(c_v\)は大きく変化する(図1.11)。逆に、比熱などの急激な変化から相転移を議論することも可能である(この講義で相転移を扱うのは時間的に難しそうな雰囲気…)。
–(10/29ここから)–
(10/22のおさらい)
圧力\(p\)、体積\(V\)、化学ポテンシャル\(\mu\)、粒子数\(N\)のとき、気体に行われる仕事は \[\begin{equation} \delta W = -pdV + \mu dN \end{equation}\] である。同じ仕事\(\delta W\)の値だとしても、それは体積が膨張(収縮)したのか、粒子数が増加(減少)したのか判断できない。そのため、仕事は系を一意に決める状態量ではない。
熱と温度の関係性は比例係数(熱容量)\(C\)を用いて、 \[\begin{equation} \delta Q = C dT \end{equation}\] となり、比熱\(c\)を用いて\(C = mc\)と書くこともできる。
周りから影響のない孤立系では、平衡状態に達するまで系の状態は自発的に変化していく。例えば演習にて5円玉と糸を用いて振り子の実験をした際、しばらく待てば振り子はとまる(摩擦や空気抵抗により)。この際、振り子がとまっている状態が平衡状態である。加えて、振り子は自発的に動き出すことは経験上ありえない。つまり、振り子においては、自発的に動く→止まるという流れこそあれ、自発的に止まる→動くという流れはない。このように、一方的な変化を不可逆過程と呼ぶ。さらに、平衡状態に至る状態を非平衡状態と呼び、不可逆過程は非平衡状態にて生じる。
一方、平衡状態でのみ生じる過程を可逆過程と呼ぶ。平衡状態において、十分にゆっくり状態変数を変化させるという理想化された状況ならば(系が変化する時間スケールよりもさらにゆっくり変化させる状況を想定する)、可逆過程を理想的に考えることもできるであろう。
温度が一定のもとでの気体の膨張を考える(熱浴という巨大かつ温度一定の系に囲まれた場合を考える[図1.12])。ピストンに圧力\(p_1\)、体積\(V_1\)、温度\(T = \mathrm{const.}\)の気体が封入され、外部から力\(\vec{F}_1\)が加えられている平衡状態を考える。力\(\vec{F}_1\)を取り除くことにより体積は増えて等温膨張は達成できる。これは自発的にもとに戻ることはないので、不可逆過程である。加えて、力を急速に取り除いてしまうと各々の段階での状態を把握することはできない(急激な変化により、圧力は一様にはならないため)。無重量のピストンを理想的に考えると、ピストンが得た運動エネルギーは0であり(最終的に止まるため)、不可逆な等温膨張によって行われた仕事は0であることがわかる。
一方、十分にゆっくり力を減少・増加させるならば、理想的には可逆変化を達成できるであろう。さらに僅かに減少・増加させ平衡状態まで待つことを想定しているため、各々の段階で平衡状態における議論を行うことが可能である。理想気体ならば、\(p = NkT/V\)であり、状態1(\(p_1\), \(V_1\))から状態2(\(p_2\)、\(V_2\))に可逆変化させた場合の仕事は、 \[\begin{equation} \int_1^2 dW = -\int_{V_1}^{V_2}pdV = -\int_{V_1}^{V_2}\frac{NkT}{V}dV = -NkT\ln \frac{V_2}{V_1} \end{equation}\] となる。等温膨張を考える場合は、\(V_2 > V_1\)であるため、仕事は負であり、すなわち外部に対して(外力に対して)仕事を行っており[系に蓄えられる仕事を正、外部に行う仕事を負としている]、この仕事を系から取り出すことができると考えられる。これは不可逆過程とは大きく異なることに注意。さらに、十分にゆっくり行った変化である可逆過程よりも大きな仕事を取り出すことはできない(理由は様々だが、粒子間の距離は十分大きいまま十分にゆっくり変化させる状況を想定しており、ポテンシャルエネルギーに変換されなかったりするためであろう)。
上記の過程が可逆であることを確かめる。状態2から状態1に戻すために必要な仕事は、 \[\begin{equation} \int_2^1 dW = -\int_{V_2}^{V_1}pdV = -\int_{V_2}^{V_1}\frac{NkT}{V}dV = -NkT\ln \frac{V_1}{V_2} \end{equation}\] であり、この仕事は正。状態1から2に変化させるために必要な仕事と、状態2から1に変化させるために必要な仕事を足せば0になることから、可逆であることがわかる。
上記より、等温膨張において、状態1から状態2へと変化する際に、不可逆過程と可逆過程のどちらも存在することがわかる。すなわち、最初や最終の状態のみではなく、途中の過程にも依存する。上記の不可逆過程では、仕事は0である。最初の平衡状態も仕事は0、最終状態も仕事は0、すなわち、仕事では系の状態を一意に決めることはできない。同様に熱もまた、系の状態を一意に決めることはできない(上記の例では、\(\ln \frac{V_1}{V_2}\)と値が等しい状態3(\(p_3, V_3\))、状態4(\(p_4, V_4\))を考えれば系の状態を一意に決めることはできないであろう)。すなわち、だいぶ前に述べた状態量=系を曖昧なく決める量という定義に照らし合わせると、仕事も熱も状態量ではないことがわかる。これは数学的には、仕事も熱も完全微分(全微分)ではないことを意味する。
完全微分とは、例えば\(U = U(x,y)\)として与えられたとき、 \[\begin{equation} dU = \frac{\partial U}{\partial x}dx + \frac{\partial U}{\partial y}dy \end{equation}\] として微小変化が記述できることを意味する。例えば後述のように、 \[\begin{equation} dU = yx dx + x^2 dy \end{equation}\] は完全微分ではない。一方、 \[\begin{equation} dU = y dx + x dy \end{equation}\] は完全微分である。
状態量(\(T,p\)など)の関数として、他の状態量を表したものを状態関数という。経験から状態を一意的に決めるために必要な状態量の数は、その系が吸収または放出できるエネルギーの種類による。例えばエネルギーが熱\(\delta Q\)、力学的仕事\(\delta W_{\rm mech}\)、化学エネルギー\(\delta W_{\rm chem}\)(例えば一粒子加えるために必要なエネルギー)の3種類であれば、状態変数\(T\)、\(V\)、\(N\)に依存し、これら3つの状態量を決めれば他の状態量も決まる。
例えば \[\begin{equation} z = f(x, y) \end{equation}\] のような、2つの状態変数\(x, y\)の関数を考える。状態変数の値のみに依存し、それが得られた方法(過程)には依らないのが状態量、すなわち状態関数の特徴である。状態変数を可逆に\(x\)と\(y\)から\(dx\)と\(dy\)だけ変化させると、\(z\)の変化分は、 \[\begin{equation} dz = \frac{\partial f}{\partial x}|_{y}dx + \frac{\partial f}{\partial y}|_{x}dy \end{equation}\] となる。どの変数を固定するかは注意が必要なことが多い。なぜならば、熱力学においては、\(x\)と\(y\)は独立ではなく、熱力学の法則によって関係しているいこともある。
ここでは、状態関数 \[\begin{equation} z = f(x, y) \end{equation}\] とその微分形式 \[\begin{equation} dz = df = \frac{\partial f}{\partial x}|_{y}dx + \frac{\partial f}{\partial y}|_{x}dy \end{equation}\] を考える。\(f\)は何回でも微分可能かつなめらかな関数とする。全微分形式は \[\begin{equation} dz = df(\vec{x}) = \nabla f(\vec{x}) \cdot d\vec{x} \end{equation}\] と書き表すこともできる。熱力学では、全微分形式を任意の経路\(C\)に沿った線積分を行い、もとの状態関数を \[\begin{equation} f(\vec{x}) - f_0(\vec{x}_0) = \int_C \nabla f(\vec{x})\cdot d\vec{x} \end{equation}\] として求めることが重要(曲線Cは、\(\vec{x}_0^T = (x_0, y_0)\)から\(\vec{x}^T = (x, y)\)に至る)。補助変数\(t\)を用いると、 \[\begin{equation} f(\vec{x}) - f_0(\vec{x}_0) = \int_0^1 \nabla f(\vec{x}(t))\cdot \frac{d\vec{x}(t)}{dt} dt \end{equation}\] と書くことができる。右辺の積分が経路\(C\)に依存しない条件を考えてみる。これは古典力学でならったように(?)力が\(\vec{F} = - \nabla V(\vec{r})\)として書き表せるとき、(古典力学の意味での)仕事は全微分となる。数学的には、このようなポテンシャルが存在することが上記の積分が経路に依存しない条件となる。任意の微分形式\(F(\vec{x}) \cdot d\vec{x}\)において、\(\vec{F}(\vec{x}) = \nabla f(\vec{x})\)となるポテンシャル\(f(\vec{x})\)が存在するならば、この微分は完全微分ないしは全微分という(前述の完全微分の定義と同様のことを述べている)。
ポテンシャルが存在するかどうか( = 積分\(\int_C \nabla f(\vec{x})\cdot d\vec{x}\)が経路に依存しないかどうか)を検証する基準は、古典力学にて知られている通り、 \[\begin{equation} \nabla \times \vec{F} = \vec{0} \end{equation}\] である。\(\times\)は外積を意味する。ポテンシャルが存在するならば、\(\vec{F} = \nabla f(\vec{x})\)と書くことができ、事実、上記の外積は、 \[\begin{equation} \frac{\partial F_y}{\partial z} - \frac{\partial F_z}{\partial y} = \frac{\partial^2 f}{\partial y \partial z} - \frac{\partial^2 f}{\partial y \partial z} = 0 \end{equation}\] など、\(\vec{0}\)になる。
–(11/05ここから)–
(10/29のおさらい)
ひたすらにゆっくり変化させ、ゆっくりと元の状態に戻ることができる変化を可逆過程と呼ぶ。急な変化により元に戻れない変化を不可逆過程と呼ぶ。
系を一意に決めることができる変数を状態量と呼ぶ(圧力、体積、粒子数、温度 [\(pV = NkT\) にでてくる変数たち]、化学ポテンシャル\(\mu\))。熱、仕事は状態量ではない(熱は\(\delta Q = CdT\)より温度の変化のみしか記述できない、仕事は\(\delta W = -pdV + \mu dN\)より何が変化したかを記述できない)。熱も仕事も完全微分ではない[=積分値が経路に依存する]ことを意味する。一方、状態量は元に戻せる変化が存在することを想定するため、完全微分である[=積分値が経路に依存しない]。
完全微分系であれば、状態関数\(U\)の微小変化は状態量\(x,y\)を用いて \[\begin{equation} dU(x,y) = \frac{\partial U}{\partial x}dx + \frac{\partial U}{\partial y}dy \end{equation}\] を満たす。完全微分系であれば積分値が積分経路に依存しないことを示す。(以下、簡略な説明[参照: https://physnotes.jp/diffeq/ede/]) まず\(\frac{\partial U}{\partial x}\)を\(x\)について積分すると、経路に依存せず \[\begin{equation} U(x,y) = \int \frac{\partial U}{\partial x} dx + C(y) \end{equation}\] を得る。一方、 \[\begin{equation} \frac{\partial U}{\partial y} = \frac{\partial}{\partial y} \left( \int \frac{\partial U}{\partial x} dx\right) + \frac{\partial C(y)}{\partial y} \end{equation}\] であり、ここから \[\begin{equation} \frac{\partial C(y)}{\partial y} = \frac{\partial U}{\partial y} - \frac{\partial}{\partial y} \left( \int \frac{\partial U}{\partial x} dx\right) \end{equation}\] を満たす関数\(C(y)\)が存在すれば、\(U(x,y)\)を決めることができる。\(C(y)\)は\(x\)に依存しない関数である必要があるため、右辺もまた\(x\)に依存しない必要がある。すなわち\(x\)で微分したときに\(0\)になる必要があり、 \[\begin{equation} \frac{\partial}{\partial x}\left[ \frac{\partial U}{\partial y} - \frac{\partial}{\partial y} \left( \int \frac{\partial U}{\partial x} dx\right) \right]= 0 \end{equation}\] であれば\(U(x,y)\)を決めることができる。事実この式は成立しており、積分経路に依存せず線積分が可能であることがわかる。
一方、 \[\begin{equation} dU(x,y) = P(x,y)dx + Q(x,y)dy \end{equation}\] として完全微分系であるか定かでない条件において、上記と同様の議論を行うと、 \[\begin{equation} \frac{\partial}{\partial x}\left[ Q(x,y) - \frac{\partial}{\partial y} \left( \int P(x,y) dx\right) \right]= 0 \end{equation}\] が積分経路に依存せずに\(U(x,y\)が定まる条件である。すなわち、 \[\begin{equation} \frac{\partial Q(x,y)}{\partial x} = \frac{\partial P(x,y)}{\partial y} \end{equation}\] が条件であり、これはすなわち、 \[\begin{equation} P(x,y) = \frac{\partial U}{\partial x} \end{equation}\] \[\begin{equation} Q(x,y) = \frac{\partial U}{\partial y} \end{equation}\] として完全微分系を意味する。これは、\(\vec{F} = (\frac{\partial U}{\partial x}, \frac{\partial U}{\partial y})\)にポテンシャルが存在することと同義である。つまり、\(dU = \vec{F} \cdot d\vec{x}\)であるとき、\(\vec{F}\)にポテンシャルが存在するならば、\(\int_C dU\)は積分経路に依存しないことを意味する。
重要なことは、熱力学では超絶ゆっくり変化させて元に戻せる(=線積分が経路に依存しない)可逆過程を考える。線積分が経路に依存しないためには、微小変化が完全微分で書くことができる必要がある。
例1.4 微分形式の簡単な例
微分形式 \[\begin{equation} \vec{F}\cdot d\vec{x} = yx dx + x^2 dy \end{equation}\] を考える。\(\vec{F}\)にポテンシャルが存在する条件は、\(\frac{\partial yx}{\partial y} - \frac{\partial x^2}{\partial x}\)が0になることであるが、\(\frac{\partial yx}{\partial y} - \frac{\partial x^2}{\partial x} = -x\)より、\(\vec{F}\)にポテンシャルは存在しない。
微分形式 \[\begin{equation} \vec{F}\cdot d\vec{x} = y dx + x dy \end{equation}\] を考える。\(\vec{F}\)にポテンシャルが存在する条件は、\(\frac{\partial y}{\partial y} - \frac{\partial x}{\partial x}\)が0になることであり、\(\frac{\partial y}{\partial y} - \frac{\partial x}{\partial x} = 0\)より、\(\vec{F}\)にポテンシャルが存在することがわかる。このとき、全微分が\(\vec{F}\cdot d\vec{x} = y dx + x dy\)で与えられるポテンシャル\(f(x,y)\)を計算可能である。積分路をひとまず\(C_1 =\begin{pmatrix} x_0 + t(x - x_0) \\ y_0 + t(y - y_0) \end{pmatrix}\)として考えてみる(t $、積分路には依存しないことも後で確かめてみる)。
\[\begin{eqnarray} f(\vec{x}) - f_0(\vec{x}_0) &=& \int_C \nabla f(\vec{x})\cdot d\vec{x} \nonumber\\ &=& \int_C ydx + xdy \nonumber\\ &=& \int_0^1 y(t) \frac{dx(t)}{dt} + x(t) \frac{dy(t)}{dt} dt \nonumber\\ &=& \int_0^1 [y_0 + t(y - y_0)][(x - x_0)] + [x_0 + t(x - x_0)][(y - y_0)] dt \nonumber\\ &=& y_0(x - x_0) + x_0(y - y_0) + (x - x_0)(y - y_0) \nonumber\\ &=& xy - x_0y_0 \end{eqnarray}\] となる。事実、\(\frac{\partial f(\vec{x})}{\partial x} = y\)、\(\frac{\partial f(\vec{x})}{\partial y} = x\)。
経路に依存しないことを確かめる。図1.14の経路\(C_2\)に沿って計算する。第1に、\(y = y_0\)、\(x = x_0 + t\)に沿って計算する (\(t \in [x_0, x]\))。 \[\begin{eqnarray} \int_C \nabla f(\vec{x})\cdot d\vec{x} &=& \int_C ydx + xdy \nonumber\\ &=& \int_{x_0}^x y_0 \frac{dx(t)}{dt} dt \nonumber\\ &=& xy_0 - x_0y_0 \end{eqnarray}\]
第2に、\(y = t\)、\(x = x\)に沿って計算する (\(t \in [y_0, y]\))。 \[\begin{eqnarray} \int_C \nabla f(\vec{x})\cdot d\vec{x} &=& \int_C ydx + xdy \nonumber\\ &=& \int_{y_0}^y x dt \nonumber\\ &=& xy - xy_0 \end{eqnarray}\] 第1の経路、第二の経路における積分値を足して、\(f(\vec{x}) - f_0(\vec{x}_0) = xy - x_0y_0\)。確かに、経路に依らない積分値を得ることが確認できる。
完全でない微分形式\(\vec{F}\cdot d\vec{x}\)に関数\(g(\vec{x})\)をかけて完全な微分形式となるとき、\(g(\vec{x})\)を積分因子と呼ぶ。 微分形式 \[\begin{equation} \vec{F}\cdot d\vec{x} = yx dx + x^2 dy \end{equation}\] を考える。これは先程みたように、完全な微分形式ではない。関数\(g(x, y)\)をかけて、 \[\begin{equation} g\vec{F}\cdot d\vec{x} = g(x, y)yx dx + g(x, y)x^2 dy \end{equation}\] が完全な微分形式となる条件は、 \[\begin{equation} \frac{\partial g(x, y)x^2}{\partial x} - \frac{\partial g(x, y)xy}{\partial y} = 0 \end{equation}\] である。計算していくと、 \[\begin{equation} g_xx^2 + 2gx - g_yxy - gx = x(g_xx + 2g - g_yy - g) = 0 \end{equation}\] これをみたす関数が1つでも見つかれば良いので、因数分解できる形\(g(x, y) = g_1(x)g_2(y)\)を想定してみる。すると、 \[\begin{equation} xg_1g_2(\frac{g_1'}{g_1}x + 1 - \frac{g_2'}{g_2}y) = 0 \end{equation}\] となり、\(\frac{g_1'}{g_1}x + 1 = C\) (\(C\)は定数、つまり、\(\ln g_1(x) = (C-1)\ln x + K_1\) [\(K_1\)は定数]) かつ\(\frac{g_2'}{g_2}y = C\) (つまり、\(\ln g_2(y) = C\ln y + K_2\) [\(K_2\)は定数])。最終的に、積分因子の一つとして、 \[\begin{equation} g(x, y) = K x^{C-1}y^C \end{equation}\] が得られた(\(K = \exp(K_1 + K_2)\))。例えば\(C = 0\)とすれば、\(g\vec{F}\cdot d\vec{x} = y dx + x dy\)となり、これが完全な微分形式であることは前に見たとおりである。
1: (教科書p.29) 問題1.1を解け。