この講義で使用する教科書は、丸善出版の熱力学・統計力学です。この講義が始まり4年目ですが、教科書はまだ模索中です。言い訳にはなりますが、熱力学、統計力学は本来別々に1期ないしは1年通じて学ぶ必要のあるものです。なぜか本学では1期で熱力学・統計力学両方学ぶカリキュラムになっておりますので、大分無理があることをしているとご承知おきください。基本は大部分が熱力学、統計力学とのつながりを少々説明する、くらいのイメージです。
統計力学とは、微視的なミクロな状態を記述する枠組みから、巨視的なマクロな状態を記述することを目指す分野です。具体例として、気体1粒子は運動量
\(mv\)
を有するという想定をしてみましょう(\(m\)は質量、\(v\)は速度、ミクロな式)。この粒子が想像を絶するくらい多数集まったとき(粒子数\(N\)の無限大への極限を考えたとき)、何がおこるでしょうか?運動量の合計が\(Nmv\)になるだけでしょうか?
驚くべきことに、粒子が大多数集まった気体全体として、\(pV = NkT\) (\(p\)は圧力、\(V\)は体積、\(N\)は粒子数、\(k\)はボルツマンの比例係数、\(T\)は温度) というマクロな式が導かれます
(詳しくは後々触れていきます)。運動量のみを考えていては想像がつかない式です。
このように、ミクロなレベルの1つ1つの粒子と、それが大多数集まったマクロな系の関係性を導くことが統計力学の主目的です。
一方、熱力学とは、ミクロな系のことはあまり考えず、巨視的なマクロな系を記述することを目指す分野です。例えば上記の例では
\(pV = nRT\)
という式から出発して、気体の性質はどのようなものがあるかを理解していく分野になります。1つ1つの粒子のことは基本考えません。
熱力学・統計力学、どちらも実験と理論、双方から理解を進めていく分野になります。実験から導かれた法則に基づき理論展開、その理論を実験的に実証…という流れです。
本講義資料はRMarkdownを利用して作成していく予定です。RMarkdownの仕様上、htmlのアップロードが標準仕様であり、無理やりpdfに変換した資料もアップロードします。
熱力学系は、巨視的な量 = 状態量 (例えば、エネルギー\(E\)、体積\(V\)、粒子数\(N\)、エントロピー\(S\)、温度\(T\)、圧力\(p\)、化学ポテンシャル\(\mu\)
[1粒子増やす・減らすために必要なエネルギー])、
により曖昧さなしに定義される系である。
状態量は 1)
示量状態量(系全体の量が、部分系の和に等しくなるもの[相加性あり]、例えばエネルギー\(E\)、体積\(V\)、エントロピー\(S\)[後々でてきます]、粒子数\(N\)) と 2)
示強状態量(系全体の量が、部分系の和に等しくないもの[相加性ない]、圧力\(p\)、温度\(T\)、化学ポテンシャル\(\mu\)) に分類できる。例えば体積\(V_1\)の系1と体積\(V_2\)の系を合わせた系の体積\(V\)は\(V = V_1 +
V_2\)であり、体積は示量変数。一方、温度\(T_1\)をもつ系1と温度\(T_2\)をもつ系2を合わせた系の温度は、足し算したものにはならない(温度90度のお湯と10度の水を混ぜて100度にならない)。
示量状態量と示強状態量、名前はさておきにして、後々慣れてきます。理由としては、この講義の後半において以下の式がこれでもか、というほど出てくるからです。理想気体の内部エネルギーを\(U\)としましょう[理想気体とは、気体を構成する粒子間の距離が十分に大きく、粒子間距離による相互作用を無視できる気体のモデルを意味します]。この微小変化は、
\[\begin{equation}
dU = -pdV + TdS + \mu dN + ...
\end{equation}\]
という形で書き表すことができます(後々学びますので、詳細は省きます)。例えば、\(z = z(x,y)\)とすると、その全微分は\(dz = \frac{\partial z}{\partial x}dx +
\frac{\partial z}{\partial
y}dy\)です。この式を対応させると、理想気体の内部エネルギーは、
\[\begin{equation}
U = U(V, S, N, ...)
\end{equation}\]
とかけ、示量状態量の関数としてかくことができます。さらに、 \[\begin{equation}
-p = \frac{\partial U}{\partial V}, \ T = \frac{\partial U}{\partial S},
\ \mu = \frac{\partial U}{\partial N}
\end{equation}\]
と書くこともできます。これらは示強状態量です。これらの式も後々学んでいくことになりますので、状態量は2種類あり、加法性がなりたつかどうかくらいの認識でも大丈夫だと思います。
また、この講義では下記のような計算が度々現れます。おそらく次週学ぶと思いますが、理想気体の内部エネルギーは、
\[\begin{equation}
U = \frac{3}{2}NkT
\end{equation}\] です(\(k\)は定数)。いま、粒子数を一定もしくは粒子数の変化は温度の変化よりも無視できるほど小さいと仮定すると、内部エネルギーの微小変化は
\[\begin{equation}
dU = \frac{3}{2}NkdT
\end{equation}\]
となります。先程の式から、エントロピー、温度が一定だとすると、 \[\begin{equation}
dU = \frac{3}{2}NkdT = -pdV
\end{equation}\] となります。
さて、今日学ぶ内容は、理想気体の状態方程式\(pV = NkT\)です。これを代入すると、 \[\begin{equation}
dU = \frac{3}{2}NkdT = -NkT \frac{dV}{V}
\end{equation}\] となり、式をまとめると、 \[\begin{equation}
\frac{3}{2}\frac{dT}{T} = - \frac{dV}{V}
\end{equation}\] となります。今、温度\(T\)と体積\(V\)を、\((T_0,
V_0)\)から、\((T,
V)\)まで想像を絶するくらいゆっくり変化させ、その変化を足し算するとしましょう。すると、その変化の総和は、
\[\begin{equation}
\frac{3}{2}\int_{T_0}^T\frac{dT}{T} = - \int_{V_0}^V\frac{dV}{V}
\end{equation}\] となります。積分すると、 \[\begin{equation}
\frac{3}{2}\ln \frac{T}{T_0} = - \ln \frac{V}{V_0}
\end{equation}\] まとめると、 \[\begin{equation}
\frac{T}{T_0} = \left(\frac{V_0}{V}\right)^{2/3}
\end{equation}\]
などの関係式を得ることができます(この資料で後述する式と異なりますが、この式では圧力は可変、後述する式では圧力は一定としてますので、状況が異なる点に留意してください)。
2つの物体の温度が等しいことが、これらの物体間で熱平衡が成り立つための条件である。熱力学における状態量は、平衡状態において定義され観測される量である。平衡状態とは、巨視的な状態量がこれ以上変化しないほど長時間たった後に自然に行きつく先として定義できる。
1つの系と熱平衡状態にある系はすべて互いにまた熱平衡状態にある。この経験的な事実を熱力学第0法則とよぶ。つまり、熱平衡状態にある系は互いに共通な示強変数をもつ。この示強変数を温度とよぶ(温度は計測可能なものとする)。温度とは何か?という問いに対して、理想的な条件下では、温度は粒子の平均運動エネルギーであることを後述する。
(教科書図1.1、1.2参照) 圧力と粒子数を一定にした希薄な気体の体積\(V\)を用いて、熱力学的温度\(T\)を、 \[\begin{equation}
T = T_0 \frac{V}{V_0}
\end{equation}\] と定義する。ただし、\(V_0\)、\(T_0\)は大気圧下の標準体積、基準温度である。氷の融点を\(273.15K\)と決めるのが一般的。
理想気体 =
原子を相互作用しない質点として記述する。理想化された模型ではあるが、多くの洞察をもたらす。希薄な気体はおおよそ理想気体であると想定できる。理想気体では、実験的に以下の性質が知られている(図1.3)。
\[\begin{equation}
pV = p_0V_0
\end{equation}\] ただし、温度\(T\)は一定とする。
同様に、以下の性質も実験的に発見されている。 \[\begin{equation}
V = \frac{T}{T_0}V_0
\end{equation}\] ただし、圧力\(p\)は一定とする。
上記の式を考察していく。任意に選んだ状態\((p_0, V_0, T_0)\)から最終状態\((p, V,
T)\)に徐々に近づけていくことを想定する。第一に、\(T\)を一定として圧力を\(p\)に変化させる。すると、 \[\begin{equation}
pV_0' = p_0V_0
\end{equation}\] が成り立つ(\(T_0 =
\mathrm{const.}\))。ついで、\(p =
\mathrm{const.}\)として、温度を変えていくと、 \[\begin{equation}
V = \frac{T}{T_0}V_0'
\end{equation}\] が成り立つ。第一の式から \(V_0' = \frac{p_0}{p}V_0\)
を得、第二の式に代入すると、 \[\begin{equation}
\frac{pV}{T} = \frac{p_0V_0}{T_0}
\end{equation}\] が得られる。
\(p\)、\(T\)は示強変数(相加性なし)、\(V\)は示量変数(相加性あり)であった。したがって、\(\frac{pV}{T}\)は何かしらの示量変数(相加性あり)と比例するものと期待できる。ここでは物質の量\(N\)に比例して増加すると予想する(\(N\)もまた示量変数(相加性あり))。すなわち、
\[\begin{equation}
\frac{pV}{T} = Nk
\end{equation}\] もしくは \[\begin{equation}
pV = NkT
\end{equation}\]
が成り立つであろう。これは理想気体の法則とよばれ、今後しばしば利用する状態方程式(状態を記述する方程式)である。状態方程式は、実験的に確かめられており、今後しばしば用いる重要なものである。
NOTE:
あくまで理想的な状況を想定した方程式であるものの、広く深い洞察を与えてくれるため、用いる。
(おさらい[昨年度記入したもの。参考になるかもしれないので、一応消さない])
(Wikipediaより)示量状態量は、「系全体の量が部分系の量の和に等しくなること」という性質をもつ。容器を可動性の壁により2つの部分に分ける(部分1は粒子数\(N_1\)、体積\(V_1\)、圧力\(p_1\)、温度\(T_1\)、部分2は粒子数\(N_2\)、体積\(V_2\)、圧力\(p_2\)、温度\(T_2\)という状態量をもつとする)。容器全体の粒子数は\(N = N_1 + N_2\)、容器全体の体積は\(V = V_1 + V_2\)となり、粒子数と体積は「系全体の量が部分系の量の和に等しくなること」という性質をもつ。一方、壁が動かない状態が平衡状態であるため、\(|p_1| = |p_2|\)であり、容器全体の圧力\(|p|\)は、\(|p| \neq |p_1| + |p_2|\)であることは想像に難くない。温度も同様。このように、「系全体の量が部分系の量の和に等しくなること」という性質をもつ状態量は示量状態量、「系全体の量が部分系の量の和に等しくなること」という性質をもたない状態量は示強状態量である。
平衡状態とは、巨視的な状態量がこれ以上変化しないほど長時間たった後に自然に行きつく先として定義できる。
粒子間の距離が大きい、希薄な気体を理想気体という(粒子同士の位置によるポテンシャルエネルギーはないものと想定する)。理想気体は、圧力\(p\)、体積\(V\)、粒子数\(N\)、定数\(k\)、温度\(T\)をもちいて、状態方程式 \[\begin{equation} pV = NkT \end{equation}\] をみたす。
温度は温度計で測ることができる日常的なものである、と感じるであろう。それでは、温度とその他の物理量との関係性は何であろうか?(言い換えるならば、温度とは何か?という問題である)。ここでは、平衡状態の理想気体の温度
=
粒子の平均運動エネルギーであることを示す。気体の各粒子の速度ベクトルを\(\vec{v}\)とする。これは時間的に変化するものであるものの、平衡状態ではある速度範囲\(d^3\vec{v}\)には、時間平均的には同じ数の粒子が存在するものと想定できる(平衡状態に達した後、1秒後も2秒後も1000秒後も平均的には同じだとみなせるため)。どの速度範囲に属する粒子が最も多いのか、という問いを考えるには速度分布\(f(\vec{v})\)を考える必要があるが、とりあえずそれはおいておく(教科書例1.2参照)。
確率分布の知識をおさらいしておくと、確率変数\(z\)が\(z \in (x,
x + d x]\)に含まれる確率が\(f(x)dx\)として定義される。加えて、\(f(x) \ge 0\)かつ確率変数の定義域\(D\)において積分すると\(\int_D f(x)dx = 1\)である。
つまり、ある1粒子が速度\(\vec{v}\)周りの微小範囲に含まれる確率は\(f(\vec{v})d^3\vec{v}\)(速度ベクトルは3次元なので微小な立方体を考える)であるため、速度\(\vec{v}\)周りの微小範囲に含まれる平均的な粒子数\(dN\)は \[\begin{equation}
dN = Nf(\vec{v})d^3\vec{v}
\end{equation}\] である(例えば、\(\vec{v} = (1, 0,
0)\)、1粒子がこの速度ベクトルをもつ確率が\(f(\vec{v})d^3\vec{v} =
0.0001\)、粒子数が\(N =
10000\)とすると、おおよそ\(1\)個の粒子が速度ベクトル\(\vec{v} = (1, 0,
0)\)をもつと期待できる)。もしくは \[\begin{equation}
f(\vec{v}) = \frac{1}{N}\frac{dN}{d^3\vec{v}}
\end{equation}\] となる。
以降、とある容器に入った気体を考える。容器の壁には圧力が生じる。圧力は、単位が\(N/m^2\)であるように、平面の単位面積当たりにかかる力を意味する。ここでの圧力は粒子が壁にあたり跳ね返る際に生じる力であろう。
(図1.4参照)弾性衝突かつ\(z\)方向のみを想定すると、\(v_z\)にて壁にあたった粒子は速度が\(-v_z\)に変化するため、運動量\(2mv_z\)を壁に与える(\(m\)は粒子の質量)。
速度\(\vec{v}\)をもつ粒子の数は、平均的には\(Nf(\vec{v})d^3\vec{v}\)である。速度\(v_z\)をもち、微小時間\(dt\)内に壁にあたる粒子は\(z\)方向に距離\(v_zdt\)以内に存在する。\(x\), \(y\)方向にはどのような速度でもよいので、衝突する壁の面積を\(A\)とすると、速度\(v_z\)をもち体積\(Av_zdt\)に含まれる粒子が時間\(dt\)内に壁に衝突する。考えている容器の体積を\(V\)とすると、速度\(v_z\)をもち、今想定している壁にぶつかる粒子数の割合は\(\frac{Av_zdt}{V}\)
(平衡状態では、容器内にまんべんなく粒子が存在している)。さらに速度\(\vec{v}\)をもつ粒子の数は(\(z\)方向には\(v_z\))、平均的には\(Nf(\vec{v})d^3\vec{v}\)であるため、速度\(v_z\)をもち、壁にぶつかる粒子数は、平均的には\(Nf(\vec{v})\frac{Av_zdt}{V}d^3\vec{v}\)
(速度ベクトル\(\vec{v}\)をもつ粒子の内、体積\(Av_zdt\)に含まれる粒子のみが壁にぶつかる)。
つまり、速度\(\vec{v}\)をもつ粒子のうち、平均的には\(Nf(\vec{v})\frac{Av_zdt}{V}d^3\vec{v}\)個の粒子が壁に運動量を与える。例えば壁をいくつかの2次元グリッドに分けたとして、各領域が受ける力積は一定ではないため、力積を全壁領域で積分したもの\(\langle \int dF_A \rangle
dt\)を考える。力積は運動量の変化\(2mv_z
\times N f(v_z)\frac{Av_zdt}{V}
d^3\vec{v}\)と等しい。ここで、\(\vec{v}\)は様々な値が存在するため、条件を満たす[=壁に当たる]、すべての場合について考える。すべての場合について考慮するには、周辺化が有効であり(統計・機械学習でしばしば利用する用語)、すべての場合の数について積分する(離散値の場合は足し算)。すると、
\[\begin{equation}
\left(\int dF_A\right)dt = \int 2mv_z \times
N f(\vec{v})\frac{Av_zdt}{V} d^3\vec{v}
\end{equation}\] が成り立つと考えられる。両辺から\(dt\)を除くと、 \[\begin{equation}
p = \frac{1}{A}\int dF_A = \int 2mv_z \times N f(\vec{v})\frac{v_z}{V}
d^3\vec{v}
\end{equation}\]
となる(圧力は単位面積当たりに受ける力である(\(p = \frac{1}{A}\int
dF_A\)))。壁に衝突するには壁に向かって動く粒子のみを考えること(この条件を満たす速度を\(v_z >
0\)と定義しよう)を踏まえて計算を進めると、 \[\begin{equation}
p = \frac{N}{V} \int_{-\infty}^{\infty}dv_x \int_{-\infty}^{\infty}dv_y
\int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z
\end{equation}\] となり、式を書き直すと、 \[\begin{equation}
pV = N \int_{-\infty}^{\infty}dv_x \int_{-\infty}^{\infty}dv_y
\int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z
\end{equation}\] となる。いま、平衡状態を想定しているため、\(v_z\)の値はまんべんなく観測できるはずである。つまり、\(\int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z =
\int_{-\infty}^{\infty} mv_z^2 f(\vec{v})
dv_z\)であろう。加えて、平衡状態であれば\(x\), \(y\), \(z\)方向の速度もまんべんなく観測できるであろう。つまり、平均的な\(v_z^2\) (ここでは\(\langle v_z^2 \rangle = \int_{-\infty}^{\infty}
v_z^2 f(v_z) dv_z\)とする) は、\(v_x^2\)とも\(v_y^2\)とも等しいであろう。つまり、 \[\begin{equation}
\int_{-\infty}^{\infty}dv_x \int_{-\infty}^{\infty}dv_y
\int_{0}^{\infty} 2mv_z^2 f(\vec{v}) dv_z = m \langle v_z^2 \rangle = m
\langle v_x^2 \rangle = m \langle v_y^2 \rangle
\end{equation}\]
であろう。速度ベクトルのノルムの2乗の平均を\(\langle \vec{v}^2\rangle\)とすると、\(x\), \(y\), \(z\)方向は平衡状態であれば無相関であると想定できるはずなので、\(\langle \vec{v}^2\rangle = \langle v_x^2\rangle +
\langle v_y^2\rangle + \langle
v_z^2\rangle\)となるであろう。すなわち、\(\langle v_z^2\rangle = \frac{1}{3}\langle
\vec{v}^2\rangle\)と平均的にみなすことができ、最終的に \[\begin{equation}
pV = \frac{1}{3}Nm\langle \vec{v}^2\rangle
\end{equation}\]
となる。今、一粒子あたりの運動エネルギーの平均値を\(\langle \epsilon_{\rm kin} \rangle =
\frac{1}{2}m\langle \vec{v}^2\rangle\)とすると、 \[\begin{equation}
pV = \frac{2}{3}N\langle \epsilon_{\rm kin} \rangle = NkT
\end{equation}\] を得る(理想気体の状態方程式を用いた)。
以上より、 \[\begin{equation}
\epsilon_{\rm kin} = \frac{3}{2}kT
\end{equation}\]
が平衡状態の理想気体においては成り立つことが示された。すなわち、温度に定数をかけた\(kT\)は、理想気体において一粒子の平均的な運動エネルギーを反映していることが明らかになった。
1: 温度と粒子の運動エネルギーとの関係性 \[\begin{equation} \epsilon_{\rm kin} = \frac{3}{2}kT \end{equation}\] を導け(i.e., 上記の式をもう一度自分で確認してください)。
(おさらい)
理想気体において、温度と粒子の平均的な運動エネルギーとの間には、
\[\begin{equation}
\epsilon_{\rm kin} = \frac{3}{2}kT
\end{equation}\] という関係性が成り立つ。ただし、\(\epsilon_{\rm
kin}\)とは運動エネルギーの平均である(i.e.,
各粒子で異なる運動エネルギー[or
速度]をもつはずだが、すべての粒子間において平均した運動エネルギーを意味する)。重要な点は、粒子の運動エネルギーというミクロな世界の値と、温度というマクロな世界の状態量が結びつく点である。
(2週間前の内容?) 熱力学系は、巨視的な量 = 状態量
(例えば、エネルギー\(E\)、体積\(V\)、粒子数\(N\)、エントロピー\(S\)、温度\(T\)、圧力\(p\))、
により曖昧さなしに定義される系である。状態量は系の状態を一意に決めるために必要な変数。
*****
温度は1粒子の平均的な運動エネルギーを反映していることを示した。それでは、他の状態量はどのようなことを反映しているのであろうか。特に、エネルギーについて考える。
エネルギーは物理学全般において欠かせない概念であり、熱力学においても同様である。今、系が外部に及ぼす力を\(\vec{F}_i\)、変位を\(d\vec{s}\)(縮むときは負、拡張するときは正)とすると(図1.5)、系が外部にする仕事は、
\[\begin{equation}
\delta W = - \vec{F}_i\cdot d\vec{s}
\end{equation}\]
となる(ここではあくまで微小な仕事量を考える、また後述のように同じ仕事の量でも様々な状態の変化を反映するため、仕事は系を一意に決めるための状態量ではない。そのため、微小量を\(\delta
W\)と表す)。熱力学では、系に与えられるエネルギーを正(外から仕事をされた場合、正)、系から奪われるエネルギーを負とする(外に仕事をする場合、負)。
系に仕事をする例として、気体の圧縮を考える。とある面積\(A\)の壁、圧力\(p\)、そして外力を\(\vec{F}_a\)とする。平衡状態では、圧縮が止まっており、力が釣り合っているであろう。すなわち、平衡状態では\(\vec{F}_a = - \vec{F}_i =
-pA\)である。系が外部に及ぼす仕事は、\(\delta W = - \vec{F}_i\cdot
d\vec{s}\)である。ここで、系に加えられるエネルギーを正、系から奪われるエネルギーを負と想定している。すなわち、気体の圧縮ならば、\(\delta W = -\vec{F}_i\cdot d\vec{s} = pA|ds| >
0\)となる(\(ds\)は考えている方向に、面が動く距離とする[圧縮方向には負])。これは正であり、気体の圧縮により系にはエネルギーが蓄えられていることを意味する。気体の膨張ならば、\(ds > 0\)なので、\(\delta W = -\vec{F}_i\cdot d\vec{s} = -pAds <
0\)となり、系からエネルギーが奪われ外部に仕事をしていることがわかる。さらに、\(Ads\)とは気体の圧縮の場合は体積の減少分\(-dV\)を意味する。すなわち、 \[\begin{equation}
\delta W = -pAds = -pdV
\end{equation}\] と書くこともできる(\(p\)は示量変数、\(V\)は示強変数であることに留意)。
熱力学系に新たな粒子を加える場合を考える。粒子を加えた後も系は平衡にならなければいけない。粒子数を\(dN\)だけ変化させるために必要な仕事を \[\begin{equation}
\delta W = \mu dN
\end{equation}\] と書くことにする。\(\mu\)は一個あたりの粒子を加えるために必要なエネルギーであり、化学ポテンシャルと呼ばれる(示強変数である)[ここの示量性、示強性は足し算できるかどうかで理解することが難しいため、そういうものだと思っておいてください、大事なことは以下の仕事の式]。\(dN\)は物質の量に比例するため示量変数である。粒子数の変化と体積の変化が同時に起こるならば、仕事は
\[\begin{equation}
\delta W = -pdV + \mu dN
\end{equation}\] となる。
上記の2つの仕事の例(体積の膨張・圧縮と粒子数の変化)からわかるように、例えば同じ仕事の値であっても、体積が膨張・圧縮したのか、粒子数が増減したのかは判断できない。そのため、仕事は系を一意に決めるための状態量ではない。
熱力学においては、当然「熱」を扱う。この熱はエネルギーであり(熱は温度を上げるもの→温度は粒子の運動エネルギー→熱はエネルギー)、様々な性質をもつ。物質に熱を加えると温度が上昇する。このことを、
\[\begin{equation}
\delta Q = C dT
\end{equation}\] と書こう。\(\delta
Q\)(単位はジュールとすることが多い)とは系の温度を\(dT\)上昇させるために必要な熱量であり、比例係数\(C\)を熱容量と呼ぶ。同じ熱を加えた場合、熱容量が高いものほど温まりにくいことを意味する(\(\delta Q = 1\), \(C = 100\)の場合と、\(\delta Q = 1\), \(C = 1\)の場合とで、\(dT\)を比較すればわかる)。同様に、熱容量が高いものほど、温めるために多くの熱が必要であることを意味する。
熱容量\(C\)は示量変数である(系全体の値が、部分系の足し算になる)。例えば、比熱\(C_1\)、温度\(T\)をもつ系1と比熱\(C_2\)、温度\(T\)をもつ系2を合わせた系を考える(熱平衡になっており、温度は等しいと仮定)。系1、系2両方に熱\(\delta
Q\)を与えたと仮定する。すると、系1では\(\delta Q = C_1 dT\)、系2\(\delta Q = C_2
dT\)が成り立つ。系全体としては、熱\(2Q\)が加えられており、温度の上昇は、\(2\delta Q = (C_1 +
C_2)dT\)で決まるであろう。したがって、系全体の比熱は\(C_1+C_2\)であり、足し算可能である。
温度とは1粒子あたりの平均的な運動エネルギーであることを思い出そう。イメージとしては、例えば1J加えたときに1粒子しかない場合はその粒子に熱が加えられ運動エネルギーが上昇するであろう。一方、1J加えたときに\(10^{10}\)個粒子が存在していた場合、熱はすべての粒子の運動エネルギーをそこまで上昇させることはないであろう(エネルギー保存則の観点から)。したがって。熱容量\(C\)は粒子の個数に依存する示量変数であり、示強変数としての比熱\(c\)を用いて \(C =
mc\) (mは系の質量)
として書き表すこともできる(粒子数でない理由は、質量は粒子数を反映していること、加えて質量であれば物質の違いも表すため[だと思われる])。
(重要なことなのでおさらい)
圧力\(p\)、体積\(V\)、化学ポテンシャル\(\mu\)、粒子数\(N\)のとき、気体に行われる仕事は \[\begin{equation} \delta W = -pdV + \mu dN \end{equation}\] である。同じ仕事\(\delta W\)の値だとしても、それは体積が膨張(収縮)したのか、粒子数が増加(減少)したのか判断できない。そのため、仕事は系を一意に決める状態量ではない。
熱と温度の関係性は比例係数(熱容量)\(C\)を用いて、 \[\begin{equation} \delta Q = C dT \end{equation}\] となり、比熱\(c\)を用いて\(C = mc\)と書くこともできる(粒子数\(N\)を用いて\(Nc\)と定義することもある)。 *****
周りから影響のない孤立系では、平衡状態に達するまで系の状態は自発的に変化していく。例えば演習にて5円玉と糸を用いて振り子の実験をした際、しばらく待てば振り子はとまる(摩擦や空気抵抗により)。この際、振り子がとまっている状態が平衡状態である。加えて、振り子は自発的に動き出すことは経験上ありえない。つまり、振り子においては、自発的に動く→止まるという流れこそあれ、自発的に止まる→動くという流れはない。このように、一方的な変化を不可逆過程と呼ぶ。さらに、平衡状態に至る状態を非平衡状態と呼び、不可逆過程は非平衡状態にて生じる。
一方、平衡状態でのみ生じる過程を可逆過程と呼ぶ。平衡状態において、十分にゆっくり状態変数を変化させるという理想化された状況ならば(系が変化する時間スケールよりもさらにゆっくり変化させる状況を想定する)、可逆過程を理想的に考えることもできるであろう。
(おさらい - 2023.11.17)
この講義では、理想気体(粒子間の距離が十分に大きい気体)、無限時間かけてゆっくり変化させる平衡状態もしくは可逆過程を考える。
理想気体の状態方程式 \[\begin{equation}
pV = NkT
\end{equation}\]
理想気体において、温度と粒子の平均的な運動エネルギーとの間には、
\[\begin{equation}
\epsilon_{\rm kin} = \frac{3}{2}kT
\end{equation}\] という関係性が成り立つ。ただし、\(\epsilon_{\rm
kin}\)とは運動エネルギーの平均である。理想気体の内部エネルギー
\(U = N\epsilon_{\rm kin}\) は、 \[\begin{equation}
U = N\epsilon_{\rm kin} = \frac{3}{2}NkT = \frac{3}{2}pV
\end{equation}\]
理想気体が外部とやり取りする仕事\(\delta W\)は、 \[\begin{equation} \delta W = -pdV + \mu dN \end{equation}\]
*****
温度が一定のもとでの気体の膨張を考える(熱浴という巨大かつ温度一定の系に囲まれた場合を考える[図1.12])。蓋が可動な容器に圧力\(p_1\)、体積\(V_1\)、温度\(T =
\mathrm{const.}\)の気体が封入され、外部から力\(\vec{F}_1\)が加えられている平衡状態を考える。力\(\vec{F}_1\)を取り除くことにより体積は増えて等温膨張は達成できる。これは自発的にもとに戻ることはないので、不可逆過程である。加えて、力を急速に取り除いてしまうと各々の段階での状態を把握することはできない(急激な変化により、圧力は一様にはならないため)。無重量の蓋を理想的に考えると、蓋が得た運動エネルギーは0であり(最終的に止まるため)、不可逆な等温膨張によって行われた仕事は0であることがわかる。
一方、十分にゆっくり力を減少・増加させるならば、理想的には可逆変化を達成できるであろう。さらに僅かに減少・増加させ平衡状態まで待つことを想定しているため、各々の段階で平衡状態における議論を行うことが可能である。理想気体ならば、\(p = NkT/V\)であり、状態1(\(p_1\), \(V_1\))から状態2(\(p_2\)、\(V_2\))に可逆変化させた場合の仕事は、 \[\begin{equation}
\int_1^2 dW = -\int_{V_1}^{V_2}p(V)dV = -\int_{V_1}^{V_2}\frac{NkT}{V}dV
= -NkT\ln \frac{V_2}{V_1}
\end{equation}\]
となる(この式もよく出てくるので要チェック)。等温膨張を考える場合は、\(V_2 >
V_1\)であるため、仕事は負であり、すなわち外部に対して(外力に対して)仕事を行っており[系に蓄えられる仕事を正、外部に行う仕事を負としている]、この仕事を系から取り出すことができると考えられる。これは不可逆過程とは大きく異なることに注意。さらに、十分にゆっくり行った変化である可逆過程よりも大きな仕事を取り出すことはできない(部分的にでも不可逆過程を混ぜると、その過程で取り出せる仕事が0になるため)。
上記の過程が可逆であることを確かめる。状態2から状態1に戻すために必要な仕事は、
\[\begin{equation}
\int_2^1 dW = -\int_{V_2}^{V_1}pdV = -\int_{V_2}^{V_1}\frac{NkT}{V}dV =
-NkT\ln \frac{V_1}{V_2}
\end{equation}\]
であり、この仕事は正。状態1から2に変化させるために必要な仕事と、状態2から1に変化させるために必要な仕事を足せば0になることから、可逆であることがわかる。
上記より、等温膨張において、状態1から状態2へと変化する際に、不可逆過程と可逆過程のどちらも存在することがわかる。すなわち、最初や最終の状態のみではなく、途中の過程にも依存する。上記の不可逆過程では、仕事は0である。最初の平衡状態も仕事は0、最終状態も仕事は0、すなわち、仕事では系の状態を一意に決めることはできない(上記の例では、\(\ln
\frac{V_1}{V_2}\)と値が等しい状態3(\(p_3, V_3\))、状態4(\(p_4,
V_4\))を考えれば、仕事が系の状態を一意に決めることはできないであろう)。同様に熱もまた、系の状態を一意に決めることはできない(\(\delta Q = mc
\mathrm{d}T\)であることから、熱は温度ではなく温度差を決めるため[270->280K,
290-300Kが同じ熱量のため、系の状態を一意に決めていない])。すなわち、だいぶ前に述べた状態量=系を曖昧なく決める量という定義に照らし合わせると、仕事も熱も状態量ではないことがわかる。これは数学的には、仕事も熱も完全微分(全微分)ではないことを意味する。
完全微分とは、例えば\(U =
U(x,y)\)として与えられたとき、 \[\begin{equation}
dU = \frac{\partial U}{\partial x}dx + \frac{\partial U}{\partial y}dy =
\nabla U \cdot d\vec{x}
\end{equation}\] として微小変化が記述できることを意味する。経路C
[\((x_0, y_0)\)から\((x, y)\)まで] にて積分すると、 \[\begin{eqnarray}
\int_C dU & = \int_C \nabla U \cdot d\vec{x} \nonumber\\
U(\vec{x}) - U(\vec{x}_0) & = \int_C \nabla U \cdot d\vec{x}
\nonumber\\
\end{eqnarray}\]
と書くことができる。すなわち、完全微分ならば、始点と終点のみに依存して、経路に依存しない値を得ることができる。経路に依存しないということは、連続な経路を辿れば\(\vec{x}_0\)から\(\vec{x}\)を経て再び\(\vec{x}_0\)に戻ったとき変化は0であり、\(\vec{x}_0\)に付随した系の状態を表すと考えられる。つまり、状態量の関数かつ完全微分である\(f\)が与えられれば、それもまた状態量となることを意味する
(例えば、等温かつ粒子数一定だと、状態量\(V\)の関数として\(p\)を表すことができ[\(p = NkT/V\)]、\(dp = -NkT /V^2
dV\)であり完全微分、したがって既知の事実ではあるが圧力が状態量であることを示すことができる)。
後々使うトリックを一つ学んでおく。例えば、 \[\begin{equation}
dU = yx dx + x^2 dy
\end{equation}\] は完全微分ではない。一方、 \[\begin{equation}
dU = y dx + x dy
\end{equation}\]
は完全微分である。状態量の関数かつ完全微分な関数は新たな状態量となることを学んだ。さらに、状態量は系を記述するための変数として最重要なものであり、新たな状態量を見つけることは分野内における最重要事項のひとつである。
完全微分ではない \[\begin{equation}
dU = yx dx + x^2 dy
\end{equation}\]
を、完全微分に変換することが可能である。答えは一意に定まらないが、例えば両辺に\(\frac{1}{x}\)を掛け算する(\(x \neq 0\))。すると、 \[\begin{equation}
\frac{dU}{x} = dF = y dx + x dy
\end{equation}\] となり、\(dF\)は完全微分となる。このとき、両辺に掛け算した\(\frac{1}{x}\)を積分因子と呼ぶ(詳細な導出は、この講義資料の下の方に記述)。
1: (教科書p.29) 問題1.1を解け。
(おさらい[昨年度のもの。参考になるかもしれないので、残しておく])
ひたすらにゆっくり変化させ、ゆっくりと元の状態に戻ることができる変化を可逆過程と呼ぶ。急な変化により元に戻れない変化を不可逆過程と呼ぶ。最初の状態と最後の状態が同じでも、可逆過程では仕事が取り出せるものの、不可逆過程では仕事が取り出せないことがある。特に、取り出せる仕事は可逆過程で最大であることが知られている。
この講義では可逆過程に注目する。可逆過程とは元に戻せる変化。元に戻せるということは、任意の経路を通る経路積分で元に戻せるということ。積分が経路に依存しない関数に注目するということと同じ意味。とある関数\(f\)の積分が経路に依存しない条件は、\(\vec{F}(\vec{x}) = \nabla
f(\vec{x})\)となる\(F\)が存在すること(=\(f(x)\)が完全微分である)。または、\(\nabla \times \vec{F} = \vec{0}\)。
*****
系を一意に決めることができる変数を状態量と呼ぶ(圧力、体積、粒子数、温度
[\(pV = NkT\)
にでてくる変数たち]、化学ポテンシャル\(\mu\))。熱、仕事は状態量ではない(熱は\(\delta Q =
CdT\)より温度の変化のみしか記述できない、仕事は\(\delta W = -pdV + \mu
dN\)より何が変化したかを記述できない)。熱も仕事も完全微分ではない[=積分値が経路に依存する]ことを意味する。一方、状態量は元に戻せる変化が存在することを想定するため、完全微分である[=積分値が経路に依存しない]。
例1.4 微分形式の簡単な例
微分形式 \[\begin{equation}
\vec{F}\cdot d\vec{x} = yx dx + x^2 dy
\end{equation}\] を考える。\(\vec{F}\)にポテンシャルが存在する条件は、\(\frac{\partial yx}{\partial y} - \frac{\partial
x^2}{\partial x}\)が0になることであるが、\(\frac{\partial yx}{\partial y} - \frac{\partial
x^2}{\partial x} = -x\)より、\(\vec{F}\)にポテンシャルは存在しない。
微分形式 \[\begin{equation}
\vec{F}\cdot d\vec{x} = y dx + x dy
\end{equation}\] を考える。\(\vec{F}\)にポテンシャルが存在する条件は、\(\frac{\partial y}{\partial y} - \frac{\partial
x}{\partial x}\)が0になることであり、\(\frac{\partial y}{\partial y} - \frac{\partial
x}{\partial x} = 0\)より、\(\vec{F}\)にポテンシャルが存在することがわかる。このとき、全微分が\(\vec{F}\cdot d\vec{x} = y dx + x
dy\)で与えられるポテンシャル\(f(x,y)\)を計算可能である。積分路をひとまず\(C_1 =\begin{pmatrix} x_0 + t(x - x_0) \\ y_0 +
t(y - y_0) \end{pmatrix}\)として考えてみる(t
$、積分路には依存しないことも後で確かめてみる)。
\[\begin{eqnarray}
f(\vec{x}) - f_0(\vec{x}_0) &=& \int_C \nabla f(\vec{x})\cdot
d\vec{x} \nonumber\\
&=& \int_C ydx + xdy \nonumber\\
&=& \int_0^1 y(t) \frac{dx(t)}{dt} + x(t) \frac{dy(t)}{dt} dt
\nonumber\\
&=& \int_0^1 [y_0 + t(y - y_0)][(x - x_0)] + [x_0 + t(x -
x_0)][(y - y_0)] dt \nonumber\\
&=& y_0(x - x_0) + x_0(y - y_0) + (x - x_0)(y - y_0) \nonumber\\
&=& xy - x_0y_0
\end{eqnarray}\] となる。事実、\(\frac{\partial f(\vec{x})}{\partial x} =
y\)、\(\frac{\partial
f(\vec{x})}{\partial y} = x\)。
経路に依存しないことを確かめる。図1.14の経路\(C_2\)に沿って計算する。第1に、\(y = y_0\)、\(x =
x_0 + t\)に沿って計算する (\(t \in
[x_0, x]\))。 \[\begin{eqnarray}
\int_C \nabla f(\vec{x})\cdot d\vec{x}
&=& \int_C ydx + xdy \nonumber\\
&=& \int_{x_0}^x y_0 \frac{dx(t)}{dt} dt \nonumber\\
&=& xy_0 - x_0y_0
\end{eqnarray}\]
第2に、\(y = t\)、\(x = x\)に沿って計算する (\(t \in [y_0, y]\))。 \[\begin{eqnarray}
\int_C \nabla f(\vec{x})\cdot d\vec{x}
&=& \int_C ydx + xdy \nonumber\\
&=& \int_{y_0}^y x dt \nonumber\\
&=& xy - xy_0
\end{eqnarray}\]
第1の経路、第二の経路における積分値を足して、\(f(\vec{x}) - f_0(\vec{x}_0) = xy -
x_0y_0\)。確かに、経路に依らない積分値を得ることが確認できる。
完全でない微分形式\(\vec{F}\cdot
d\vec{x}\)に関数\(g(\vec{x})\)をかけて完全な微分形式となるとき、\(g(\vec{x})\)を積分因子と呼ぶ。 微分形式
\[\begin{equation}
\vec{F}\cdot d\vec{x} = yx dx + x^2 dy
\end{equation}\]
を考える。これは先程みたように、完全な微分形式ではない。関数\(g(x, y)\)をかけて、 \[\begin{equation}
g\vec{F}\cdot d\vec{x} = g(x, y)yx dx + g(x, y)x^2 dy
\end{equation}\] が完全な微分形式となる条件は、 \[\begin{equation}
\frac{\partial g(x, y)x^2}{\partial x} - \frac{\partial g(x,
y)xy}{\partial y} = 0
\end{equation}\] である。計算していくと、 \[\begin{equation}
g_xx^2 + 2gx - g_yxy - gx = x(g_xx + 2g - g_yy - g) = 0
\end{equation}\]
これをみたす関数が1つでも見つかれば良いので、因数分解できる形\(g(x, y) =
g_1(x)g_2(y)\)を想定してみる。すると、 \[\begin{equation}
xg_1g_2(\frac{g_1'}{g_1}x + 1 - \frac{g_2'}{g_2}y) = 0
\end{equation}\] となり、\(\frac{g_1'}{g_1}x + 1 = C\) (\(C\)は定数、つまり、\(\ln g_1(x) = (C-1)\ln x + K_1\) [\(K_1\)は定数]) かつ\(\frac{g_2'}{g_2}y = C\) (つまり、\(\ln g_2(y) = C\ln y + K_2\) [\(K_2\)は定数])。最終的に、積分因子の一つとして、
\[\begin{equation}
g(x, y) = K x^{C-1}y^C
\end{equation}\] が得られた(\(K =
\exp(K_1 + K_2)\))。例えば\(C =
0\)とすれば、\(g\vec{F}\cdot d\vec{x} =
y dx + x
dy\)となり、これが完全な微分形式であることは前に見たとおりである。
1: (教科書p.29) 問題1.1を解け。