Статистическое описание с позиции классической механики. Функция распределения.
Составляя уравнения движения механической системы и интегрируя их, мы принципиально можем получить исчерпывающие сведения об эволюции механической системы. Однако когда мы попытаемся применить методы механики к макроскопической системе, т.е. системе с колоссальным порядка числа Авогадро числом степеней свободы, мы столкнемся с необходимостью составить и решить столь же гигантское число дифференциальных уравнений, что представляется, вообще говоря, невозможным на практике. Следует отметить, что даже если мы получим общее решение уравнений движения такой системы, то совершенно невозможно будет подставить в это решение начальные условия.
Таким образом, нет никакой возможности дать полное механическое описание эволюции состояния макроскопической системы, даже в том случае, когда она замкнута.
Однако, к счастью, для описания подавляющего числа явлений, связанных с макрообъектами, достаточно знать только макроскопические величины, т.е. величины, характеризующие не отдельные частицы, а все тело или его отдельные макроскопические части. Такие величины обладают весьма замечательным свойством.
Из опыта известно, что если макроскопическое тело поместить в стационарные условия, то по истечении некоторого времени (времени релаксации) оно придет в состояние термодинамического равновесия. Это состояние характеризуется тем, что все макроскопические величины подавляющую часть времени являются практически постоянными и лишь сравнительно очень редко испытывают сколько-нибудь заметные отклонения. Причем данное обстоятельство тем более справедливо, чем сложнее и больше рассматриваемое тело. Указанный характер поведения макроскопических величин позволяет при описании таких систем вместо истинной зависимости этих величин от времени использовать их средние по времени значения. Для величины это среднее дается стандартным выражением
. (1)
Статистическая физика представляет собой математический аппарат, который позволяет вычислять эти средние, не прибегая при этом к указанной формуле. Легко понять что, с помощью этой формулы совершенно нельзя сделать никакие теоретические предсказания значений термодинамических характеристик. Для того, чтобы вычислить среднее с помощью этой формулы, нужно вначале определить зависимость от времени механического состояния системы, т.е. зависимость от времени всех обобщенных координат и скоростей, что невозможно на практике из-за колоссального числа степеней свободы. К счастью оказывается, что как раз наличие у макроскопической системы колоссального числа степеней свободы позволяет вычислять такие средние, не прибегая к этому непосредственному определению.
Прежде, чем перейти непосредственно к обсуждению способов вычисления этих средних, договоримся о некоторой терминологии. Прежде всего, механическое состоянии системы будем называть ее микросостоянием.
Далее введем понятие фазового пространства механической системы. Каждое микросостояние системы с степенями свободы может быть математически представлено в виде точки в воображаемом -мерном пространстве, по координатным осям которого откладываются обобщенные координаты и импульсы. Это воображаемое -мерное пространство называется фазовым пространством системы. Каждая точка фазового пространства отвечает определенным значениям координат и импульсов системы и изображает собой определенное состояние механической системы. С течением времени состояние системы изменяется и соответственно точка фазового пространства, изображающая состояние системы, будет описывать в нем некоторую кривую, которая называется фазовой траекторией. В дальнейшем, когда я буду говорить, что система находится в данной точке фазового пространства, то я буду иметь ввиду, что система находится в состоянии, которому отвечает эта точка фазового пространства. Также договоримся запись обозначать просто . Аналогично, запись будем обозначать . Тогда элементарный объем фазового пространства будет обозначаться .
Приступим теперь к рассмотрению вопроса о том, как можно вычислять статистические средние макроскопических величин, не решая при этом полную механическую задачу
Прежде всего заметим, что макроскопические тела, с которыми нам приходится иметь дело, являются относительно малыми частями большой замкнутой системы, состоящей из внешних тел вместе со средой, в которую они погружены. Например, в случае макроскопического тела, помещенного в термостат, это тело вместе с термостатом образует замкнутую систему. При этом изучаемая нами система очень мала по сравнению с термостатом, так что влияние нашей системы на термодинамическое состояние термостата пренебрежимо мало.
Поэтому постановка нашей задачи должна быть следующей. Рассмотрим замкнутую макроскопическую систему, т.е. систему, не взаимодействующую ни с какими другими телами. Выделим в этой системе некоторую ее часть, которая с одной стороны весьма мала по сравнению со всей системой, а с другой стороны также является макроскопической. Такие относительно малые, но при этом макроскопические части мы будем называть подсистемами. Наша цель состоит в том, чтобы научиться вычислять средние по времени значения макроскопических величин для этих подсистем, не прибегая к решению полной механической задачи. Подсистема сама является макроскопической системой, но при этом уже отнюдь не замкнутой. Напротив, она испытывает всевозможные воздействия со стороны остальных частей системы. Из-за наличия у этих остальных частей системы большого числа степеней свободы эти взаимодействия будут иметь весьма сложный и запутанный характер. Поэтому микросостояние подсистемы будет меняться со временем весьма сложным и запутанным образом. Как раз этот сложный и запутанный характер эволюции микросостояния подсистемы и позволяет подойти к решению поставленной задачи с другой стороны.
В основе этого подхода лежит то обстоятельство, что благодаря сложному и запутанному характеру эволюции микросостояния нашей подсистемы, она за достаточно большой промежуток времени успеет побывать достаточно большое число раз во всех возможных своих микросостояниях. Точнее это обстоятельство можно сформулировать следующим образом. Выделим достаточно малый объем фазового пространства . Можно утверждать, что за достаточно большой промежуток времени наша подсистема достаточно много раз пройдет через этот объем фазового пространства. Пусть - часть полного времени , в течении которого наша подсистема находится в точках данного объема фазового пространства. При неограниченном увеличении полного времени отношение будет стремиться к некоторому конечному пределу
. (2)
Этот предел можно, очевидно, рассматривать как вероятность того, что при наблюдении нашей подсистемы в некоторый произвольный момент времени мы обнаружим ее находящейся в данном участке фазового пространства.
Функция распределения.
Переходя к бесконечно малым элементам фазового пространства, мы можем определить вероятность состояний, которые изображаются точками внутри элементарного фазового объема, т.е. вероятность того, что обобщенные координаты и импульсы лежат в заданных интервалах между , и , . Эту вероятность можно представить в виде
. (3)
Функция зависит от всех координат и импульсов подсистемы и играет роль плотности вероятности нахождения подсистемы в данной точке ее фазового пространства. Эта функция называется функцией статистического распределения или, как часто говорят, просто функцией распределения.
Функция распределения, очевидно должна удовлетворять условию нормировки
, (4)
где интеграл берется по всему фазовому пространству подсистемы. Условие нормировки есть просто отражение того простого факта, что вероятность того, что подсистема в любой момент времени обязательно находится в каком-то своем микросостоянии.
Вычисление этой функции распределения как раз и является основной задачей статистической теории. Оказывается, что функцию распределения можно найти, не решая полную механическую задачу.
Зная функцию распределения, мы сразу можем вычислить вероятности различных значений любой физической величины , зависящей от микросостояния данной подсистемы (т.е. от значений ее координат и импульсов ). Соответственно, мы также можем вычислить и среднее значение любой такой величины. Оно получатся путем умножения всех возможных значений данной величины на соответствующие вероятности и интегрирования по всем состояниям. Другими, словами среднее значение величины дается формулой
, (5)
где интегрирование ведется по всему фазовому пространству данной подсистемы.
В силу своего определения вероятности, с помощью формулы (3), усреднение с помощью функции распределения, или как говорят, статистическое усреднение полностью эквивалентно усреднению по времени (1). Однако статистическое усреднение обладает тем преимуществом, что оно освобождает нас от необходимости следить за изменением истинного значения физической величины со временем.
Следует отметить, что статистическая теория не дает такой исчерпывающе полной и однозначной информации о системе, какую дают методы классической механики. Выводы и предсказания статистической теории в отличие от результатов классической механики имеют вероятностный характер. Причем вероятностный характер результатов статистической теории сам по себе отнюдь не лежит в самой природе рассматриваемых ею объектов, он есть лишь следствие того, что эти результаты получаются на основании гораздо меньшего количества данных, чем это нужно было бы для полного механического описания (не требуются начальные значения всех координат и импульсов).
Тем не менее, при практическом применении статистической теории к макроскопическим телам в состоянии термодинамического равновесия ее вероятностный характер обычно совершенно не проявляется. Дело в том, что, как уже обсуждалось, если наблюдать любое макроскопическое тело, находящееся в состоянии термодинамического равновесия, в течение достаточно большого промежутка времени, то окажется, что все характеризующие тело макроскопические величины являются практически постоянными и лишь сравнительно очень редко испытывают сколько-нибудь заметные отклонения. В терминах статистического распределения это означает, что если с помощью функции распределения построить функцию распределения вероятностей различных значений величины , то эта функция будет иметь чрезвычайно резкий максимум при , будучи сколько-либо заметно отличной от нуля лишь в самой непосредственной близости к точке максимума (рис.1).
Рис.1.
Таким образом, давая возможность вычислять средние значения величин, характеризующих макроскопические тела, статистическая теория тем самым позволяет делать предсказания, оправдывающиеся с весьма большой точностью для подавляющей части времени наблюдения. В этом смысле предсказания статистики приобретают практически определенный, а не вероятностный характер.
Далее, обратим внимание на тот факт, что энергия взаимодействия макроскопической системы со своим окружением существенно меньше ее внутренней энергии. В самом деле, во взаимодействии подсистемы с окружающими частями большой системы в основном принимают участие частицы, находящиеся вблизи ее поверхности. Относительное число частиц вблизи поверхности по сравнению с полным числом частиц в подсистеме быстро уменьшается с ростом размеров системы, и при достаточной большой величине подсистемы энергия ее взаимодействия со своим окружением будет существенно меньше внутренней энергии подсистемы. Такое соотношение между энергией взаимодействия подсистем и их внутренней энергией, во-первых, служит обоснованием того, что функция распределения данной подсистемы зависит только от ее координат и импульсов, и не зависит от микросостояния ее окружения. Кроме того, указанное обстоятельство дает возможность считать подсистемы независимыми в статистическом смысле.
Остановимся здесь более подробно. Рассмотрим каких-либо две подсистемы. Первую подсистему обозначим цифрой 1, втору цифрой – 2. Будем обозначим обобщенные координаты и импульсы первой подсистемы и . Обобщенные координаты и импульсы второй подсистемы будем, соответственно, обозначать и . Функция распределения первой подсистемы зависит только от ее координат и импульсов и , и не зависит от микросостояния окружающей ее среды. В частности, она не зависит от координат и импульсов и второй подсистемы. Функция распределения второй подсистемы также зависит только от ее координат и импульсов и и не зависит от микросостояния окружающей ее среды. В частности, она не зависит от и . Функция распределения составной подсистемы “1+2”, т.е. подсистемы, представляющей собой объединение подсистемы 1 и подсистемы 2, зависит только от , , и и не зависит от координат и импульсов остальных частей большой замкнутой системы. Рассмотрим два события. Первое событие состоит в том, что подсистема 1 находится в объеме ее фазового пространства, который окружает точку . Второе событие состоит в том, что подсистема 2 находится в объеме ее фазового пространства, который окружает точку . Так вот, эти два события являются независимыми с точки зрения теории вероятности, т.е. вероятность того, что оба эти события произойдут одновременно, равна произведению вероятности первого события и вероятности второго события. Другими словами, вероятность того, что составная система “1+2” находится в элементе ее фазового пространства , который окружает точку , равна произведению вероятности первой системе находиться в элементарном объеме ее фазового пространства и вероятности второй системе находиться в элементарном объеме ее фазового пространства. Таким образом, мы можем написать
, (6)
Из написанного равенства непосредственно следует, что
, (7)
т.е. функция распределения составной подсистемы “1+2” равна произведению функций распределения подсистемы 1 и подсистемы 2.
Аналогичное соотношение можно написать и для совокупности нескольких подсистем, при условии, конечно, что совокупность всех этих подсистем все еще составляет малую часть замкнутой системы.
Рис.2
Можно, очевидно, утверждать и обратное, если распределение вероятностей сложной системы распадается на произведение множителей, каждый из которых зависит только от микросостояния одной из ее, то это значит, что эти части статистически независимы, причем каждый из множителей пропорционален вероятности состояний соответствующих подсистем.
Теперь рассмотрим какую-либо величину , относящуюся ко всему изучаемому телу или его отдельной макроскопической части. Эта величина будет с течением времени изменяться, колеблясь около своего среднего значения. Введем величину, характеризующую в среднем ширину интервала этого изменения. На первый взгляд, казалось бы, в качестве такой характеристики следует взять среднее значение разности между самой величиной и ее средним значением. Однако среднее этой разности служить такой характеристикой не может, поскольку для макроскопической системы это среднее всегда равно нулю, независимо от того сколь часто наша величина значительно отклоняется от своего среднего значения. Действительно, по определению среднее значение нашей разности есть
. (8)
Подставляем явный вид нашей разности . В результате получаем
Отсюда
. (9)
Оставшийся интеграл равен единице в силу условия нормировки функции распределения. Таким образом, получаем, что среднее нашей разности
(11)
всегда равно нулю, не зависимо от того, как ведет себя наша величина .
В свете сказанного понятно, что в качестве искомой характеристики удобно брать среднее значение квадрата этой разности . По определению это среднее есть
. (12)
Квадрат разности всегда больше, либо равен нулю. Функция распределения подсистемы всегда неотрицательно по самому ее определению. Поэтому подынтегральная функция в данном интеграле больше, либо равна нулю во всей области интегрирования. Следовательно, этот интеграл будет стремиться к нулю только тогда, когда квадрат отклонения нашей величины от среднего сам стремится к нулю. Другими словами, среднее значение квадрата отклонения от среднего будет мало только тогда, когда вероятность значительных отклонений нашей величины от своего среднего будет мала.