СТАТИСТИЧЕСКИЕ МЕТОДЫ В АСТРОФИЗИКЕ

Реферат

СТАТИСТИЧЕСКИЕ МЕТОДЫ В АСТРОФИЗИКЕ

1. Введение

Термин «Статистические методы» можно понимать двояко. Во-первых, как описание эволюции систем, состоящих из большого числа частиц. К ним относятся, например, плазма – система электрически заряженных частиц, взаимодействующих посредством электромагнитных полей. Или галактики, содержащие десятки и сотни миллиардов звезд и представляющие плазмоподобные системы, т.к. звезды взаимодействуют гравитационно. И т.д.

Другое понимание термина – это применение методов математической статистики для построения моделей изучаемых процессов, а также методы обработки сигналов.

1. Космологическая теория Фридмана (1922-1924 гг) предсказывала, что Вселенная расширяется по закону: , где есть лучевая скорость какой-то галактики (лучевая означает проекцию скорости на луч зрения, соединяющий наблюдателя и изучаемый объект на небе), - расстояние до галактики, А – некоторая константа. Пронаблюдав ряд галактик и определив для них лучевые скорости и расстояния, можно найти константу А, которая является чрезвычайно важной, т.к. она определяет темп эволюции Вселенной и, соответственно, ее возраст. В 1929 г Э.Хаббл впервые определил величину указанной постоянной из наблюдений (впоследствии ее стали называть постоянной Хаббла и обозначать буквой Н). Здесь важно отметить то, что Хаббл, по-видимому, не знал теории Фридмана. Тем не менее, он пришел к тому же самому представлению для поля скоростей галактик чисто из наблюдательных соображений. Сделано это было с помощью как раз построения статистической модели. Одна из целей курса, продемонстрировать, что скрыто за термином «построение статистической модели» или «статистическое моделирование»

2. Определение скорости Солнца относительно ближайших звезд. Идея метода такова. Измеряются скорости группы звезд, которые рассматриваем как ближайшие. Обрабатывая эти скорости, по ним определяют скорость Солнца. Раскрытию смыла термина «статистическая обработка наблюдений» будет посвящен специальный раздел.

3. Определение фундаментальных параметров нашей Галактики. Одна из главных задач галактической астрономии – это нахождение массы Галактики. Масса определяется по движению звезд. В самом деле, если мы установим каким-то образом кривую вращения галактического диска, т.е. зависимость угловой скорости вращения галактики от расстояния до ее центра r, то, используя условие равновесия (здесь - гравитационный потенциал Галактики, и считается, что центробежная сила уравновешена гравитационной силой, создаваемой всеми объектами Галактики), можем найти , а затем из уравнения Пуассона (, где – плотность вещества) и массу Галактики. Проблема состоит в том, чтобы найти из наблюдений кривую вращения. Эта задача решается следующим образом. Измеряются скорости достаточно большого количества звезд. В отличие от предыдущей задачи, звезды должны занимать как можно больший объем галактики. Далее вводится некоторая математическая модель движения звезд в Галактике (в первом приближении считается, что звезды совершают чисто круговые движения) и путем статистической обработки данных измерений находятся параметры модели и, соответственно, кривой вращения, а затем масса Галактики.

В дальнейшем будут рассмотрены другие типы задач.

С точки зрения математики, статистические методы в астрофизике мало отличаются от других областей. Однако астрофизика налагает определенные особенности на требования к применяемым статистическим методам.

Для своего обоснования статистические методы в той или иной степени используют теорию вероятностей. В этой связи ниже представлен краткий исторический экскурс в теорию теории вероятностей.

Теория вероятностей как наука зародилась и сформировалась на материале азартных игр. Азартные игры, например, подбрасывание костей, карты и.д. – это достаточно простые и прозрачные для понимания процессы. Они и сейчас часто используются при изучении случайных процессов. Начало теории вероятностей как науке относится к 17 веку и связано оно с именами Галилея, Бернулли, Ферма и др. Значительный вклад в развитии теории принадлежит Гауссу, Чебышеву, Маркову и др.

Если говорить об астрономии, то тут следует отметить, что астрономия была первой экстремальной сферой знания, в которой человек попытался выйти за пределы обычной среды обитания, причем не только в пространственных, но и временных масштабах. Необычность этой науки ставила перед исследователями ряд проблем. Во-первых, необходимо было как-то получать информацию. Трудность здесь состояла в следующем. В астрономии мы не можем поставить активный эксперимент, т.е. не можем изменить состояние изучаемого объекта и посмотреть, к чему это приведет – за исключением ближайшей окрестности и вплоть до настоящего времени небесные объекты недостижимы. Все это приводит к тому, что мы вынуждены проводит пассивный эксперимент, ограничиваясь, как говорят, наблюдениями в ожидании того или иного события. Более того, эволюционные времена астрофизических объектов столь велики – в лучшем случае миллион лет, - что мы даже не можем непосредственно увидеть, как они эволюционируют со временем. Во-вторых, наблюдения проводятся зачастую вблизи предельных возможностей астрономических инструментов. И это ставит проблему о достоверности наших знаний о Мире в больших масштабах. Приблизиться к решению этого вопроса в немалой степени и как раз позволяют статистические методы.

Бурное развитие статистических исследований началось в 19-20 веках. Во-первых, человечество совершило прорыв во вторую экстремальную сферу знаний – атомную и ядерную физику. Здесь тоже потребовались изощренные методы обработки экспериментов. Во-вторых, статистика стала применяться в медицине, биологии, при планировании сложных и дорогостоящих экспериментов, что привело к созданию теории планирования экспериментов. Очень интенсивно статистика стала разрабатываться применительно к экономике. Возник даже термин «Эконометрика». Такое взаимное обогащение исследований в области статистики, проводившееся в разных областях науки, а также развитие компьютерной техники и методов привели к созданию современной более-менее стройной и цельной совокупности статистических методов.

В настоящем курсе будет рассмотрен ряд вопросов применения статистических методов, важных с точки зрения приложения в астрофизике, такие как оценивание тех или иных величин и их ошибок, статистическая обработка наблюдений, оценка достоверности данных, оценка гипотез, элементы дисперсионного анализа. В настоящее время разработан аксиоматический подход в теории вероятностей (Колмогоров). Но мы при изложении большинства вопросов будем базироваться на интуитивных, качественных представлениях, избегая громоздких и сложных для восприятия математических расчетов. В курсе подробно рассмотрено решение ряда реальных астрономических задач излагаемыми методами.

2. Природа ошибок. Методы их идентификации и оценки

В классической физике молчаливо принималось, что физические величины могут быть измерены, по крайней мере, в принципе, с любой точностью. Такая вера порождала иллюзию, что лишь недостаточное развитие приборной базы не позволяет достичь абсолютной точности. Однако со временем стало ясно, что полная неустранимость присутствия ошибок в измерениях – факт принципиальной важности. Особенно отчетливо это представление сформировалось благодаря развитию квантовой механики и формулировке принципа неопределенности Гейзенберга, который очертил пределы наименьших возможных ошибок при измерениях. При этом ошибки не следует рассматривать как нечто неправильное. Их следует рассматривать как погрешности, и эти погрешности присущи самой природе. В дальнейшем мы будем использовать оба термина – ошибки и погрешности как равноправные.

Любой результат измерений содержит ряд ошибок, различной природы. Принято их делить на систематические и случайные.1

Систематические погрешности могут быть связаны с рядом факторов, например, часы, в которых используется математический маятник, в зависимости от окружающей температуры будут идти с разной скоростью, поскольку будет меняться длина маятника вследствие температурного расширения, или на разных географических широтах вследствие изменения эффективного ускорения свободного падения. Эти эффекты являются инструментальными. Их можно уменьшить, сконструировав маятник особым образом так, чтобы его длина менялась как можно меньше при изменении окружающей температуры, тем самым, увеличив точность измерения промежутков времени (в особенности, больших). А можно построить прибор, на который эффекты температуры будут оказывать слабое влияние. Впрочем, один такой прибор сконструировала сама природа – это наша Земля, которая, как известно, вращается. В силу большого момента инерции влияние изменения температуры поверхности Земли на скорость ее вращения будет мало. Впрочем, для фиксации тех или иных моментов времени возникают другие (астрономические) проблемы. Но как бы то ни было, вращение Земли в течение длительного периода рассматривалось как наиболее точный инструмент измерения времени. С изобретением еще более точных атомных часов было показано, что вращение Земли не является строго равномерным. Здесь мы можем определенно сказать, что температурные эффекты не оказывают влияния на атомные и ядерные процессы.

Другой пример – измерение длины отрезка. Ее можно измерять с помощью линейки, которая опять же подвержена температурным влияниям. А можно с помощью современных лазерно-интерферометрических методов, точность которых на несколько порядков выше любых методах, основанных на сравнении длин отрезков.

Резюме этой части таково. Систематические ошибки – это главным образом инструментальные ошибки. На них могут оказывать влияние сезонные изменения, либо какие-то неучтенные факторы. Нередко такие погрешности трудно выделять. Для этого следует совершенствовать приборную базу, а также проводить более тонкий анализ всех факторов, которые могут повлиять на данное измерение. Далее это утверждение будет продемонстрировано на конкретном факте.

Случайные ошибки. Как показывают исследования, многократные измерения одной и той же величины приводят к разным результатам даже после устранения всех возможных систематических ошибок. Природа этих погрешностей – не контролируемые, или не поддающиеся учету факторы, влияющие на измерения. Статистика как раз и занимается случайными ошибками (уточнение будет дано ниже). Для обоснования статистических методов и используется теория вероятностей.

Измерения делятся на прямые и косвенные. Прямыми называются те измерения, в которых интересующая нас величина определяется непосредственно. Например, с помощью линейки находится длина некоторого отрезка. Или с помощью часов – промежуток времени, и т.д. Косвенными называются измерения, при которых интересующая нас величина сама не измеряется, а находится ряд величин, с которыми она связана некоторым функциональным соотношением. Мы начнем с прямых измерений.

3. Прямые измерения

Согласно сказанному, измеряемую величину мы можем представить в виде:

, (1.1)

где – истинное значение измеряемой величины, и - систематическая и случайная ошибки. Предположим, что систематической ошибкой мы можем пренебречь. Спрашивается, как найти истинное значение и охарактеризовать случайную ошибку. Рецепт таков. Производим измерения несколько раз, скажем, N раз. Каждую реализацию измерений будем отмечать индексом i, т.е. получаем набор . В качестве истинного значения принимается среднее арифметическое из N измерений:

(1.2)

Чтобы не выписывать каждый раз сумму, для арифметического среднего мы будем использовать обозначение

Под многоточием здесь понимается какое-либо выражение, и будем опускать индекс i в знаке суммы, если не возникает недоразумения.

В качестве ошибки можно было бы, например, взять среднее арифметическое от абсолютных значений отклонений от , т.е.

. (1.3)

На практике чаще используется другая оценка :

. (1.4)

Или, используя обозначения среднего через угловые скобки:

Отсюда и получается выражение (1.4).

Ее называют среднеквадратичным отклонением или ошибкой. Ниже будет выяснено, в чем преимущество оценки , которое дается формулой (1.4), по сравнению с формулой (1.3). Там же мы уточним и смысл этой величины.

Простейшая интерпретация приведенных погрешностей – это рассеяние экспериментальных значений вокруг среднего. Сказанное поясняет рис. 1.1, где условно изображена стрельба по мишени из орудия.

Рис. 1.1. Качественное пояснение среднего и погрешностей как коридоров рассеяний.

Итак, повторяя многократно измерения какой-то величины, мы можем найти ее «истинное» значение и разброс этой величины вокруг истинного значения. Оба этих значения характеризуют совокупность полученной при измерениях выборки значений. Слово истинное было взято в кавычки потому, что в действительности оно неизвестно. Мы лишь принимаем формулу (1.2) за оценку истинного значения.2 Величина , очевидно, характеризует разброс относительного среднего значения. Поэтому она также может играть роль оценки ошибки истинного значения. Обратим внимание на то, что каждая из указанных величин для данной выборки не зависит от номера реализации i.

Окончательно для искомой величины имеем: интересующая нас величина

Замечание. Предположим, что 2 экспериментатора измеряли независимо одну и ту же величину и получили разные значения - и . Спрашивается, Какую из этих величин надо принять за истинную? Ответ таков: если они совпадают в пределах ошибки, то мы можем считать, что они не отличаются. Но если они не попадают в соответствующие коридоры ошибок, то эксперимент следует повторить и найти источник ошибок.

4. Косвенные измерения

В большинстве случаев приходится иметь дело с косвенными измерениями. Рассмотрим такой пример. Пусть непосредственно измеряются 2 величины и (т.е. мы имеем выборку из N пар значений xi yi ) , а нас интересует 3-я величина , которая сама не измеряется и с этими двумя связана соотношением:

, (1.5)

где А и В – некоторые известные константы, которые не имеют погрешности. Тогда искомая истинная величина находится, как легко показать, подстановкой:

Здесь большие буквы означают истинные значения, при этом, если известны ошибки и , то ошибка может быть оценена аналогично предыдущему

(1.6)

Или улучшенной оценкой:

(1.7)

Действительно:

а среднеквадратичная ошибка:

Здесь

Приведенная выше оценка (1.7) получается, если положить . Это есть условие независимости переменных х,у (см. далее).

Важно заметит, что ошибки складываются, даже если А и В имеют разные знаки.

Оценку (1.7) мы называем улучшенной по сравнению с (1.6) потому, что согласно последней формуле она будет меньше, чем в (1.6). Это легко показать, используя аналогию с теоремой Пифагора.

Этот результат можно распространить на любую функциональную зависимость: . Для этого представим измеряемые величины следующим образом:

и , где и - случайные величины, характеризующие разброс измеряемых величин вокруг истинных значений X и Y. Предполагая, что погрешности малы (а нас может интересовать только эта ситуация!), разложим функцию для искомой величины в ряд Тейлора, ограничиваясь первыми слагаемыми:

Рассматривая производные как постоянные величины и используя предыдущие результаты, найдем:

(1.8)

Здесь следует оговориться: выше под и понимались независимые переменные. Вопрос, когда это не так, будет рассмотрен специально позднее.

Собственно говоря, мы уже можем начинать проводить некоторые статистические исследования.

Задача № 1. Найти скорость Солнца относительно группы близких звезд.

Решение. Рассмотрим небольшой объем вокруг Солнца, скажем, несколько десятков парсек (пк). Можем принять, что звезды в этом объеме имеют приблизительно одинаковую среднюю скорость относительно некоторой неподвижной системы отсчета (в галактической астрономии такая скорость называется систематической – не путать с систематической ошибкой). Обозначим эту скорость (точный смысл среднего см. ниже). Представим скорость Солнца в виде: , где имеет смысл искомой скорости. Здесь следует помнить, что скорость звезды измеряется относительно Солнца. Поэтому наблюдаемая скорость i-ой звезды (мы не будем останавливаться на астрономических аспектах методики измерения скоростей звезд) представляется в виде: , где есть скорость звезды относительно неподвижной системы отсчета. Далее разложим скорость i-ой звезды относительно неподвижной системы отсчета на 2 составляющие – среднюю скорость, т.е. скорость движения выделенного объема как целого, и скорость относительно этого усредненного движения, т.е.: . Из сказанного вытекает: . Очевидно, первое и последнее слагаемые в правой части сокращаются. Поскольку имеет смысл хаотической скорости, т.е. она – случайная величина, то по определению среднего . Тогда . С учетом того, что среднее значение от хаотической скорости звезд равно нулю, находим:

.

Таким образом и была найдена скорость Солнца по отношению к близким звездам. Эта скорость называется собственной скоростью Солнца. Модуль ее порядка 15 км/с.

Из приведенных формул мы можем оценить среднеквадратичный разброс хаотических скоростей звезд . Найденная величина оказывается порядка 40 км/с.

Здесь следует сделать, по крайней мере, 3 замечания.

Во-первых, среди звезд вблизи Солнца встречаются такие, у которых собственные скорости могут достигать 100 км/с и более, что в несколько раз превосходит среднеквадратичную хаотическую скорость. Как к этому относиться? Является ли такое измерение следствием какой-то грубой ошибки, или это реальное событие? Ответ на этот вопрос таков. На первом этапе соответствующие звезды можно отбросить, приняв, что такие большие скорости есть следствие какой-то грубой ошибки. Затем повторить расчеты с новой (очищенной) выборкой звезд. Однако детальные исследования с привлечением дополнительных соображений показали, что аномально быстрые звезды обладают некоторой особенностью в кинематике, в частности, векторы их скоростей, как оказывается, заключены в некотором угловом направлении. Далее, у них достаточно низкое содержание тяжелых элементов (на первый взгляд, не совсем понятно, причем тут тяжелые элементы). На диаграмме спектр-светимость эти звезды оказываются в области, куда попадают старые объекты, не принадлежащие дисковой подсистеме. Если вспомнить, что Галактика состоит из нескольких подсистем – в первом приближении вращающегося в своей плоскости диска и не вращающегося сферического гало (диск образуют звезды с малой хаотической скоростью и большим содержанием тяжелых элементов, сферическую подсистему – звезды с большой хаотической скорость и малым содержанием тяжелых элементов), то становится понятно, что эти высокоскоростные звезды принадлежат подсистеме гало. Они не участвуют в общем вращательном движении вокруг центра Галактики, в то время как наше Солнце вместе с большинством близких звезд вращаются вокруг центра галактики. Поэтому большие скорости отдельных звезд есть следствие того, что наша местная система движется, участвуя в галактическом вращении, а эти звезды в нем не участвуют. Отсюда также видно, что наше исходное предположение, что все звезды в достаточно малом объеме вокруг Солнца движутся одинаково, строго говоря, не справедливо.

Во-вторых, следует уточнить, что измерения мы делаем с Земли, а не с поверхности Солнца. Хорошо известно, что Земля движется вокруг Солнца. Поэтому измеренные скорости звезд будут иметь разные значения в зависимости от сезона, и, не учитывая этого факта, мы бы получили, что и скорость Солнца по отношению к близким звездам будет иметь сезонную вариацию, что физически бессмысленно. Это есть пример влияния систематической ошибки, которая в некотором смысле является скрытой. Уйти от этой погрешности можно следующим образом: надо провести измерения в течение года (а лучше, нескольких лет). Поскольку влияние движения Земли вокруг Солнца носит периодический характер, путем усреднения измерений можно исключить влияние движения Земли.

В-третьих, как оценить ошибку ? Для этого надо выполнить более объемные исследования.

Задача № 2. Оценить среднюю скорость движения звезд из малого объема в окрестности Солнца относительно близких галактик.

Решение. Аналогично предыдущей задаче представим измеренную скорость i-ой галактики , где - скорость i-ой галактики в неподвижной системе координат. Здесь также учтено, что измерения производятся в системе отсчета, связанной с Солнцем. Далее пренебрежем собственной скоростью Солнца (т.е. предположим, что - это предположение выполняется с хорошей степенью точности). Учтем теперь, что распределены хаотически, т.е. . Тогда (строго говоря, измерить удается лишь лучевую скорость галактик, но мы для упрощения изложения идеи рассуждения проводили относительно полного вектора скоростей). Оцененная таким образом скорость оказывается порядка 200 км/с (отметим, что сделанное выше предположение о малости собственной скорости Солнца выполняется). Однако придать конкретного смысла этой скорости на этом этапе не представляется возможным: это может быть как скорость вращения выделенной группы звезд вокруг центра нашей галактики, так и скорость движения нашей галактики в целом относительно группы близких галактик (как в случае с движением Солнца относительно группы близких звезд).

Литература

1. Д.Худсон «Статистика для физиков», Мир, Москва, 1967.

2. Е.С.Вентцель «Теория вероятностей», Физмат литература, Москва, 1962.

3. Дж.Джонстон «Эконометрические методы», М., Статистика, 2000.

4. Н.Дрейпер, Г.Смит «Прикладной регрессионный анализ», в 2-х томах, М., Финансы и Статистика, 2006.

5. П.Е.Эльясберг «Измерительная информация: сколько ее нужно, как ее обрабатывать?», М., Наука, 2003.

6. Дж.Тейлер «Введение в теорию ошибок», Мир, Москва, 2005.

7. С.А.Айвазян, И.С.Енюков, Л.Д.Мешалкин «Основы моделирования и первичная обработка данных», М., Финансы и статистика, 2003.

1 Впрочем, сюда еще можно добавить грубые ошибки, с которыми, естественно, следует бороться. О методах выявления измерений с грубыми ошибками и их исключении речь будет идти дальше.

2 В истории науки неоднократно случались ситуации, когда определялись какие-то величины и их среднеквадратичные ошибки, которые были существенно меньше значений величин, принимавшихся за истинные, а затем более точные исследования приводили к новым истинным значениям, которые отличались от предыдущих, причем различия превышали погрешности.

PAGE \* MERGEFORMAT 1


- Q

+Q

Q

СТАТИСТИЧЕСКИЕ МЕТОДЫ В АСТРОФИЗИКЕ