Тестирование статистических гипотез

Тестирование статистических гипотез

  1. Шаг первый: нуль-гипотеза

Это тот страшный момент, в который лично я не могла въехать довольно долго, поэтому очень обрадовалась, когда на первой лекции все подхватили его на лету. В чём собственно проблема?

Как уже было сказано в тексте предыдущей лекции, биология говорит на языке теории вероятности. То есть, при тестировании гипотезы наша основная цель – доказать, что данная гипотеза работает с высокой вероятностью. Но вот в чём загвоздка. Мы не можем учесть абсолютно все случайные переменные – всех особей, все гены, все величины и т.д. – для которых это действительно так. Как в случае с доказательством того, что параллельные прямые не пересекаемся – мы не можем поэтапно доказывать, что каждая из пар точек на этих прямых не совпадает. Но мы можем доказать, что если совпадёт хоть одна пара, обратное доказываемому утверждение будет неверно. В случае с тестированием гипотезы – мы можем доказать, что гипотеза работает с высокой вероятностью тогда, когда её противоположность – нуль-гипотеза работает с вероятностью низкой.

Итак, все доказательства в биологии производятся от противного. Поэтому шаг первый в тестировании гипотезы – формулирование нуль-гипотезы.

  1. Шаг второй: планирование

Итак, всю необходимую теоретическую базу под исследование мы подвели. Ура! Осталось решить, что же мы всё-таки будем делать руками с нашим материалом, как и откуда брать данные.

Для тестирования гипотезы существует два способа сбора данных – наблюдение и эксперимент.

Наблюдение

Разберём на примере. Рассмотрим два способа рассказать об одном и том же событии.

На перерыве между парами один студент вдохновенно рассказывал: «Поздно вечером я устало брёл по улице, как вдруг моё внимание привлекла интересная сцена. В глубине двора на мусорном бачке, как на пьедестале, восседала молодая кошка, а на земле, у её ног, бесстрашно сражались двое её поклонников. Шерсть стояла дыбом на их выгнутых спинах, хвосты держали они трубой, …»

«Полевой дневник лаборанта Пупкина В. И. 14 марта 2011 год, 19:30. Во дворе между Большим пр. Петроградской стороны и ул. Большой пушкарской были замечены три особи подвида Felis silvestris catus, самка и два самца. Самка некрупная, молодая, расцветка – серая в чёрную полоску, белый живот и перчатки, гладкошёрстная. Двое крупных самцов, один - возрастом около трёх лет, чёрный, гладкошёрстный, второй более молодой, рыжий с палевой грудью, длинношёрстный. Проявлялось типичное для данного сезона брачное поведение – самцы дрались за право спариться с самкой.»

Думаю, определить, какое из данных наблюдений является научным, не составит труда. Но давайте разберёмся поконкретнее, чем они принципиально отличаются, и что необходимо учитывать нам при проведении исследований.

Во-первых в первом случае мы видим устное изложение. Как мы уже выяснили, любые полученные данные должны быть общедоступными в любой момент любому коллеге. И для этого их разумеется необходимо записать. И так, прежде всего, научное наблюдение фиксируется.

На что нам ещё следует обратить внимание. В первой истории автор массу внимания уделяет собственным субъективным ощущениям, литературным подробностям. Опять же, факт того, что коты сражались «бесстрашно» - его личное умозаключение, ничем не подкреплённое. Пупкин В. И. же излагает только сухие факты, которые видел он, и на его месте увидел бы любой другой психически здоровый человек с нормальным зрением. Излагает он эти факты словами, которые для всех обозначают одно и то же явление или понятие. Как бы субъективно кто его ни воспринимал – в определённый момент всё научное сообщество договорилось называть «рыжим» вполне конкретную масть котов, не зависящую от цветовосприятия. И даже свои умозрительные заключения он взял не с потолка, и сможет подкрепить их общепринятыми доказательствами. Итак, научное наблюдение должно фиксироваться объективно.

Третий момент. Наш лаборант точно учёл все составляющие наблюдаемого явления – дату, время, место, вид особей, их возраст и пол. Таким образом, если провести целый ряд подобных наблюдений, мы сможем вывести из них определённые закономерности, такие как «коты размножаются в марте», или «на Петроградской стороне самцов данного вида больше, чем в Красногвардейском районе, где чаще встречаются самки». Его полевой дневник грамотен и доступен для понимания. К тому же там отсутствуют любые, кроме общепринятых, сокращения.

Ну и наконец четвёртое – если кто-либо не сможет разобраться в полевике Пупкина, человек всегда будет знать, у кого уточнить, потому что полевой дневник, как и положено документу, протоколирующему научное наблюдение, подлежал авторизации.

Подводя итог – основные составляющие научного наблюдения: фиксированность и объективность. Основные правила фиксации наблюдения: грамотность и доступность, точность, авторизация. Также хорошим тоном считаются оставленные поля для пометок.

Эксперимент

В первую очередь необходимо понять, чем же он принципиально отличается от наблюдения. В первую очередь следующим: при наблюдении исследователь старается достичь максимума невмешательства в происходящее явление и зафиксировать его точно таким, каким оно является в естественной среде. Данный подход может оказаться неудобным по многим причинам. В первую очередь, он оставляет слишком много неучтённых факторов. Он не позволяет нам точно оценить конкретное влияние конкретного фактора в конкретных условиях. К тому же естественные условия, за которыми ведётся классическое научное наблюдение по принципу невмешательства, совершенно неконтролируемы, а потому не позволяют нам воссоздать нашу умозрительную модель (а ведь мы помним, что постановка гипотезы начинается с построения модели) необходимое количество раз с удобоваримыми для исследования параметрами. Для того, чтобы справиться со всеми этими препятствиями, учёные ставят эксперименты – максимальное сознательное вмешательство субъекта в объект исследования по строго заданным правилам.

У каждого эксперимента есть дизайн – весь спектр его параметров и характеристик. При планировании дизайна эксперимента должны учитываться все особенности изучаемых объектов и факторов, а также особенность самой поставленной гипотезы. В первую очередь для разных гипотез используются совершенно разные статистические критерии, в зависимости от того, что мы хотим доказать – достоверность различий, наличие корреляции, зависимость вероятности одного явления от возникновения другого. Но эти нюансы мы будем разбирать уже на примере каждого конкретного статистического критерия. Есть два момента, общих для всех экспериментов.

Для того, чтобы к ним прийти, разберём сначала криворукий эксперимент, а потом докажем, что он криворукий. Вот уфологи решили накропать статейку в газетёнку и поставили «эксперимент». Посадили цветочек и положили рядом с цветочком магнитик, а цветочек возьми да и начни расти, цвести и радоваться жизни. «Ура!» кричат уфологи, мы доказали положительное влияние магнетизма на живую материю.

Ну конечно. А кто сказал, что этот цветочек начал резко расти именно потому, что рядом с ним положили магнитик? Может его переставили со стола на подоконник, ближе к свету? А может стали чаще поливать? А может просто весна началась, и световой день стал длиннее? Масса неучтённых факторов. Что же с ними делать?

Решение довольно простое. Каждый эксперимент состоит из двух частей, в англоязычной литературе их зовут treatment и control. В этих частях объекты помещаются в абсолютно идентичные условия. Но. На treatment влияет изучаемый фактор, а на control – нет. Таким образом мы можем пренебречь влиянием неучтённых факторов, ведь если контроль достоверно отличается, значит на treatment повлияло именно то, что интересует нас.

Второй косяк уфологов. А кто нам сказал, что быстрый рост – не есть индивидуальная особенность данного конкретного цветка? Это ещё один неучтённый фактор, справиться с которым контроль нам уже не поможет. Значит под фактор надо подставить несколько разных цветков, и чем больше, тем лучше – тем меньше в случае косячности какого-нибудь из них будет среднее отклонение, тем однороднее будет наш treatment.

Подводя итог, две необходимых составляющих любого эксперимента – контроль и повторности.

  1. Шаг третий: сохранение результатов

Как я уже упоминала в лекции первой, один из языков, на которых говорит биология – это язык баз данных. Его грамматика довольно проста, но всё же стоит разобраться, почему она именно такая.

Возьмём для примера многолетний мониторинг какого-нибудь сообщества, например какого-нибудь пруда. Из года в год учитывались – динамика его температуры, жёсткости и pH воды, количество всей живности, которая его населяет, etc, etc. Но вот в один прекрасный день решил кто-то, поглядев на данные свежим глазом – кажется у нас тут наклёвывается корреляция между количеством личинок подёнок и жёсткостью воды. Допустим, пруд уже давно превратился в болото, и понаблюдать за всем in situ возможности уже нет. К тому же для того, чтобы удостовериться в наличии такой зависимости, нужно конкретные данные выцепить из общей базы. Из этого вытекает то, какой собственно база данных должна быть, и какой задаче она отвечает.

Во-первых, база данных нужна, чтобы не упустить такие хрупкие и нестабильные объекты реальности, как живые организмы. Да и изобрести машину времени, чтобы посмотреть ещё разок, какая же была pH у воды пятнадцать лет тому назад, пожалуй есть заколачивание микроскопом гвоздей. Чтобы не упустить ускользающую реальность, её нужно всего-навсего виртуализировать. Именно для этого БД и существуют. Согласитесь, хранить маленькую флешку гораздо удобнее, чем полный шкаф препаратов или проб воды. Мы снова переводим всё в вид математической модели, возвращаясь к тому, с чего начали. Теперь полученными данными мы можем вертеть как угодно и сколь угодно долго. А для того, чтобы ими вертеть, они должны быть записаны так, чтобы их можно было, во-первых, быстро найти, а во-вторых легко комбинировать.

Итак, основная задача БД – упорядочивание информации в таком виде, чтобы ей мог воспользоваться кто угодно, когда угодно, в каких угодно сочетаниях. А также быстрота поиска и группировка данных и виртуализация процесса.

Каким образом можно сделать так, чтобы БД отвечала поставленным целям?

Элементарной единицей БД является запись. И каждая запись обладает двумя параметрами – порядковым номером (номер строки) и названием значения данной записи (название столбца – «Длина», «Время», «Вес» и т.д.). Это позволяет нам группировать данные как с точки зрения величин, к которым привязаны значения, так и с точки зрения времени и количества измерений.

Для быстроты поиска и удобства группировки столбцы должны иметь строгий порядок. Название у каждого столбца уникальное – иначе через пару лет ты ни за что не разберёшь, почему в твоей БД разные группы величин называются одинаково . По той же причине каждый столбец с уникальным названием должен содержать записи одного значения. Именно поэтому объединённые ячейки – несусветная гадость, потому что они намертво спаивают два разных столбца, лишая их к тому же их уникальности. На пересечении каждой строки и каждого столбца может находиться только одно неделимое значение. Пустые ячейки – это зло, потому что, опять же, лет через пять ты не поймёшь – ты забыл туда занести данные, или это оно так специально? А тем более этого не поймёт никто другой. Ну и наконец, для того, чтобы это получилось, нужно избегать принципа ДДПР – «давай-давай, потом разберёмся». Внимательно, аккуратно, дотошно, занудно :3

  1. Шаг четвёртый: приступаем к обработке данных.

И вот тут – аллилуйя – и начинается собственно статистика. А давайте-ка ещё раз внимательно подумаем, для чего она нужна.

Вот перед нами, например, есть вид Ratus ratus. И мы хотим понять, как у представителей этого вида длина хвоста зависит от возраста. Увы и ах – всех крыс мира мы изучить не можем. Поэтому нам необходимо создать некую приближённую математическую модель. Все крысы мира в данном случае будут являться генеральной совокупностью. А изучаемые нами – выборкой. Итак, основная задача статистического анализа – оценить генеральную совокупность по выборке. А вот как это делается – мы с вами обсудим на следующей лекции

Тестирование статистических гипотез