Секвенирование (Генная инженерия)

Страница 4

Белки подразделяются на три функциональные группы: оболочечные (G ,M) нуклеокапсидный (N) и РНК-полимеразный комплекс, состоящий из L и NS белков. Белки N,NS и L вместе с вирионной РНК образуют нуклеокапсид , который окружен мембраной, содержащей трансмембранный гликопротеин G , ответственный за антигенные свойства вируса. Существование псевдогена y между G и L цистронами , является отличительной особенностью вируса бешенства от вируса везикулярного стоматита.

N-ген лиссавирусов, как показало клонирование и секвенирование, является наиболее консервативным по своей структуре из всех генов вируса бешенства.

Mannen K.et al, в 1991 г. определили большую зависимость различий в N-гене от географической локализации, чем от хозяйской специфичности. В Онтарио вирус бешенства, который описан как единственный «Арктический» тип, разделили на четыре основных типа. Эти типы филогенетически разветвляются на две основные ветви , одна из которых состовляет один тип, вторая три основных типа, что отражает историческое передвижение вируса в регионе от середины к концу 50-х гг. Эпизоотия передвигалась на юг Онтарио с севера и Квебека. Изменения в последовательности N-гена , определенных для 4-х вирусных типов, могут представлять генетический маркер для более существенных изменений в других частях вирусного генома.

Kissi et al представили первое сравнение между генотипами и молекулярными различиями N-гена внутри первого генотипа. Филогенетический анализ гена нуклеопротеина 82-х лиссавирусов подтвердил существование шести генотипов лиссавирусов, и также выделил изоляты бешенства первого генотипа в отдельные генетические линии. Изоляты с меньшей чем 80% нуклеотидной и 92% аминокислотной гомологией относятся к различным генотипам. Два коротких региона из 400 нуклеотидов, кодирующих аминоконец N-протеина, и 93 нуклеотида, кодирующих N-NS-регион, могут быть использованы для определения географического распределения основных вирусных линий. Выявлено два региона, имеющих наименьший уровень гомологии: участок длиной 199 пар оснований (нуклеотиды от 1080-го до 1278-го) и более протяженный фрагмент, расположенный между 99-м и 405-м нуклеотидами. Филогенетическое дерево построили, используя пакет программ MEGA. С их помощью получили дерево с ветвями, делящимися на 6 кластеров, которые соответствуют 6-ти генотипам. Сравнение изолятов показало, что в генетическом плане наиболее близкими оказались 4-й и 5-й генотипы, у которых уровень различий составил 79,8% (нуклеотидный уровень) и 93,3% (аминокислотный уровень) [Duvenhage virus (4) и EBL1(5)]. Внутри генотипа 1 наименьшее сходство среди изолятов из Азии и Латинской Америки – 83,3%; и наибольшее сходство в изолятах из Африки и Латинской Америки – 92,2%.

Филогенетический анализ изолятов 1-го генотипа вируса бешенства.

Kissi et al. идентифицировали 11 филогенетических линий, взятых в соответствии с их географическим происхождением и видом хозяина: Африка 1а, Африка 1в, Африка 2, Африка 3, Азия, Арктика, Европа/Средний Восток, Латинская Америка 1 и 2 и две группы вакцинных штаммов. Филогенетическое дерево строилось на основании сравнения фрагмента или целого N-гена.

Этот анализ позволил более точно определить циркуляцию по зонам и установить происхождение и распространение бешенства для некоторых линий, которые, возможно, произошли независимо на этом континенте от различных предшественников. Хотя циркуляция африканских вирусов 1а и 1в более отлично от вирусов, распространенных в Европе и Среднем Востоке, однако была выявлена генетическая связь между ними, что свидетельствует об общем предке.

Выяснено, что накопление большинства нейтральных мутаций в географически разделенных вирусных популяциях привело к значительным расхождениям в нуклеотидной последовательности гена нуклеопротеина.

При исследовании гена нуклеопротеина 11-ти вирусов бешенства японскими учеными было выявлено 9 отдельных кластеров по гомологии менее 90% региона N-гена. Тем самым они подтвердили данные филогенетического анализа, полученные Kissi et al.

Таким образом, варианты вируса бешенства, сгруппированные в соответствии с их географическим распределением, могут быть использованы для исследования эволюционного развития вируса бешенства.

Принципы и методы ОТ-ПЦР.

Обратно-транскриптазная ПЦР состоит из двух этапов:

1- синтез комплементарной ДНК с помощью фермента обратной транскриптазы и затравки

2- амплификация гена или его фрагментов при помощи фермента термостабильной ДНК-полимеразы и коротких олигонуклеотидных 20-30-членных затравок (праймеров), комплементарных 3'- концевым последовательностям антипаралельных цепей ДНК гена. Повторяя стадии денатурации, отжига праймеров и полимеризации (достройка праймеров) 30-35 раз за 2-3 часа получают миллионы копий специфического участка генома вирусов и бактерий.

Анализ ПЦР-продуктов.

Аликвоты ПЦР-продуктов разрезают соответствующими ферментами и разделяют в 1%-м агарозном геле. Учет результатов проводят по размеру ПЦР-продуктов с помощью электрофореза в агарозном геле. На основании размеров и расстояний пробегов маркерных ДНК вычисляют размеры исследуемых фрагментов ДНК.

4. КОМПЬЮТЕРНЫЙ АНАЛИЗ ГЕНЕТИЧЕСКИХ ТЕКСТОВ.

Выявление и анализ закодированных в последовательностях функци­ональных сигналов требует применения современных методов информа­тики - качественных баз данных с современными средствами управле­ния, новейших методов распознавания образов, статистических иссле­дований, применения специальных алгоритмов для преодоления возни­кающих вычислительных трудностей.

В настоящее время исследование функциональных свойств расшифро­ванных последовательностей нуклеиновых кислот - это новый раздел молекулярной биологии, граничащий с информатикой, с одной стороны, и молекулярной биофизикой - с другой. Можно с уверенностью ска­зать, что в настоящее время анализ последовательности биополимера позволяет извлечь лишь очень небольшую долю закодированной в ней информации. В конечном счете точное выявление функциональных осо­бенностей в последовательностях нуклеиновых кислот будет возможно только после детального исследования соответствующих реакций, осу­ществляемых нуклеиновобелковыми комплексами.

Для оперативной работы с последовательностями создаются специ­альные банки данных. В банке в доступном для пользователя виде хранится каждая рас­шифрованная последовательность и ее паспорт, в котором указаны различные сведения о ней. Это сведения об организме, из которого выделена последовательность, о документе, где она описана, о рас­положении на ней регуляторных участков и белках, которые она кодирует и т.д. В настоящее время созданы три большие базы данных пос­ледовательностей нуклеиновых кислот: "Genbank" (Лос-Аламос, США - более 30 млн. нуклеотидов), база данных нуклеотидных последова­тельностей Европейской молекулярно-биологической лаборатории (EMBL, Гейдельберг, ФРГ - более 30 млн. нуклеотидов) и "Генэкспресс" (СССР, ВИНИТИ-ИМГ АН СССР - более 11 млн. нуклеотидов). Из­вестны также несколько белковых баз данных, наиболее представи­тельной из которой является MBRF-PIR (США). Эти базы данных расп­ространяются на различных носителях - магнитных лентах и дисках, на оптических дисках.

Кроме построения филогенетических древ геномов вирусов компьютерный анализ применяется при поиске гомологий, распознавании кодирующих областей, функциональных сигналов, физическом (рестрикционном) картировании молекул ДНК и для предсказания вторичных структур РНК.

Сейчас в мире создано большое количество программ ( обычно организованных в пакеты ) , предназначенных для анализа последовательностей нуклеиновых кислот и избавляющих исследователей от многих трудоёмких рутинных операций , в том числе: подсчёт числа моно -, ди – и тринуклеотидов, перевод нуклеотидной последовательности в аминокислотную и т.д.

Все программы условно делятся на два класса: общего назначе­ния и специального. Первые осуществляют ряд_ наиболее распростра­ненных операций по сбору и анализу последовательностей и позволя­ют: вводить и редактировать новые последовательности, считывать с помощью сканирующих устройств информацию непосредственно с ав­тографов или гелей', находить участки узнавания эндонуклеаз рестрик­ции и представлять результаты в удобном (табличном или графиче­ском) виде, находить участки с элементами поворотной и зеркальной симметрии (палиндромы), транслировать нуклеотидную последова­тельность в белковую во всех трех рамках считывания, сравнивать две последовательности методом точечных матриц гомологии, сравнивать новую последовательность со всеми данными Ген Банка, находить участки, обогащенные теми или иными нуклеотидами, вычислять гипотетическую температуру плавления ДНК, осуществлять автоматиче­скую сборку секвенированных фрагментов в единую структуру - моле­кулу ДНК, транслировать белковую последовательность в нуклеотидную с учетом неравномерности использования кодонов-синонимов, оп­ределять молекулярную массу НК и белков, предсказывать вторичную структуру белков, вычислять свободную энергию образования шпилек и др.