Реферат: на тему применение информационных технологий в молекулярно-ген
Название: на тему применение информационных технологий в молекулярно-ген Раздел: Остальные рефераты Тип: реферат | ||||||||||||||||||||||||||||||||
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Выпускная работа по «Основам информационных технологий» Магистрант кафедры генетики Мишкова Ольга Руководители: к.б.н., доцент Гринев Василий Викторович, ст. преподаватель Шешко Сергей Михайлович Минск – 2010 г. СПИСОК ОБОЗНАЧЕНИЙ КО ВСЕЙ ВЫПУСКНОЙ РАБОТЕ. 3 РЕФЕРАТ НА ТЕМУ «Применение информационных технологий в молекулярно-генетических исследованиях». 4 Глава 1 Информационные ресурсы в сфере генетики и молекулярной биологии. 5 1.2.2. Программное обеспечение. 11 Глава 2 Образец применения информационных технологий в генетике и молекулярной биологии. 12 Список литературы к реферату. 16 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ К РЕФЕРАТУ.. 17 ИНТЕРНЕТ РЕСУРСЫ В ПРЕДМЕТНОЙ ОБЛАСТИ ИССЛЕДОВАНИЯ.. 18 http://www.ncbi.nlm.nih.gov/pubmed. 18 http://blast.ncbi.nlm.nih.gov/Blast.cgi 18 http://www.scirus.com/srsapp/ 20 http://highwire.stanford.edu/ 22 http://mfold.rna.albany.edu/?q=DINAMelt. 22 ДЕЙСТВУЮЩИЙ ЛИЧНЫЙ САЙТ В WWW... 23 ТЕСТОВЫЕ ВОПРОСЫ ПО ОСНОВАМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ 26 ПРЕЗЕНТАЦИЯ МАГИСТЕРСКОЙ ДИССЕРТАЦИИ.. 28 СПИСОК ЛИТЕРАТУРЫ К ВЫПУСКНОЙ РАБОТЕ. 31
РЕФЕРАТ НА ТЕМУ «Применение информационных технологий в молекулярно-генетических исследованиях» В настоящее время информационные технологии глубоко внедрились во все сферы науки, в том числе и биологию. С каждым годом объем информации, получаемый путем применения новейшего оборудования и сложных исследовательских методик, увеличивается в геометрической прогрессии. Непрерывный поток данных требует обработки и систематизации, которую уже невозможно осуществлять только посредством умственной деятельности научных сотрудников. В этом случае огромные надежды возлагаются на постоянно совершенствующиеся компьютерные технологии. Обширные возможности по систематизации, хранению и обработке информации позволяют сократить время, затрачиваемое на получение результатов и ускорить процессы, связанные с накоплением и применением новых данных. Таким образом, прогресс информационных технологий подталкивает и стимулирует к развитию исследования в других областях. Неоценимо значение компьютерных и информационных технологий в сфере генетики и молекулярной биологии. Повсеместное применение и совершенствование таких методик, как секвенирование, SSCP, картирование и многих других привело к лавинообразному накоплению данных о структуре генов, о последовательностях ДНК, РНК и белков. Возможность свободного доступа к информации подобного рода имела огромные последствия для развития этих сфер биологической науки:сокращение времени на подготовительные этапы исследовательских работ; обмен информацией между лабораториям разных стран; проверка информации и ее уточнение в процессе использования. На современном этапе развития науки создано огромное количество баз данных, располагающих информацией о ДНК, РНК, белках, Интернет-ресурсов, содержащих публикации по самым разным темам, а также пакетов программ, доступных как в онлайн, так и оффлайн режиме, и призванных обеспечить работу со специфической информацией. В последнее время наблюдается тенденция к глобализации научных исследований и объединению научных лабораторий всего мира в единые консорциумы, что в еще большей степени увеличивает производительность работы и позволяет оперировать фантастически большим количеством информации. Нельзя не признать, что такая ситуация была бы невозможна без внедрения в сферу науки информационных технологий. Глава 1 1.1 Исторический обзор развития информационных технологий в сфере биологии. Примерно в середине 50-летия, отделяющего нас от открытия структуры двойной спирали ДНК, в молекулярной биологии произошел мощный технологический прорыв: Ф. Сэнгер, Ф. Максам и В. Гильберт предложили методики быстрого секвенирования ДНК, то есть установления последовательности нуклеотидов в геноме. Уже в 1978 г. было опубликовано 200 статей, описывавших секвенированные нуклеотидные последовательности, затем объем этих данных стал расти в геометрической пропорции. Были сделаны наблюдения, изменившие устоявшиеся представления о линейной последовательности генов в ДНК: перекрывающиеся гены, сплайсинг и альтернативный сплайсинг (механизм порождения множественных РНК, соответствующих одному и тому же гену), рекомбинация генов иммуноглобулинов. Существенную роль в развитии геномных подходов сыграли банки нуклеотидных последовательностей. Довольно быстро стало понятно, что невозможно сопоставлять последовательности, сравнивая вручную длинные ряды букв, приводимых на рисунках к статьям. Уже в 1979 г. было начато обсуждение того, как хранить последовательности ДНК и РНК и как обеспечивать доступ к ним. Первые выпуски банков данных GenBank (США) и EMBL (Европа) появились в 1982 г., и уже в следующем году они сыграли существенную роль в биологической работе: сходство последовательностей онкогена v-sis из вируса саркомы обезьян и фактора роста тромбоцитов, обнаруженное при сравнении новосеквенированного гена со всеми опубликованными, послужило основой для гипотезы о сходстве воздействия онкогенов и нормальных клеточных белков, экспрессирующихся на определенных стадиях жизни клетки [1]. С тех пор сравнение новой последовательности с последовательностями из банка данных стало рутинным элементом работы с любым геном, а помещение каждой новой последовательности в банк - необходимым условием журнальной публикации. Дальнейший прогресс технологии, в частности, разработка К. Муллисом в 1986 г. полимеразной цепной реакции и создание тогда же первых удовлетворительно работающих приборов автоматического секвенирования Л. Худом и Т. Хункапиллером, привел к тому, что сразу в нескольких странах началось обсуждение возможности полного секвенирования генома человека. В 1988 г. соответствующий проект стартовал в США и практически тогда же - в СССР. Уже при разработке проекта были приняты критически важные решения, оказавшие существенное влияние на дальнейшее развитие геномики. Первое из них состояло в том, чтобы секвенировать не только геном человека, но и геномы модельных организмов: нематоды Caenorhabditis elegans, плодовой мухи Drosophila melanogaster, дрожжей Saccharomyces cerevisiae, растения Arabidopsis thaliana, бактерий Escherichia coli. Bacillus subtilis и других. При выборе объектов секвенирования в основном учитывался баланс между изученностью организма и размером его генома. В результате стал возможен сравнительный анализ сразу многих геномных данных. Второе столь же важное решение состояло в том, что данные секвенирования геномов немедленно становились доступными мировому научному сообществу. В 1996 г. были сформулированы "Бермудские принципы" (названы по месту проведения конференции), согласно которым даже небольшие фрагменты геномов, полученные в рамках проекта "Геном человека" и аналогичных программ, сразу же помещались в банки данных и могли быть использованы всеми желающими. Одновременно в журналах публиковались результаты анализа больших секвенированных фрагментов геномов и целых хромосом. Такая ситуация иногда приводила к недоразумениям: группы, занимающиеся секвенированием, опасались, что кто-то другой опубликует существенные результаты на основе анализа полученных ими данных. Но когда геномные проекты начали реализовываться частными компаниями, ряд ведущих журналов отказался от требования помещать последовательности в стандартные банки данных. В середине 80-х годов прошлого века начало складываться новое научное направление, названное биоинформатикой, или вычислительной молекулярной биологией. В рамках этого направления развиваются алгоритмы для анализа последовательностей биополимеров (ДНК и белков) и их пространственной структуры, строятся модели метаболизма и регуляторных взаимодействий. Затем они применяются для решения биологических задач. Важность развития биоинформатики диктуется несколькими обстоятельствами. Самое простое из них - это объем геномной информации, делающий невозможным ее ручную обработку без использования алгоритмических методов. Современные технологии геномики и протеомики немыслимы без интенсивного применения компьютерной обработки результатов. Но дело не только в этом. Во многих случаях сопоставление геномных данных позволяет делать новые и совершенно нетривиальные выводы, которые затем могут быть проверены экспериментально. За последние несколько лет биоинформатика стала самостоятельной областью на стыке биологии и математики со своими специфическими задачами и методами их решения [2]. Она использует методы математической логики и теории алгоритмов, информационных и стохастических процессов, теории динамических игр и статистики и т.д. Самым простым компьютерным методом считается сравнение вновь полученной последовательности с уже имеющимися в банках данных. Часто оказывается, что можно найти похожий уже изученный белок, благодаря чему удается предсказать функцию нового белка. Если близкие гомологи отсутствуют, применяют более тонкие методы анализа. В частности, существуют алгоритмы поиска в белковых последовательностях трансмембранных сегментов и сигнальных пептидов, основанные на анализе статистических особенностей этих структурных элементов. Используя такие алгоритмы, можно предсказать, локализуется ли белок в цитоплазме, в мембране или секретируется из клетки. Анализ больших групп белков, имеющих одну и ту же функцию (например, АТФазную активность), позволил создать библиотеки функциональных подписей, то есть коротких аминокислотных последовательностей, разделенных вариабельными промежутками и соответствующих функциональному сайту в пространственной структуре белка. Такие подписи могут быть общими даже для белков, не демонстрирующих видимого сходства на уровне всей последовательности, и их обнаружение в исследуемом белке может указать .на биохимическую функцию последнего, даже если для него не найдется экспериментально изученных гомологов. Наибольшую силу компьютерные методы показали при анализе полных геномов: сначала бактерий (гемоглобинофильная палочка Haemophilus influenzae в 1995 г.), а вскоре - архебактерий и эукариот (дрожжи Saccharomyces cerevisiae в 1996 г.). В настоящее время доступно более ста полных геномов самых разнообразных организмов, в основном бактерий, и ясно, что подавляющее большинство из них не может быть подробно исследовано в экспериментальной лаборатории. Однако оказалось, что в общих чертах удается описать физиологию организма путем чисто компьютерного анализа его генома [3]. Такой анализ начинается с картирования генов. При этом используются статистические методы, опирающиеся на различия в свойствах белок-кодирующих и некодирующих областей, анализ сигналов на границах генов, а также сравнение с уже изученными генами. Можно считать, что задача картирования генов в геномах прокариот практически решена, в то время как точность таких предсказаний в геномах эукариот еще недостаточная, хотя есть надежда, что она будет расти по мере увеличения количества доступных для анализа геномов, находящихся в разной степени родства. К тому же появились новые методы сравнения геномных последовательностей, которые базируются на том, что белок-кодирующие гены меняются в ходе эволюции медленнее, чем окружающие их некодирующие области. При сравнении геномных последовательностей эти гены видны как островки сходства на фоне сильно изменившихся некодирующих областей. Существенно, что такой анализ (и его более простой вариант, применяемый при работе с бактериальными геномами) дает возможность обнаруживать совершенно новые гены, белковые продукты которых не имеют известных гомологов. Вслед за этим проводится функциональная аннотация белков. Оказывается, что таким образом удается детально охарактеризовать от половины до двух третей бактериального генома, функции еще 10-15% генов устанавливаются в общих чертах. Для эукариот подобные оценки труднее дать как в силу уже упомянутых проблем с картированием их генов, так и из-за наличия большого количества дуплицированных генов с одинаковой биохимической функцией, но с различной ролью в жизни клетки (например, факторов транскрипции или протеин-киназ, участвующих в различных регуляторных каскадах). Все же сделанные предсказания оказываются достаточными для предварительной метаболической реконструкции. С этой целью устанавливается соответствие между предсказанными белками и универсальной картой метаболических путей, суммирующей данные о всех химических реакциях, когда-либо наблюденных в живой клетке любого организма. Такая проекция генома на карту метаболических путей позволяет описать основные физиологические характеристики организма. Другой важный метод вычислительной геномики основан на анализе сигналов, регулирующих экспрессию генов. Опять-таки, наборы совместно регулируемых генов, как правило, образуют функционально связанные группы. Такой группой может быть метаболический путь, включающийся при недостатке какого-то вещества, система ответа на внешний раздражитель (скажем, тепловой шок) или система контроля физиологического состояния клетки (например, переход к споруляции при голодании у бацилл). Если удается выделить сигнал в последовательности ДНК, отвечающий за регуляцию подобной группы генов, то можно построить распознающее правило и искать другие гены, имеющие тот же сигнал и, стало быть, регулируемые совместно с рассматриваемой группой. Анализ регуляции важен и сам по себе, поскольку он позволяет ответить не только на вопрос: "Что клетка может делать?", но и на вопрос: "В каких условиях она это делает?″ И все же в большинстве случаев не удается построить удовлетворительно работающее правило для распознавания регуляторных сигналов. Тогда полезным оказывается одновременный анализ многих геномов. Дело в том, что наборы совместно регулируемых генов, соответствующие функциональным подсистемам, консервативны. В результате истинные регуляторные сигналы обнаруживаются перед гомологичными генами сразу во многих геномах, в то время как ложные сигналы располагаются случайным образом. Это позволяет фильтровать предсказанные сигналы на основе требования согласованности предсказаний, тем самым повышая надежность каждого отдельного сигнала. Сравнительный анализ большого числа геномов позволил выделить и описать регуляторные сигналы, консервативные даже при очень далеких сравнениях (вплоть до архебактерий) [4]. Хотя сами сигналы в разных системах (рибофлавин, тиамин, кобаламин) различны, они обладают рядом общих свойств. Например, в отличие от известных аттенюаторов, сигналы такого типа действуют на разные процессы: терминацию транскрипции (преимущественно у грамположительных бактерий) и инициацию трансляции (у грам-отрицательных бактерий). Эта модель, получившая название РНК-переключателя, затем подтвердилась в эксперименте [5]. Более того, оказалось, что образование альтернативных структур регулируется непосредственно связыванием витамина - концевого продукта метаболического пути. Аптамеры (структуры РНК, связывающие малые молекулы) были известны и ранее, но они наблюдались in vitro, исследованные же системы стали первыми примерами природных аптамеров. Сигналы такого типа найдены и у эукариот, так что, возможно, РНК-переключатель - древнейшая известная система регуляции экспрессии генов. Массовый поиск аттенюаторных регуляторных сигналов был продолжен [6]. Еще раз подчеркнем: сравнительный подход позволяет не просто описывать новые примеры уже известных объектов - функций белков, регуляторных сигналов, метаболических путей, - но и обнаруживать совершенно новые явления. Итак, сравнительный компьютерный анализ становится мощным средством в руках биолога. Существенно, что в арсенале биоинформатики много разнообразных методов, которые позволяют многократно проверять полученные результаты на их согласованность и непротиворечивость. Таким образом, факты, выявленные в ходе компьютерного анализа, могут считаться столь же надежными, как и факты, установленные в эксперименте, - разумеется, при наличии достаточных проверок и хорошем контроле. Резкая грань, проходившая ранее между предварительным теоретическим анализом и последующей экспериментальной проверкой, стирается, уступая место обычному разграничению между достоверной и недостоверной работой. А биоинформатика перестает быть прикладной областью, лишь обслуживающей экспериментальные исследования, и превращается в самостоятельное научное направление, тесно связанное с биологией. В рамках этого направления решаются такие задачи, как функциональная аннотация отдельных генов и полных геномов, метаболическая реконструкция, анализ регуляторных систем, теория молекулярной эволюции в ее многообразных проявлениях - от эволюции отдельных генов и белков до эволюции метаболических путей, регуляторных систем и целых геномов, изучение статистических свойств геномных последовательностей, предсказание пространственной структуры биополимеров по последовательностям, реконструкция начальных этапов возникновения генетической информации. Помимо геномики, в научный обиход вошли такие термины, как протеомика (анализ белков на уровне целого генома), транскриптомика (изучение экспрессии генов), метаболомика (анализ метаболизма путем одновременного измерения клеточных концентраций многих веществ). Начали говорить о наступлении постгеномной эпохи. Вычислительные методы стали не только составной компонентой любого массового исследования (поскольку без них невозможно осуществлять даже предварительную обработку и хранение данных), но и основным средством для получения из этих данных биологически содержательной информации. 1.2 Основные информационные ресурсы, применяемые в генетике и молекулярной биологии. Их можно классифицировать по содержащейся в них информации на: • библиографические; • первичных последовательностей ДНК, РНК, белков; • пространственной структуры молекул; • геномные; • тематические. В мире существует лишь несколько крупных центров, поддерживающих базы данных первых четырех типов, и большое количество организаций, содержащих базы данных по определенным темам (например, база данных по рибосомальным генам или классификации ферментов, по мутациям гена p53 или белкам Saccharomyces cerevisiae и т.д.). Основной тенденцией в развитии современных биологических баз данных можно назвать стремление к их интеграции, созданию перекрестных ссылок между ними (например, между библиографической ссылкой на статью, описывающую какой-то ген, и собственно нуклеотидной последовательностью этого гена). Такой подход позволяет быстро находить и получать исчерпывающую информацию по определенной теме. 1.2.2. Программное обеспечение. Для поиска и получения необходимой информации из биологических баз данных существует специально разработанное программное обеспечение. Как правило, поставщик базы данных предоставляет и необходимый для работы с этой базой инструментарий. Кроме этого, некоторые базы данных могут иметь копии (например, библиографическая база данных MEDLINE), доступ к которым через свои интерфейсы предлагают независимые организации. Для поиска и получения необходимой информации из биологических баз данных существует специально разработанное программное обеспечение. Как правило, поставщик базы данных предоставляет и необходимый для работы с этой базой инструментарий. Кроме этого, некоторые базы данных могут иметь копии (например, библиографическая база данных MEDLINE), доступ к которым через свои интерфейсы предлагают независимые организации. Помимо целого ряда журналов и сборников, содержащих статьи о современных научных разработках в области генетики и молекулярной биологии, существуют и электронные порталы, которые позволяют получить доступ к новейшей информации. основным недостатком таких информационных ресурсов является то, что большинство публикаций могут быть доступны только за определенное финансирование либо по предварительной договоренности. Часто практикуется такой вариант, когда медицинские и научно-практические центры менее экономически развитых стран получают право на скачивание одной или нескольких статей в день без необходимости предварительной оплаты. Обзоры литературы по конкретным темам и менее актуальные статьи обычно находятся в свободном доступе и могут быть использованы любым пользователем. Глава 2 Весьма показательным примером применения информационных технологий в генетике и молекулярной биологии является дизайн специфических праймеров для проведения ПЦР. Непосредственно проектированию самих праймеров предшествует предварительный этап построения подробной модели гена-мишени или иной последовательности нуклеиновой кислоты, которую планируется амплифицировать. Конечным результатом этого этапа является информация о сиквенсе специфического участка, предназначенного для многократного копирования с помощью ПЦР. Такого рода задача может быть эффективно решена с помощью геномных браузеров (например, UCSC Genome Browser, Ensembl) – пакетов специальных компьютерных программ, которые, используя реальные базы данных (например, RefSeq, GenBank), строят виртуальную модель целого генома, его фрагмента или отдельно взятого гена, – или же прямым обращением в соответствующие базы данных через Internet. Весьма удобной дл проектирования праймеров является программа Primer-BLAST, доступная по адресу http://blast.ncbi.nlm.nih.gov/. Удобный интерфейс делает работу в данной программе легкой и быстрой.
В специальных строках задаются такие параметры, как модельный организм и референсная последовательность, которая будет служить матрицей для создания праймеров. Автоматически разработанные программой пары праймеров появляются в рабочем окне, которое представлено выше. Для них указывается положение относительно матрицы, длина, предполагаемая температура плавления и содержание GC-пар. Само собой разумеется, что не все предложенные программой пары будут эффективны. Необходимо выполнить еще ряд манипуляций, чтобы убедиться, что праймеры не будут образовывать прочные вторичные структуры или взаимодействовать между собой. Для того, чтобы дать ответ на этот вопрос, удобно воспользоваться программами, расположенными на сайте http://mfold.rna.albany.edu/?q=DINAMelt. Во вкладках имеются такие сервисы, как Homodimer Simulations и Two State melting (hybridization). В рабочую строку вводится сгенерированный праймер, указываются пределы используемых в реакции температур, а также концентрации солей. Это приложение позволяет с точностью сказать, какова вероятность образования прочных вторичных структур для того или иного праймера. Другое приложение предусматривает возможность тестирования пары праймеров на вероятность взаимодействия друг с другом. Для успешного протекания ПЦР реакции необходимо, чтобы праймеры не взаимодействовали между собой, иначе эффективность реакции будет крайне низка. Если проверка в указанных приложениях дает утвердительные результаты, то выбранную пару праймеров можно использовать для реакции. Сложно себе представить, какими темпами развивалась бы современная биологическая наука, не будь на ее службе достижений информационных технологий. Возможность сверхбыстрого и массового анализа информации, ее накопления и обмена не только в пределах лабораторий, но в масштабах всего научного мира, позволила ускорить все процессы, которые входят в различные этапы молекулярно-генетических исследований. Дальнейшее совместное развитие науки и информационных технологий обещает прогрессивный скачок не только в количественном, но и в качественном аспекте биологической науки. 1. Doolittle R.F., Hunkapiller M.W., Hood L.E. et al. Simian sarcoma virus oncogene, v-sis, is derived from the gene (or genes) encoding a platelet-derived growth factor//Science. 1983. V. 221. P. 275-277. 2. Koonin E.V., Galperin M.Y. Sequence-Evolution-Function: Computational approachers in comparative genom-ics. Kluwer Academic Press, 2003. 3. Vitreschak А.А., Rodionov DA., Mironov А.А., Gelfand M.S. Regulation of riboflavin biosynthesis and transport genes in bacteria by transcriptional and transia-tional attenuation // Nucleic Acids Research. 2002. Т. 30. P. 3141-3151. 4. Winkler W.C., Cohen-Chalamish S., Breaker R.R. An mRNA structure that controls gene expression by binding FMN // Proc. Natl. Acad. Sci. USA. 2002. V. 99. P. 15908-15913. 5. Гельфанд М.С., Миронов А.А. Вычислительная биология на рубеже десятилетий // Молекулярная биология. 1999. Т. 33. С. 969-984. 6. Гринев В.В. Введение в технику полимеразной цепной реакции : метод. пособие к лабораторным занятиям по специальному практикуму для студентов биол. фак. // Минск : БГУ, 2008. – 48 с. 7. Любецкая Е.В., Леонтьев Л.А., Гельфанд М.С., Любецкий В.А. Поиск альтернативных вторичных структур РНК, регулирующих экспрессию бактериальных генов // Молекулярная биология. 2003. Т. 37. № 5. ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ К РЕФЕРАТУ E EMBL, 3, 4, 5, 9, 10, 16, 20, 21 G GenBank, 3, 4, 5, 6, 8, 10, 12, 21, 22, 25 M MEDLINE, 2, 11, 20 P Primer-BLAST, 12 R RefSeq, 5, 11, 12, 25 S SSCP, 3, 4 U UCSC Genome Browser, Ensembl, 11, 12 Г ген, 5, 6, 11, 12, 19, 25 Д ДНК, 3, 4, 5, 6, 8, 10, 12, 21, 22, 25 П ПЦР, 3, 12, 15, 20 Р РНК, 3, 4, 5, 9, 10, 16 С секвенирование, 4, 5, 6, 25
http://www.ncbi.nlm.nih.gov/pubmed Pubmed является самой популярной интернет базой ссылок на биологическую и медицинскую литературу. Она содержит примерно 20 млн ссылок на статьи из биологических журналов, литературу из национальной медицинской библиотеки США и он-лайн книги. Как правило, для каждой статьи (книги) приводится название, фамилии авторов, год публикации, название журнала и издательства, аннотация и ссылка на сайт издательства, по которой можно найти электронную версию статьи или книги. Кроме того, для каждой статьи эта база предлагает список статей сходной тематики или содержащие ссылку на рассматриваемую статью. Pubmed позволяет осуществлять поиск по ключевым словам, имени и инициалам одного или нескольких авторов, году публикации, названию журнала, а также по комбинации этих характеристик. Pubmed предоставляет пользователям и ряд дополнительных возможностей. Перейдя по ссылке My NCBI, можно создать свой аккаунт, в котором можно завести и редактировать свою коллекцию ссылок, а также сохранять поиск с возможностью получать на электронную почту обновление его результатов. С помощью Pubmed можно сохранять ссылки в формате, позволяющем импортировать их в программы управления библиографической информацией (например, Bibus, JabRef, CiteULike и др.). Кроме того, имеется текстовое и анимированное руководство по пользованию базой. http://blast.ncbi.nlm.nih.gov/Blast.cgi BLAST (Basic Local Alighnment Search Tool) − это еще одна поисковая система, предоставляемая сайтом национального центра биотехнологической информации NCBI. База содержит нуклеотидные последовательности 1400 прокариотических геномов и 225 геном эукариот. С помощью BLAST можно осуществлять поиск конкретной нуклеотидной последовательности во всех или в выбранных геномах, представленных в базе. В таком случае пользователь получает информацию о том, в геноме каких организмов встречается искомая или схожая с ней последовательность, на какой хромосоме, в каком гене или межгенном участке она находится и каковы ее координаты, а также степень соответствия искомой и найденной последовательности. Также BLAST позволяет искать белковые молекулы по последовательности аминокислот или нуклеотидов и нуклеотидные последовательности (гены) по аминокислотной последовательности. Кроме поиска нуклеотидных или аминокислотных последовательностей, BLAST предоставляет возможности для разработки ПЦР праймеров для определенной последовательности нуклеотидов; выравнивания 2х и более нуклеотидных последовательностей; поиска консервативных доменов в нуклеотидных последовательновтях и других операций. (MEDical literature analysis and retrieval system onLINE) - база данных, разработанная National Lybrary of Medicine, которая содержит библио-графические ссылки (автор, название, журнал и резюме) в области медицины, молекулярной биологии и биохимии. Таким образом, для большинства биоло-гов, работающих в области молекулярной биологии или генетики, MEDLINE сегодня является первым и наиболее удобным источником библиографической информации. Кроме этого, MEDLINE интегрирована с другими базами дан-ных, что делает ее использование весьма эффективным. Существует несколько удобных WWW интерфейсов для работы с MEDLINE. Среди них в первую очередь рекомендуются WWW Entrez и PubMed. Из прочих интерфейсов следует выделить BioMedNet и HealthGate. Все из перечисленных интерфейсов имеют подробные инструкции по использованию, которые настоятельно рекомендуется изучить для эффектив-ного использования системы. (Protein DataBank) - коллекция экспериментально определенных 3D-структур биологических макромолекул. Раньше содержала и теоретические модели, но начиная с июля 2002 года в основном депозитарии хранятся только экспериментально определенные структуры (рентгеноструктурным, ядерно-агнитнорезонансным и др. методами). Теоретические структуры выделены в отдельную подбазу, которая доступна для перекачки по FTP. SWISS-PROT База данных, содержащая аннотированные аминокислотные последовательности, транслированные с нуклеотидных последовательностей EMBL; адаптированные последовательности из PIR; а также последовательности, опубликованные в литературе и присланные непосредственно самими авторами. Последовательность помещается в SWISS-PROT только в случае, если имеется достаточно информативное описание кодируемого ею пептида. Содержит высококачественные неизбыточные аннотации, перекрестные ссылки на другие родственные базы данных (EMBL, Prosite, PDB). Каждая аннотация содержит описание функции белка, его доменной структуры, особенностей пострансляционной модификации, различные варианты. Имеется неаннотированное приложение (TREMBL). TREMBL (TRanslated from EMBL) – база данных, в которую помещаются последовательности, кодирующие недостаточно описанные пептиды, для того чтобы обеспечить доступ к последовательности до тех пор, пока не накопится достаточно информации для перевода этой последовательности в SWISS-PROT. Практическая молекулярная биология. Сайт является незаменимым для биохимиков, генетиков, микробиологов и молекулярных биологов. Это крупнейшая биологическая база данных. Сайт содержит подробный справочник, который состоит из наиболее важных разделов. Здесь можно найти руководства и рекомендации по выполнению тех или иных операций, подробное описание методов исследования (работа с бактериями, бактериофагами, эукариотическими организмами, дигибридные системы, методы выделения и анализа ДНК про- и эукариотических организмов, работа с белками), методики и расчеты для приготовления растворов, подбор необходимых для исследования ферментов и реактивов. Можно следить за свежими публикациями. Имеются обзоры различных биологических ресурсов и программ, а также ссылки на биологические журналы и гранты биологического профиля. Внимание уделяется также образованию и образовательным ресурсам. Имеются сведения о компаниях и русскоязычных институтах биологического профиля, а также ссылки на полезные web-ресурсы. Scirus – наиболее полная поисковая система для ученых в Интернете. Основанный на последних поисковых технологиях, он ищет более, чем в 300 миллионах определенных для науки Web-страницах, позволяя пользователям быстро находить: • Научные, медицинские и технические сведения; • Последние публикации; рецензируемые журналы; патенты и журналы, которые обычно пропускают другие поисковые системы. • Поисковик предлагает уникальные функциональные возможности для ученых и исследователей • Эта поисковая система обращает внимание только на те Web-страницы, которые содержат научную информацию. Scirus поможет быстро определять местонахождение научной информации в Интернете: отфильтровывает ненаучные сайты; находит рецензируемые статьи формата PDF и файлы PostScript, которые являются часто невидимыми для других поисковиков; ищет глубже чем другие поисковые системы, показывая таким образом нужную информацию. С Scirus, можно: • выбрать диапазон предметных областей для поиска; • сузить ваш поиск по конкретному автору, журналу или статье; • ограничить поиск диапазоном даты; • найти информацию о научных конференциях, резюме и патентах; • усовершенствовать, настроить и сохранить результаты поиска. Информационный проект, поддерживаемый русскоязычным биологическим сообществом. Здесь можно найти руководства и рекомендации по выполнению тех или иных операций, подробное описание методов исследования (работа с бактериями, бактериофагами, эукариотическими организмами, дигибридные системы, методы выделения и анализа ДНК про- и эукариотических организмов, работа с белками), методики и расчеты для приготовления растворов, подбор необходимых для исследования ферментов и реактивов. Можно следить за свежими публикациями. Имеются обзоры различных биологических ресурсов и программ, а также ссылки на биологические журналы и гранты биологического профиля. На этом сайте есть форум для его пользователей, в котором можно получить ответы на многие интересующие вопросы, касающиеся материалов представленных на данном сайте. Этот сайт секции библиотеки Стэнфордского университета предлагает вниманию пользователей огромную базу материалов, которые можно загрузить бесплатно в полном объеме. Источниками предлагаемых статей являются 975 журналов. Читатели имеют возможность доступа к полным текстам почти 1 435 924 статей, которые перед публикацией получили рецензию экспертов. Возможен быстрый поиск и расширенный поиск (по авторам статей, названиям, цитатам, ключевым словам и т.д.). http://mfold.rna.albany.edu/?q=DINAMelt. Программа, призванная обеспечить эффективность автоматического дизайна праймеров. Встроенные приложения позволяют оценить не только вероятность образования вторичных структур при заданных условиях реакции, и предположить, насколько возможно взаимодействие между праймерами одной пары. Позволяет учитывать такие параметры, как концентрации солей и рабочие температуры, при которых будет осуществляться реакция. Наиболее удобный браузер для дизайна праймеров. Позволяет использовать уже готовые варианты, а также генерировать праймеры с нуля, учитывая разнообразные параметры и максимально приближая результат к требуемому. Чаще всего программа подбирает не один, а несколько возможных вариантов, которые в дальнейшем можно проверить и выбрать самые подходящие. http://www.mischkova-olga.narod.ru магистрантки биологического факультета Мишковой О.А. специальность биология
ТЕСТОВЫЕ ВОПРОСЫ ПО ОСНОВАМ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ <questiongroup groupname="121BF-2" no="121" mark="1" amountrate="1"> <questions> <question type="close"> <text>При дигибридном скрещивании и независимом наследовании признаков у родителей с генотипами AABb и aabb в потомстве наблюдается расщепление в соотношении?</text> <answers type="request"> <answer id="1" right="0"><9:3:3:1></answer> <answer id="2" right="0"><1:1:1:1></answer> <answer id="3" right="0"><3:1></answer> <answer id="4" right="1"><1:1></answer> </answers> </question> </questions> </questiongroup> Вопрос по общему курсу <questiongroup groupname="121BF-2" no="621" mark="1" amountrate="1"> <questions> <question type="close"> <text>Для кодирования цвета фона web-страницы используется атрибут bgcolor="XXXXXX", где в кавычках задаются шестнадцатеричные значения интенсивности цветовых компонент в 24-битной RGB-модели. Какой цвет будет у страницы, заданной тегом <body bgcolor="#00FF00">?</text> <answers type="request"> <answer id="1" right="0"><белый></answer> <answer id="2" right="1"><зеленый></answer> <answer id="3" right="0"><красный></answer> <answer id="4" right="о"><синий></answer> </answers> </question> </questions> </questiongroup> ПРЕЗЕНТАЦИЯ МАГИСТЕРСКОЙ ДИССЕРТАЦИИ СПИСОК ЛИТЕРАТУРЫ К ВЫПУСКНОЙ РАБОТЕ 1. Стив Сагман; пер. с англ. А.И.Осипова, П.А.Мерещук. Microsoft Office 2000 // – М.: ДМК, 2002. - 669 c., ил. 2. С. Бондаренко, М. Бондаренко. Microsoft Word 2003 в теории и на практике.– Минск: Новое знание, 2004.–336с., ил. 3. М.В. Спека. Microsoft PowerPoint 2003: самоучитель.– Москва, Санкт-Петербург, Киев: Диалектика, 2004.–363 с., ил. 4. М.С. Шибут. Технологии работы с текстами и электронными таблицами: Word, Excel. Минск: общественное объединение «Молодежное научное общество», 2000.–142 с. 5. Ф.Новиков, А.Яценко. Microsoft Office XP в целом: наиб. полное рук-во. Для широкого круга пользователей // – Спб: БХВ-Петербург, 2002. – 917 с., ил. |