Реферат: работа «Биологические компьютеры»
Название: работа «Биологические компьютеры» Раздел: Остальные рефераты Тип: реферат | ||
Курсовая работа «Биологические компьютеры»: 66стр., 2части, 9илюстраций, 4 дополнительных материала, 10 источников. Объект исследования - булевое вычисление с помощью биологических процесов. Целью ставилось продемонстрировать аналогию, существующую между процесами, изучаемыми науками «Молекулярная Биология» и «Компьютерная схемотехника». И языком, понятным для человека с техническим, инженерным образованием объяснить биологические термины и процесы, на которых основываются простейшие биологические компьютеры. Работа основывается на оригинальных, не переведенных с английского языка, отчетах разработчиков, купленых в журнале “Nature Biotechnology”. Используется вмешательство RNA (RNAi) в клетках почек человека, чтобы сконструировать молекулярное вычислительное ядро, которое обеспечивает выполнение Булевой логики, чтобы принимать решения, основанные на эндогенных молекулярных исходных данных. Поскольку данная разработка была опубликована в мае 2007 года, результатом проведенной работы является первый, или один из первых в Украине методический материал, с помощью которого можно объяснять студентам или инженерам азы перспективнейшего направления развития вычислительных систем и компьютерной науки. БИОЛОГИЧЕСКИЕ КОМПЬЮТЕРЫ, МОЛЕКУЛЯРНЫЙ АВТОМАТ, БУЛЕВОЕ ВЫЧИСЛЕНИЕ, РНК ИНТЕРФЕРЕНЦИЯ, ДНФ, КНФ, РНК, ДНК, БЕЛОК.
Перечень условных обозначений, символов, единиц, сокращений................6 Вступление............................................................................................................7 1 ЭВМ и живые клетки…………........................................................................9 1.1 Pedaflop программирование........................................................................9 1.2 Пропорциональное уменьшение компьютера……………..……………10 1.3 Возможности биологического программирования………………..……12 1.4 Управляющая программа для живых клеток………………………....…15 1.5 Операционная система для живых клеток……………………..………..17 1.6 Прерывания в живых клетках……………………..……………………..17 1.7 Главный процессор живых клеток…………………………..…………..18 1.8 Возможности дополнительных кодов для программирования монстров…………………………………………………………………………19 1.9 Биологический источник питания………………………..………….…...19 1.10 Схема управления в клетке……………..……………………………….20 1.11 Отсутствие доказательства существования жизненной силы……...…21 1.12 Нет ли подводных камней в фундаментальных основах?......................22 2. Конструирование биологических компьютеров……………………..……23 2.1Универсальный логический оценщик РНК, оперирующий в клетках млекопитающих……………………..………………………………………….25 2.1.1 Устройство молекулярного автомата для ДНФ выражений…..…....28 2.1.2 Устройство молекулярного автомата для КНФ выражений………..31 2.2 Тестирование индивидуальных молекул…………..……………………35 Выводы……………..…………………………………………………………...40 Перечень источников…………………………………………………………..41 ПРИЛОЖЕНИЕ А Феномен малых РНК. РНК-ИНТЕРФЕРЕНЦИЯ.............42 ПРИЛОЖЕНИЕ Б Приложения разработчиков………....................................46
ПРИЛОЖЕНИЕ Г Биография мистера Сеймора Крэя……………………….65 Рисунок 1-1 Строение простейшей молекулы...............................................................................................................11 Рисунок 1-2 Двойная спираль ДНК……….…..……………………………….12 Рисунок 1-3 Митохондрии..………………………………………………...….14 Рисунок 1-4 Геном………..…………………………………………………….16 Рисунок 2-1 Дизайн генной сети молекулярного компьютера на основе DNF формы……............................................................................................................29 Рисунок 2-2 Дизайн генной сети молекулярного компьютера на основе CNF формы……............................................................................................................33 Рисунок 2-3 Таблицы истинности для вычисленых выражений..…………………………..................................................................36 Рисунок 2-4 Тестирование индивидуальных молекул ДНК……..…………..37 Рисунок А-1 Петуньи над которыми проводились эксперементы……..…...42
DNA, ДНК - Дезоксирибонуклеи́новая кислота́ RNA, РНК – рибонуклеиновые кислоты RNAi – РНК интерференция siRNA - (s mall i nterfering R iboN ucleic A cids) - малые интерферирующие рибонуклеиновые кислоты mRNA, мРНК – матричная, информационная РНК UTR - untranslated regions АТФ – Аденозинтрифосфорная кислота.
Могут ли компьютеры думать? Пока нет! Было уже множество дискуссий об искусственном разуме, создании программы, которая будет обучаться. Можно сказать с уверенностью, что эта сфера развивается. Есть некоторые доказательства того, что машины делают вещи близкие к мышлению, но еще рано думать, что они обучаемые. Многие следили за шахматным турниром между Гарри Каспаровым и компьютером IBM. Эта машина, была специально разработана для этого созтязания. Первая игра была выиграна компьютером. Каспаров был очень удивлен. Весь вечер он провел, изучая то, почему он проиграл матч, какая была стратегия компьютера. А что делал компьютер в эту ночь? Естественно, он был выключен и стоял в углу. Дальше вы знаете, что произошло. Компьютер не смог выиграть следующую игру! Гари Каспаров выиграл три и сыграл две игры вничью. Так что компьютеры пока что не умеют мыслить. По крайней мере, шахматные. К чему это я? Да к тому, что как бы ученые, проектировщики не стремились создать «живой» компьютер, пока это у них не получилось и врядле получиться. Это понятно. Но теперь посмотрим с другой стороны. Если представить себе такую абсурдную идею, так-сказать, чисто гипотетически, что ВМ (Вычислительная Машина) будет составлена из неких «Живых» элементов. Можно будет её назвать живой? Конечно же нет. Она будет так же выполнять четкие специализированые алгоритмы, не имея никакой возможности обучаться. А если представить, опять же, чисто гипотетически, что такая возможность существует, что бы она нам дала? Что бы дал человечеству Допустим это так. Человек это компьютер. Что бы мы могли сделать, создав некие вычислительные модули? Может быть что-нибудь поменять? Что-нибудь убрать? Что-нибудь подкорректировать? Приятно вот так сидеть и мечтать, не правда ли? Но, как обычно, кто-то мечтает, а кто-то делает шаги к решению проблемы. Кто-то учит компьютерную схемотехнику, а кто-то биологию. А кто-то учит компьютерную схемотехнику и биологию. И настолько хорошо учит, что смог проследить четкую анологию между понятиями «Живой организм» и «ЭВМ». Данная работа являет собой некий первый шаг к пониманию этой аналогии, и того, как эту анологию можна использовать. Если говорить о целях написания данной работы, то в первую очередь стоит отметить желание сунуть нос туда, куда никто еще не совал (по крайней мере из ближайшего окружения). Ведь по большому счету, «Биологические компьютеры» это, как «Летающий автомобиль». То есть два соединенных, несоединяемых понятия, которые дают поразительные возможности и не паханое поле для деятельности. Данная работа состоит из двух частей. В первой описывается, собственно анология, о которой говорилось выше. Во второй будет описание функционирования и отрасли использования простейшего биологического автомата, выполняемого вычисление логических функций.
1.1 Pedaflop программирование Итак, от лирики к делу. Так как некоторые, наверное, не знают что такое pedaflop программирование, можно сделать небольшой экскурс. Где-то в 1960-х Группа ученых, в том числе, некий господин Сеймор Крэй, мысли и идеи которого активно пропогандируются в данной работе, принимали участие в разработке некой последовательности для игры на пианино. Детали этой разработки данной работы не касаються, за исключением того факта, что тогда в том компьютере, вместо написания программы, была создана плавающая десятичная запятая. (С биографией мистера Крэя можно ознакомиться в приложении Г). Могли ли мы с тех пор сказать, сколько плавающих запятых (flop) наш компьютер вычисляет? И когда мы смотрим на персональный компьютер, мы говорим, сколько megaflop он вычисляет? Сколько миллионов плавающих запятых в секунду? Люди, которые могут себе позволить большие вычислительные станции могут сказать, сколько giga flop вычисляет их компьютер. Это 1000 megaflop. Это достаточно для большинства людей. Но, известно, что правительственные лаборатории США всегда хотят чего-то большего. И это, к примеру, Национальная Лаборатория Сандиа в Альбукерке, они захотели tetraflop машину и заказали такую в Intel, эта машина сможет вычислять в tetraflop. Она имеет 9900 процессоров, это настоящий монстр. Конечно, все лаборатории завидовали этому и говорили, мол, она стоит очень дорого, около 40 миллионов долларов, она все равно не будет работать, кому она нужна? Но все-таки это хорошо, что есть tetraflop машина, она нужна. Хотя многие в этом не уверены. Как бы там не было это tetraflop.
Сейчас pedaflop конференции проводятся ежегодно. Там говорят о революции, о том, к чему приведет создание pedaflop машины. И о том, возможно ли использование биологии. Мистер Крєй в своих воспоминаниях о первой pedaflop конференции: «Все присутствующие: группа из 30 технических специалистов, мило улыбались, говорили приятные вещи и рассуждали о развитии. Они, высококлассные специалисты в своих разнообразных сферах, утверждали, что если продолжать то, что сейчас делается, то через 20 лет у будет pedaflop. Они даже показывали доказательства своих слов – прямую линию на полулогарифмической бумаге.» Сейчас вы увидели, как обстоят дела. Они просто соединили две точки на графике прогресса в компьютерной технике за последние 10 лет, продолжили этот отрезок на 24 года и уверенны, что это приведет к созданию pedaflop. 1.2 Пропорциональное уменьшение компьютера Что бы это могло значить? Какого прогресса ученые достигли за последние 10 лет? Они делали компьютеры более быстрыми и миниатюрными, а если будут продолжать в том же русле, то какого размера станут компьютеры через 24 года? Так сегодня производится пол-микронная схемотехника. Может, кто-то уже занимается разрабатыванием четверть-микронной. Уже давно, по словам Мистера Крэя, изобретатели говорят о 0.15 микрон технологиях. Так что через 20 лет компьютеры станут и в самом деле крошечными. А на сколько крошечными? Каких размеров может быть молекула?
Рисунок 1‑1 – Строение простейшой молекулы Неорганические молекулы размером в нанометр, а биологические в десятки раз меньше. 0.1 микрон – это только 100 нанометров, так что нужно немного, что бы достичь размеров биологической молекулы. Если все-таки представить, что через 20 лет будет создан полупроводник, который будет иметь такие размеры, то ученые столкнутся с двумя физическими преградами: принципом неопределенности, основанный на том, что очень маленькие вещи имеют отличные свойства от объектов больших размеров, и жизненной силой, как фактором.
Можно с уверенностью предположить, что будет интересно провести экскурс в историю развития возможностей биологического программирования. Но для этого потребуется немного воображения. Будучи компьютерные инженером, необходимо лишь понять некоторые биологические термины. Представьте себя очень маленьким объектом, размером в 1 микрон, так как биологические объекты и в самом деле крошечные. Давайте заглянем внутрь биологической клетки, к примеру, человеческой, и попробуем выделить характеристики, которые можно сопоставить с сегодняшними компьютерами. С первого взгляда бросается в глаза – это большое динамическое запоминающее устройство в ядре клетки. Это ДНК . Рисунок 1‑2 - Двойная спираль ДНК Дезоксирибонуклеи́новая кислота́
(ДНК)
— цепочка, обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционированияживых организмов. Основная роль ДНК в клетках — долговременное хранение информации о структуре РНК и белков. С химической точки зрения, ДНК — это длинная молекула, состоящая из повторяющихся
RNA - (РНК – рибонуклеиновые кислоты ) – высокомолекулярные органические соединения, принимает решающие участие при трансляции, т.е. финальной реакцией реализации генетической информации. Вокруг ядра расположены несколько тысяч микропроцессоров, называемых митохондриями Митохондрия (от греч. μίτος — нить и χόνδρος — зёрнышко, крупинка) — один из важнейших деталей живой клетки эукариот (надцарства всех живых организмов, кроме бактерий, клетки которых имеют ядро). Метохондрии являются «энергетической фабрикой» клетки и содержат, в частности, дыхательные и другие окислительно-восстановительные ферменты. (рис.1-3) Давайте вначале рассмотрим большое динамическое запоминающее устройство. Оно состоит из 48 резервуаров, которые называются хромосомами. В них сосредоточена большая часть наследственной информации. Теперь становися вопрос, а ведь хромосомы бывают разных размеров: маленькие, большие, средние, а как такое могло случиться? Это можно объяснить на жизненном примере. Вот когда вы идете в магазин и хотите приобрести самое большое динамическое запоминающее устройство, но должны довольствоваться тем, что есть в наличии. Так и в клетке способности к обработке информации не велики, но они могут расширяться в зависимости от возможностей самой клетки. Число митохондрий в одной клетке варьирует от единиц до нескольких тысяч. Рисунок 1-3 - Митохондрии Если лучше присмотреться к большому динамическому запоминающему устройству, то поймем, что состав не так то важен. 48 частиц – не принципиальное число. Можно воспринимать память как единую цепочку из битов, линейную память. Я думаю, сегодня биологи с этим согласны. И на сколько же она велика? Приблизительно, 6 гигабит. Сейчас это довольно много по сравнению с персональным компьютером, даже по сравнению с большинством научных установок. Так что это очень большая память динамического запоминающего устройства.
Следующий вопрос – это сколько места в памяти занимает управляющая программа? Известно, сколько хлопот сейчас с управляющими программами, они стают всё больше и больше. У ДНК в человеческой клетке приблизительно 10 процентов занимает управляющая программа. А что же тогда остальные 90 процентов? Ученые говорят, что это в основном помехи и шумы. Если присмотреться ближе - это как старое программное обеспечение, которое не пригодно к использованию, вот, что это. А что же тогда собой представляет эта управляющая программа? Она состоит из множества подпрограмм – 150000 подпрограмм. Сейчас есть много подпрограмм для каждого программного обеспечения, их называют генами. Ген – участок ДНК, несущий какую-либо целостную информацию о строении одной молекулы белка или одной молекулы РНК. Тоесть, это материальный носитель наследственной информации, совокупность которых родители передают потомкам. Рисунок 1-4 – Геном В целом мире разрабатывают проект генома (рис. 1-4), то-есть, совокупности всех генов организма, для комплексного решения нескольких инженерных задач с использованием различных данных для определения того, как каждая подпрограмма работает в едином обеспечении. И в конце исследования стоит задача узнать точную последовательность каждой частицы, чтобы подобрать подпрограмму для каждого кода. Работа над этим ведется минимум 10 лет, и хочется надеяться, что пройдет еще хотя бы 20 лет, а не больше, пока результат будет достигнут. Из них 15-20 процентов для определения функций, только функций, еще даже не последовательности. Перед нами большая оперативная память, 150000 подпрограмм. И сейчас ведется активная работа над их расшифровкой и изучением за что каждая из них отвечает.
Сколько в управляющей программе занимает оперативная система? Это еще один интересный факт компьютеров. Оперативная система всегда слишком большая. А на сколько она большая в биологической системе. Ответ – чуть больше 50 процентов. Это немного удивительно. Как она достигла таких размеров? Каждая система нагромождает дополнительное расширение в специальных папках, и они не когда не уменьшаются. Для того чтобы представить, сколько времени занимает у биологического организма перезагрузка оперативной системы и его инициализация, нужно помнить, что чем больше расширеннее, тем большее количество последовательностей должен обработать компьютер. Интересно, узнать, что процесс инициализации оперативной системы занимает 13 лет. 1.6 Прерывания в живых клетках Теперь немного о системе, управляемой прерываниями. Это очень быстро развивающаяся сфера из-за количества людей, работающих над проектом человеческого генома. Давайте быстренько пробежимся еще раз для того, чтобы увидеть, как это все работает. Прерывание происходит, когда система получает сообщение извне о том, что поблизости свободный вирус. Вирус – микроскопическая частица, способная инфицировать клетки эукариот, т.е. живых организмов. По словам мистера Крэя, на данный момент известно, что существует одна подпрограмма, которая активизируется с помощью этого сигнала. Эта И в случае с живым организмом процесс реагирования на вирус и выработка антитела занимает две недели, ровно столько, сколько нужно для лечения простой простуды. Мы проходим через эту последовательность, не зависимо от начального сигнала. 1.7 Главный процессор живых клеток Давайте на время оставим оперативную память и рассмотрим другие части. Давайте посмотрим на микропроцессор, рибосому Рибосома
– важнейшая деталь живой клетки. Имеет сферическую форму, диаметром 100-200*10 Несколько тысяч из них разбросаны по клетке, все они похожи и имеют два уровня кэш памяти. Рассмотрим два уровня кэш памяти L1 и L2. Итак, L2. В биологической терминологии это называется информационным РНК. Он копирует всю подпрограмму с оперативной памяти и транспортирует ее поближе к процессору для быстрой обработки. Каких же он размеров? Он в десять тысяч раз меньше бита. А что тогда с L1 памятью? Она переносит маленькие кусочки памяти L2 на микропроцессор для распознавания команды. То-есть аналогия КОП. Это называется транспортной РНК.
Вы уже знаете, что в наших компьютерах используются не все коды. Есть и не занятые. Так, Бог использовал только 20 из 64 кодов в шести битах. Но биологи уже работают и над этим, пытаются пристроить неиспользованные коды. Они вставляют чужие коды в ДНК и смотрят, что произойдет, некоторые из них получают очень странные вещи, производя нетипичную молекулу белка. Сегодня существуют 20 натуральных аминокислот и несколько искусственных. Из них могут вырастать монстры. Интересно рассмотреть сегодняшние попытки изучения устройства управления и секции генерации кодов. Как уже было сказано, транслятор очень мал, а генератор кодов довольно велик, но это не важно. Основная функция – это чтение кода из ДНК и производство молекулы белка. 1.9 Биологический источник питания Что еще мы можем увидеть при рассмотрении биологической системы? Мы пропустили источник питания. Источником питания клетки является митохондрия. Это очень интересно. Она берет большие молекулы из внешнего пространства, разбивает их до цепочки мелких молекул АТФ и транспортирует их через всю клетку для питания оперативной памяти и микропроцессора. АТФ – Аденозинтрифосфорная кислота. Некое соединение хим. веществ, которое играет важную роль в обмене энергией и веществ в организмах .
1.10 Схема управления в клетке Что еще мы забыли? У нас есть оперативная память, микропроцессор, и источник питания. Еще одна важная деталь – схема управления. Когда создаются компьютеры – это одна из самых сложных составляющих. Нам нужно определить все возможные варианты развития системы и запрограммировать к этому аппаратное обеспечение компьютера. Но посмотрите на биологическую систему, здесь нет ничего подобного. Как такое может быть? Догадка: Жизненная сила выполняет контрольные функции Все, что говорилось до этого, правильно с точки зрения современной биологии, а сейчас хочется предложить некие, кажущиеся антинаучными на первый взгляд, домыслы. Как биологическая система может функционировать без какой-либо схемы управления над оперативной памятью, микропроцессором или источником питания? Предполагается, что существует некая жизненная сила, которая управляет каждой молекулой. Вы думаете, что это уж чересчур, но это единственное объяснение, которое можно найти. Давайте приведем доказательства правоты этого умозаключения. Недавно была открыта молекула белка, которая способна откорректировать код в оперативной памяти. Мы знакомы с этой функцией, она такая же, как и для ДНК. Мы имеем дело с большими объемами памяти, которая Он спускается по нити ДНК в поисках испорченной пары оснований нуклеиновых кислот. Когда флиппер их находит, он присоединяется к структуре ДНК, резко разгибает ее, отводит ненужную молекулу, удостоверившись, что она испорчена, вставляет нужную и восстанавливает первичную структуру ДНК. Сложно в это поверить, об этом, по словам мистера Крэя писалось в неких правительственных отчетах, так что это должно быть правдой. И как такая маленькая молекула может выполнять столь сложные задачи? Ведь у нее нет ни рук, ни ног, ни огромного мозга. Как говорилось ранее, она, должно быть, управляется жизненной силой. 1.11 Отсутствие доказательства существования жизненной силы Почему нельзя прочитать о ней в учебнике? Можно открыть учебник физики и прочитать про все силы природы, сильные и слабые, электричества и гравитации, но ничего про жизненную силу. Зато взяв учебник биологии можно заметить, что автор с первого же раздела предполагает существование жизненной силы. В чем причина такой разницы? Причиной того, что мы не знаем, как она действует, является то, что все бояться писать свои догадки об этом. Так как же все-таки жизненная сила действует на молекулярном уровне? Хотелось бы знать ответ на этот вопрос, но, к сожалению, ученые не слишком приблизились к нему.
Хотелось бы поделиться мыслью мистера Крэя, которая посетила его во время дискуссии в Люцерне, Швейцария с одним физиком, который всю свою жизнь занимался определением элементарных частиц. Тот спросил, не странно ли то, что через каждые 10-15 лет нам приходится переписывать учебники физики, так как за это время ученые находят целое множество новых частиц, которые с каждым разом становятся всё меньше и меньше. Потом он пристально посмотрел в глаза мистеру Крэю и сказал очень интересную вещь. «На самом деле эти частицы не существуют»,-сказал он - «Бог создаёт их для того, чтобы занять физиков». Надеюсь, Бог делает то же самое и для компьютерных инженеров.
Итак, мы поняли, что аналогия существует. Так что ж она нам может преподнести? Уже давно можно определить проявления генов и их активность, а также точно указать местонахождение белков в клетке. Но пока эти задания исполняются в искуственных условиях в лаборатории, представьте себе все выгоды от их использования на живых организмах, например на животных. Нанотехнические устройства могут инжектироватся в пациента, который станет монитором в определенных условиях и будет точно соответствовать поставленным целям. В “Nature Biotechnology” 25, 795 - 801 (2007) (Published online: 21 May 2007) Была опубликована статья, которая приближает мечту к реальности. Материалы этой статьи будут использованы в рамках данного курсового проекта далее. Данная статья выложена в приложении В в оригинальном виде. Будет рассматриваться конструкция биологического цикла, что использует рибонуклеиновую кислоту (РНК) для влияния на булево-логическое утверждение. Цикл работает, используя две молекулярные цепочки, которые кодируют один и тот же белок, но они содержат в себе нерозкодированные участки рибонуклеиновой кислоты, разной последовательности. Разные эндогенные сигналы будут контролировать проявление различных РНК Эндогенный сигнал – сигнал внутреннего происхождения, действующий внутри чего-либо, объяснимый внутренними причинами. Таким образом сигналы будут влиять на одну из двух молекулярных цепочек, проявляя ее; например, сигнал А и В будут нацеливатся на одну Если по Русски, это значит, что можно организовать генную сеть, которая, в зависимости от кодируемого этой схемой логического выражения, в ответ на наличие или отсутствие на входе – в клеточной среде – сигналов (к примеру, молекул) синтезировала бы в качестве выходного сигнала какой-нибудь легко определяемый белок, например, флуоресцентный (т.е. такой, который имеет свойство менять свой цвет).
Это значит, что логическое вычисление во внутриклеточной молекулярной среде может служить цепью для бинарного принятия решений, то есть инициировать один или несколько дискретных процессов в ответ на входные данные из этой среды. Для решения этого вопроса следует: переработать правила принятия решений как логическое выражение, содержащее внутриклеточные данные как переменные; и конструируем молекулярную систему, которая производит молекулярные итоговые данные, когда выражение вычисляется как истинное. Эту идею реализовали ученые из Гарвардского и Принстонского Университетов Рон Вайсс (Ron Weiss) и Яков Бененсон (Yaakov Benenson) с коллегами. Авторы продемонстрировали работу такого биокомпьютера, 2.1 Универсальный логический оценщик РНК, оперирующий в клетках млекопитающих Молекулярный автомат – сконструированная молекулярная система, соединенная с биомолекулярной средой посредством «потока получаемых сообщений и действий исходящих сообщений», где получаемые сообщения обрабатываются «промежуточным набором элементов», то есть компьютером. Молекулярные автоматы могут имплементировать разнообразные модели вычислений (цифровые и аналоговые схемы, сети нервной системы) для исполнения множества заданий. Дизайн, рассматриваемого примера является многоцелевым. Но перед тем как приступить к рассмотрению этого устройства, проведем еще один небольшой экскурс в биологические термины.Белок – (протеин) – высокомолекулярное органическоеие вещество, состоящее из соединенных в цепочку аминокислот. В живых организмах аминокислотный состав белков определяется генетическим кодом.RNA - (РНК – рибонуклеиновые кислоты) – высокомолекулярные органические соединения, принимает решающие участие при трансляции, т.е. финальной реакцией реализации генетической информации в белках.
|
Рисунок А-1 - Петунии, над которыми проводились эксперементы |
В другом эксперименте биологи, изучавшие генетическую регуляцию у одного из самых популярных в последнее время модельных организмов - червя Caenorhabditis elegans ( Ценорабдитис элеганс , или сокращенно C. elegans ), пытались усилить работу определенных генов путем введения в клетки червя дополнительных копий таких генов (в виде ДНК). И снова, вместо усиления выраженности данного гена, ученые наблюдали противоположный эффект: его полное "замолкание". Длительное время никто не мог объяснить происходившие феномены, рассматривая их как артефакты. И лишь спустя годы удалось установить, что во всех подобных случаях в клетках подопытных организмов появлялись большие количества так называемых "малых" РНК
. К еще большему удивлению привело исследование структуры таких молекул. Оказалось, что эти РНК являются копией отдельных участков тех самых генов (ДНК), которые вводились в клетку, и активность которых подавлялась.
Снова - загадка. С одной стороны, структура таких малых РНК однозначно говорит о том, что они были скопированы с введенной в клетку ДНК, что для клетки вполне нормально (если не считать подозрительно малую длину этих молекул). С другой стороны - вместо того, чтобы, как большинство "нормальных" информационных РНК, переносить информацию для синтеза белков и способствовать, таким образом, усилению выраженности гена (например, усиливая цвет петуний), эти РНК каким - то образом умудряются проделывать совершенно противоположную работу.
Начиная с 1995 года, исследователи предприняли попытки повторить этот эффект экспериментально. Для этого они искусственно синтезировали небольшие участки РНК, являющиеся почти точной копией участка определенного гена, и вводили их различным организмам.
Первое подтверждение феномена "замолкания" генов было получено все у того же C. elegans. Немного позже это свойство коротких РНК выявили у мух и, наконец, в 2001 году - при введении в клетки мыши и человека. В том же 2001 году Science включил исследования малых РНК в число наиболее важных.
Почему же малые РНК способны выполнять столь необычные функции?
Решение парадокса малых РНК началось с детального изучения их структуры, биологических характеристик и путей их превращения (метаболизма) в клетках различных организмов.
Длительное время биологи просто не обращали особого внимания на короткие отрезки клеточной рибонуклеиновой кислоты (РНК), полагая, что их роль в клетке не слишком значительна. Гораздо больший интерес привлекали другие типы РНК, а именно информационные и рибосомальные. Оба этих класса - очень длинные молекулы, содержащие до 100 000 нуклеотидов. Первые (информационные, которые часто называют также матричными РНК, или мРНК) переносят генетическую информацию с хромосом (ДНК) в специальные органеллы- "агрегаты" для синтеза белков - рибосомы. Второй класс – рибосомальная РНК - является одновременно и строительным материалом, и важнейшей рабочей частью рибосом.
Понятно, что с первого взгляда малые РНК, состоящие всего из нескольких десятков нуклеотидов, могли показаться просто мусором, остатками от своих "больших братьев". И даже несмотря на то, что роль отдельных малых молекул РНК в процессах превращения информационных РНК (сплайсинге), а также при упаковке нитей нуклеиновых кислот, была доказана ранее, истинным "хитом" в биологии малые РНК стали только лишь с открытием своей способности подавлять экспрессию (выраженость) генов у животных.
В нормально работающей клетке каждый ген выполняет собственную, строго определенную функцию, например, отвечает за выработку белка, мРНК, или за взаимодействие с другими регуляторными белками. При этом говорят о нормальной экспрессии (от лат. expressus - выразительный, явный) гена в клетке. Если же количество продукта данного гена (например, белка) снижается, то говорят о снижении экспрессии данного гена. Эффект "гашения" экспрессии определенных генов малыми РНК получил название РНК-интерференции , а молекулы, вызывающие его, назвали siRNA (s mall i nterfering R iboN ucleic A cids) - малые интерферирующие рибонуклеиновые кислоты;
С открытием siRNA - интерференции стало ясно, что этот феномен может иметь огромное практическое значение.
Вы спросите как это понимать? Поясним на примере медицины: Существует по крайней мере три способа влияния RNAi на медецинские исследования. Исследователи уже имеют возможность выборочно блокировать активность любого гена, путем создавания генам препятствий – генетических заградительных полос или конструированием мутаций. В червях это очень просто сделать путем изменения информации о снабжении пищей. Черви обычно питаются бактериями и ее достаточно, что заблокировать нужный ген. Эта благоприятная возможность помогла ученым блокировать проявление каждого одинарного гена в геномном ряду червей и таким образом исследовать их влияние на червей.
Вне исследовательских работ RNAi и родственных методик испрользуются в борьбе с болезнями, особенно с раком, который зависит от отклонившихся проявлений некоторых генов. Некоторые терапии уже достигли результатов на стадии ограниченного тестирования на человеке.
Приложение Б
ПРИЛОЖЕНИЯ РАЗРАБОТЧИКОВ
Молекулы siRNA (Язык оригинала).
The sequences of the ribo-oligonucleotides are given in Supplementary Table 1. T1 and T2 siRNAs were annealed from gel-purified oligomers (Proligo); gel-purified SI4 siRNA (Proligo) was used as provided by the manufacturers. FF3 and FF4 siRNAs were annealed from desalted oligomers (Dharmacon) after purification from 20% denaturing PAGE. To anneal RNA oligomers, equimolar amounts (50 or 200 M) of the sense and antisense oligomers were mixed in 50 mM NaCl, 10 mM Tris-HCl pH 8.0, 1 mM EDTA and 0.5 U/
l Superase-In (Ambion), heated to 95 °C and slowly cooled down to 10 °C in a PCR block for 50 min. The size and purity of the siRNAs were verified using 3.5% Metaphor agarose gel (Cambrex).
Молекулы siRNA (Технический перевод)
Последовательности рибо-оглинуклеотидов приведены в дополнительной таблице 1. Т1 и Т2 cиРНКотжигаются из гелевых очищенных олигомеров(Proligo). FF3 и FF4 сиРНА – из опресненных олигомеров (Dharmacon). Для производства олигомеров РНК, еквимолярные количества (50 или 200 моль) олигомеров были смешаны в in 50 mM NaCl, 10 mM Tris-HCl pH 8.0, 1 mM EDTA и 0.5 U/l Superase-In (Ambion), нагреты до 95 °C и медленно охлаждены до 10 °C в течении 50 мин. Размер и чистота сиРНК подтверждены, используя 3.5% агарозный гель (Cambrex)
Клеточные культуры (Язык оригинала).
Serum-free media (SFM) adapted 293-H cells (Invitrogen) were used throughout the experiments. The cells were grown at 37 °C, 100% humidity and 5% CO2. The cells were initially transferred into CD-293 medium and a week later moved to the Dulbecco's modified Eagle's medium (DMEM, Invitrogen) supplemented with 0.1 mM of MEM nonessential amino acids (Invitrogen), 0.045 units/ml of penicillin and 0.045 g/ml streptomycin (penicillin-streptomycin liquid, Invitrogen), and 10% FBS (Invitrogen). The adherent culture was maintained indefinitely in this medium by trypsinizing with trypsin-EDTA (0.25% trypsin with EDTA
Na4, Invitrogen) and diluting in a fresh medium upon reaching 50–90% confluence. For transfection experiments,
90–120 thousand cells in 1 ml of complete medium were plated into each well of 12-well uncoated glass-bottom (MatTek) or plastic (Falcon) plates and grown for
24 h. Shortly before transfection, the medium was replaced with 1 ml DMEM without supplements with a single medium wash step. Transfection mixtures were prepared by mixing all nucleic acids, including the plasmids and the siRNAs into 40
l of DMEM. 2.4
l of the Plus reagent (Invitrogen) was added to the final mix and incubated for 20 min at 24 °C. In parallel, 1.6
l lipofectamine (Invitrogen) were mixed with 40
l DMEM. Plus- and lipofectamine-containing solutions were mixed and incubated for 20 more min at 24 °C before application to the cells. The transfection mixture (typically 90
l) was applied to the wells and mixed with the medium by gentle shaking. Three hours after transfection, 120
l FBS was added to the wells and the cells were incubated for up to 48 h before the analysis.
The cells were prepared for the fluorescent-activated cell sorting (FACS) analysis by trypsinizing each well with 0.5 ml 0.25% trypsin-EDTA, collecting the cell suspension and centrifuging at 2,655 gs for 2 min. Trypsin was removed and the pellet resuspended by short vortexing in 0.5 ml PBS buffer (Invitrogen).
Клеточные культуры (Технический перевод)
Медиатор без сыворотки (SFM) и приспособленный клетки 293-Н (Invitrogen) были использованы в экспериментах. Клетки выращивались при температуре 37 °C, 100% влажности и 5% CO. К клеткам были впоследствии добавлены 0.1 mM несущественных аминокислот, 0.045 единиц\моль пенициллина, 0.045 г/моль стрептомицина и 10% FBS.
Для экспериментов с трансфекцией приблизительно 90-120 тысяч клеток в 1 мл определенной среды выращивались примерно 24 часа. Незадолго до трансфекции, среда заменялась 1 мл DMEM без добавок. Смеси для трансфекции были изготовлены, смешивая все нуклеокислоты, включая плазмиды и сиРНК, с 40 l DMEM. Через 3 часа после трансфекции, добавлялось 120
l FBS, клетки инкубировались до 48 часов перед анализом.
Использование микроскопа (Язык оригинала)
All microscope images were taken from live cells grown in glass-bottom wells in the transfection medium supplemented with 10% FBS. We used the Zeiss Axiovert 200 microscope equipped with Sutter filter wheels, Prior mechanized stage and an environmental chamber (Solent) held at 37 °C during measurements. The images were collected by an Orca ERII camera cooled to -60 °C, in the high precision (14 bit) mode using a 20 PlanApochromat NA 0.8, PH2 objective. The collection setting for the fluorophores in crosstalk measurements and DNF evaluation experiments were S500/20x (excitation) and S535/30m (emission) filters for ZsYellow; and S430/25x (excitation) and S470/30m (emission) for AmCyan. A dichroic mirror 86004v2bs (Chroma) was used for both fluorophores. In CNF evaluation experiments the settings were: S565/55x (excitation) and S650/75m (emission) filters with a dichroic mirror 86021bs (Chroma) for dsRed-
monomer, and AmCyan settings as above. For the anticorrelated output experiment we used yellow fluorescent setting as above and S565/25x (excitation) and S650/75m (emission) filters with a dichroic mirror 86007bs (Chroma) for dsRed-monomer. Data collection and processing were performed by the Metamorph 7.0 software (Molecular Devices). After background subtraction, the relative intensities of the internal transfection control and the reporter protein were adjusted to equalize the apparent intensity of both in the negative control experiments. The settings were applied uniformly to all images taken from the crosstalk experiments and DNF evaluations. A different setting was applied to the images taken from the CNF evaluation experiments and to the anticorrelated output experiments because the constructs had a different baseline fluorescence.
Использование микроскопа (Технический перевод)
Все образы из микроскопа были взяты, используя живые клетки. Мы использовали микроскопы Zeiss Axiovert 200. Образы были отсняты фотоаппаратом Orca ERII, охлажденной до -60 °C, с большой точностью (14 бит), используя объектив 20 PlanApochromat NA 0.8, PH2. Для ДНФ испоьзовались такие фильтры: S500/20x (возбуждение) и S535/30m (подавление) для ZsYellow; S430/25x (возбуждение) и S470/30m (подавление) для AmCyan. Для КНФ: фильтры S565/55x (возбуждение) и S650/75m (подавление) для dsRed-monomer; и такие же для AmCyan.
Измерение и анализ информации ( Язык оригинала)
In crosstalk measurements and DNF evaluation experiments the cells were analyzed on a BD LSRII flow analyzer. ZsYellow was measured using a 488 nm laser and a 530/30 emission filter. AmCyan was measured with a 405 nm laser and a 450/50 emission filter. The data were analyzed using FlowJo software (FlowJo LLC). For each sample, the normalized ZsYellow level was calculated by dividing the compensated mean ZsYellow intensity in AmCyan-positive cells (obtained by putting the threshold at the highest autofluorescence value of AmCyan-negative cells) by the compensated mean AmCyan value in these cells. The normalized values collected in a single experiment were further divided by the ZsYellow/AmCyan ratio in the negative control samples. In the DNF evaluation experiments, the ratios were normalized to the lowest value in the unrepressed group of experiments. The same analyzer was used for the CNF evaluation experiments with LacI repressor. AmCyan was measured with a 405 nm laser and a 525/50 emission filter and dsRed-monomer with a 488 nm laser and a 575/26 emission filter. For each sample, the normalized dsRed level was calculated by dividing the compensated mean dsRed intensity (corrected for the cell autofluorescence) in AmCyan positive cells by the compensated and corrected mean AmCyan values in these cells. These values were divided by similarly calculated values in the negative controls where nonsense siRNA was applied at the same concentration as in the experiments. A MoFlo cell sorter (Darko) was used to analyze the C1 evaluation with LacI-KRAB repressor and the anticorrelated output experiments. ZsYellow was measured with a 488 nm laser and a 530/40 emission filter and dsRed monomer with a 568 nm laser and a 630/30 emission filter. The data from C1 evaluation were processed similarly to those described above. In the anticorrelated output experiment, for each reporter the mean value of its intensity in the transfected cells was weighted by the relative number of transfected cells and these numbers were independently factored for each reporter to the higher of the two values. All reported values (except for the data in Supplementary Fig. 3) are averages of two independent experiments, and at least 30,000 qualified events were collected for each sample.
Измерение и анализ информации (Технический перевод)
Для измерение уровня помех и оценивания ДНФ клетки анализировались на BD LSRII анализаторе. ZsYellow измерялся, используя 488 нм лазер и 530/30 эмиссионный фильтр. AmCyan измерялся 405 нм лазером и 450/50 эмиссионным фильтром. Информация измерялась программным обеспечением FlowJo (FlowJo LLC). Для каждого образца нормализованный уровень ZsYellow был рассчитан делением компенсированной средней интенсивности ZsYellow в AmCyan-позитивных клетках на компенсированное автофлуоресцентное среднее значение AmCyan в этих клетках. Нормализованные значения, полученные в результате одного эксперимента, были потом поделены на отношение ZsYellow/AmCyan в негативных контрольных образцах. В экспериментах оценивания ДНФ, отношения были приведены к минимальному значению. Такой же анализатор использовался в экспериментах оценивания КНФ с помощью репрессора LacI. Уровень AmCyan измерялся 405 нм лазером и 525/50 эмиссионным фильтром и dsRed-мономером с 488 нм лазером и 575/26 эмиссионным фильтром. Для каждого образца нормализованный уровень dsRed вычислялся делением компенсированного среднего значения интенсивности dsRed в AmCyan позитивных клетках на компенсированные средние значения AmCyan в этих клетках. Для анализа оценивания С1 использовался сортировщик клеток MoFlo (Darko), а также репрессор LacI-KRAB. Уровень ZsYellow измерялся 488 нм лазером и 530/40 эмиссионным фильтром, а также мономером dsRed с 568 нм лазером и 630/30 эмиссионным фильтром. Информация, полученная от оценивания С1, обрабатывалась описанным выше способом. Все полученные результаты – среднее значение 2 независимых экспериментов; по меньшей мере, 30 000 наблюдений проводилось для каждого образца.
Приложение В
A universal RNAi-based logic evaluator that operates in mammalian cells
Molecular automata1, 2, 3 that combine sensing4, 5, 6, computation7, 8, 9, 10, 11, 12 and actuation13, 14 enable programmable manipulation of biological systems. We use RNA interference (RNAi)15 in human kidney cells to construct a molecular computing core that implements general Boolean logic1, 3, 8, 9, 10, 11, 12, 16 to make decisions based on endogenous molecular inputs. The state of an endogenous input is encoded by the presence or absence of 'mediator' small interfering RNAs (siRNAs). The encoding rules, combined with a specific arrangement of the siRNA targets in a synthetic gene network17, allow direct evaluation of any Boolean expression in standard forms using siRNAs and indirect evaluation using endogenous inputs. We demonstrate direct evaluation of expressions with up to five logic variables. Implementation of the encoding rules through sensory up- and down-regulatory links between the inputs and siRNA mediators will allow arbitrary Boolean decision-making using these inputs.
Introduction
A molecular automaton is an engineered molecular system coupled to a (bio)molecular environment by "flow of incoming messages and the actions of outgoing messages," where the incoming messages are processed by an "intermediate set of elements," that is, a computer18. Molecular automata may implement diverse models of computation (digital and analog circuits, state machines, neural networks) to perform a variety of tasks. We suggest a general-purpose design framework for automata that uses logic evaluation to make certain types of decisions based on environmental molecular inputs.
Molecular logic evaluators have been demonstrated in vitro1, 2, 3, 9, 11, 12 and in live cells8, 10. Up until now, only in vitro systems1, 12, 19 have shown how to evaluate arbitrary logic expressions experimentally, although arbitrary evaluation in vivo using transcription factors has been considered theoretically20, 21. Demonstration that allosteric modulation of small RNAs22, including ribozymes1, 3, 16, riboswitches4, 5 and siRNA6, regulates gene expression prompted us to suggest that, much like transcription factors, small RNA molecules will enable molecular automata to make in vivo evaluations through mediation between endogenous inputs and the downstream molecular 'computing' network.
A logic evaluator operating in an intracellular molecular milieu can serve as a binary decision-making circuit23, that is, trigger one or two discrete processes in response to inputs from this milieu.
The capacity for in vivo decision making based on endogenous inputs could find applications in basic research and medicine, such as in the diagnosis of cancer2, 24. To address this issue, we (i) recast decision-making rules as a logic expression containing intracellular inputs as variables; and (ii) construct a molecular system that produces a molecular output when the expression is evaluated as True for the given input truth values (True when present and False when absent). We propose how to construct such a system for an arbitrary question represented by a logic expression. Although our design suggests separate sensor and evaluator modules, we demonstrate only the evaluator.
There are several theoretically equivalent, but practically different, ways to answer arbitrary logic questions. They generally involve breaking a complex question into a hierarchy of simpler ones. One possibility is to be very stringent with basic modules (e.g., the first input must be True, the second must be False), but connect these modules in a less stringent way where an overall positive result is achieved when any one module gives a positive answer. Another way is to be less stringent within the basic modules (e.g., at least one input has to be in an expected state), but put stringent demands on the combinations of modules, by requiring all answers to be positive simultaneously to give an overall positive answer.
To construct an evaluator that embodies the first approach, we build a biological 'circuit' that comprises two or more mRNA species that encode the same protein, but have different noncoding regions. This protein is the system's output; a biologically active output may function as an actuator. If at least one mRNA species is translated, the resulting output will represent a logic True value, implementing an OR operation10, 12 (Fig. 1a). The levels of mRNA species and the output are determined by the presence or absence of the endogenous molecular inputs with the help of molecular mediators. siRNA molecules target untranslated regions and hence are natural candidates for such mediation. First, we fuse different sets of siRNA targets into the 3'-untranslated regions (UTR) of the mRNAs, rendering them susceptible to either of these siRNAs25. Next, we establish selective inhibitory links between endogenous inputs and these siRNAs. All inputs must be present at the same time to block all siRNAs and generate output from an mRNA, corresponding to a logic AND operation (Fig. 1b). Furthermore, if, for example, inputs A and B block siRNAs that target one mRNA and inputs X and Y block siRNAs that target another, the circuit will generate an output when both A and B are present or when both X and Y are present. This comprises the logic expression (A AND B) OR (X AND Y). If an activating link is established instead, the presence or absence of an input will block or enable output production from the mRNA, respectively. In logical terms, this amounts to a negation of the input 'truth value' (Fig. 1c). In the above example, input B activating its mediator siRNA turns the expression into (A AND NOT(B)) OR (X AND Y). The same input may block one siRNA and activate another, and thus appear in the expression both as itself and as its negation. This arrangement of input variables and their negations, known as literals, is called a disjunctive normal form (DNF) (Fig. 1d and Supplementary Fig. 1 online). Literals grouped by the AND operation are called 'clauses' and we call the mRNA species modified in their 3'-UTR, as well as the genes that express them, 'clause molecules'.
Figure 1: Design of the decision-making automaton that uses a DNF evaluator.
(a) A circuit that evaluates an OR operation between mRNA molecules. A truth table of an OR operation is shown. An upward arrow indicates the presence of the mRNA. (b) A circuit that evaluates an AND operation between the endogenous inputs A and B. Dotted blunt arrows indicate blocking sensory interactions and full blunt arrows indicate downregulation via RNAi. A truth table of the AND operation is shown. Similar circuits are constructed and substituted for each mRNA as in the OR gate in a. (c) A circuit that evaluates a negation (logic NOT operation) of an endogenous input A and a corresponding truth table. A pointed dotted arrow indicates activating sensory interaction. (d) An example of a circuit that, given the sensory links (dotted lines) between the endogenous inputs and the mediator siRNAs, evaluates an indicated DNF expression on these inputs. If, for example, inputs A, B and E are present, the siRNAs that mediate their presence will be inactivated, resulting in a high expression from the clause molecule 1. Even though the siRNA-NOT(A) will be active and will suppress the translation of the output protein ZsYellow from the clause molecule 2, the overall output protein level will qualify as a True result. CMV, human cytomegalovirus immediate-early promoter.
A biological circuit that enables the second approach comprises mRNA species that produce a transcription factor that represses an output-encoding gene. If the repressor obtained from one mRNA efficiently downregulates the output, all mRNAs must be removed to generate the output, thus implementing an AND logic operation (Fig. 2a). As before, we fuse sets of siRNA targets into the 3'-UTR of the repressor mRNAs. However, contrary to the previous case, here endogenous inputs should activate the siRNAs rather than block them. At least one siRNA from each set must be activated to remove all repressor mRNAs and relieve the repression (Fig. 2b), corresponding to a logic OR operation (Fig. 2b). For example, if inputs A and B activate siRNAs that target one mRNA and inputs X and Y activate siRNAs that target another, we require that at least one of the inputs A and B, and at least one of the inputs X and Y, be present. In logic terms, this constitutes the expression (A OR B) AND (X OR Y). An input that blocks its mediator siRNA is negated in the expression (Fig. 2c). This is an example of a conjunctive normal form (CNF) expression and the circuit is a CNF evaluator (Fig. 2d, Supplementary Fig. 1). The DNF and CNF standard forms are particularly useful because any logic condition can be evaluated using a corresponding DNF or CNF representation, although one representation may be shorter than the other.
Figure 2: Design of the decision-making automaton that uses a CNF evaluator and automaton's input encoding rules.
(a) A circuit that evaluates an AND operation between mRNA molecules. A downward arrow in table indicates the absence of the mRNA. CAG, chicken -actin promoter with CMV enhancer. LacO stands for two adjacent Lac operator sites. KRAB, Krueppel-associated box domain. (b) A circuit that evaluates an OR operation between the endogenous inputs A and B. Similar circuits are substituted for all mRNAs from the AND gate. (c) A circuit that evaluates a negation (logic NOT) of an endogenous input A. (d) A circuit that evaluates the indicated CNF expression. For example, if the inputs B and C are present, siRNA-B and siRNA-C will be activated, downregulating the levels of the LacI repressor translated
from the clause molecules 1 and 2. Overall level of the LacI repressor will be low, relieving the suppression from the promoter of the output protein and resulting in a high output level, interpreted as a True evaluation result. (e) Rules that link the presence or absence of the endogenous inputs with the presence or absence of their mediator siRNAs, depending on the type of expression (DNF or CNF).
We experimentally implemented DNF and CNF evaluators in immortalized human embryonic kidney cells (293-H). We transfected the cells with the genes comprising the evaluator circuits; we also added, or withheld, mediator siRNA molecules to reflect the anticipated function of the sensory module in accordance with the presence or absence of inputs appearing as variables in expressions (Fig. 2e); and we assayed the output levels after 48 h. We chose derivatives of known siRNAs for the current implementation, and constructed five siRNA-target pairs based on published sequences from nonmammalian genes to represent up to five inputs (T1 and T2 from Renilla reniformis, FF3 and FF4 from firefly luciferases and SI4 from enhanced green fluorescent protein (eGFP); Supplementary Table 1 online). We modified the published sequences by sliding them along their parental genes to afford at least a pair of A/U bases on the 5'-end of the molecule and a pair of C/G bases on the 3'-end to ensure asymmetry in RNA-induced silencing complex assembly26.
Multi-siRNA systems may exhibit undesired crosstalk between individual molecules. We measured this crosstalk, using ZsYellow derivatives with single targets cloned into their 3'-UTR and applying all siRNA molecules at the saturation concentration, one at a time, to each derivative. Crosstalk was negligible for this set of siRNAs (Supplementary Fig. 2 online), except for a possible minor (20%) reduction in the ZsYellow level when SI4 siRNA was applied to the FF4 target; this was further reduced to
10% when the FF4 target was a part of a clause molecule (Fig. 3). We then built and tested a number of mRNA clauses for DNF evaluators, fusing the siRNA targets into the 3'-UTR of the ZsYellow output (Fig. 3). The results show that complete downregulation is achieved separately by any of the cognate siRNAs but not by the others, as
required by the construction (Fig. 3). Initially, one of the constructs (ZsYellow-T1-SI4-FF4) showed incomplete repression by two out of three siRNAs. We performed RNA-folding analysis of the clause sequence with permuted order of targets, and found that an arrangement selected for its low folding energy operates substantially better than the original (Supplementary Fig. 3 online).
Figure 3: Testing individual DNF clause molecules.
(a) Two expressions in DNF form are evaluated for all possible variable assignments as indicated in the figure. 2.5 pmol of each input siRNA (or 2.5 pmol of the negative control siRNA in the case of an absent input siRNA) were cotransfected with 100 ng of each clause molecule and 100 ng of the pAmCyan-C1 transfection control into 293-H cells and assayed after 48 h. The quantitative results corresponding to the images that were obtained using FACS are shown on the right (see Methods). Red pseudocolor represents the transfection control protein AmCyan and the green color represents the output protein ZsYellow. (b) An evaluation of two CNF expressions. In C1 evaluation experiments using LacI, 10 pmol of each siRNA, 50 ng of the CMV-LacI-FF3-FF4 clause molecule, 200 ng of CAGOP-dsRed-monomer reporter and 100 ng of pAmCyan-C1 transfection control were cotransfected into 293-H cells and assayed after 48 h. The expression levels of the reporter obtained by FACS are given relative to the control experiments where active siRNA was replaced with the same level of nonsense siRNA (first row of images). In C1 evaluation experiments using LacI-KRAB, 5 pmol of each siRNA, 5 ng of the CMV-LacI-KRAB-FF3x3-FF4x3 clause molecule, 200 ng of CAGOP-dsRed-monomer reporter and 100 ng of pAmCyan-C1 transfection control were cotransfected into 293-H cells and imaged after 48 h. The expression levels of the reporter given in the figure were obtained by FACS using 100 ng of pZsYellow-C1 transfection control instead of pAmCyan-C1 and they are given relative to the control experiments where active siRNA was replaced with the same level of nonsense siRNA (first row of images). In C2 evaluation experiments, 5 pmol of each siRNA, 50 ng of CMV-LacI-FF3x3 and CMV-LacI-FF4x3 clause molecules, 200 ng of CAGOP-dsRed-monomer reporter and 100 ng of pAmCyan-C1 transfection control plasmids were cotransfected into 293-H cells and assayed after 48 h. It was quantified similarly to the C1 experiments with LacI. Blue pseudocolor represents the transfection control protein AmCyan and the red color represents the reporter protein dsRed-monomer. (c) A demonstration of anticorrelated evaluation results provided by two circuits operating in parallel. 10 pmol of siRNA (or nonsense siRNA), 100 ng of pZsYellow-F3x3 and 50 ng of CMV-LacI-F3x3 clause molecules and 200 ng of CAGOP-dsRed-monomer reporter were cotransfected into 293-H cells and assayed after 48 h. Each reporter (ZsYellow and dsRed) was quantified independently and given relative to their respective True expression levels.
The constructs and their common sequence motif that includes a stop codon (top) are shown to the left. We cotransfected 10 pmol of each indicated siRNA (columns) with 100 ng of the indicated clause molecule (rows) and 100 ng of the transfection control plasmid pAmCyan-C1 into 293-H cells and assayed after 48 h. The images combine the fluorescent signal from the AmCyan transfection control (red pseudocolor) and the signal from the ZsYellow protein expressed from the clause molecules (green pseudocolor). Low levels of ZsYellow result in red images whereas coexpression of both proteins results in mostly green and yellow spots. Negative control is a nonsense siRNA provided in the same amount as the active siRNAs. The quantitative results that correspond to the images, obtained by FACS measurements and normalized to the negative control for each construct, are shown on the right.
Full size image (72 KB)
In the next step, we performed evaluation experiments for full DNF and CNF expressions. The connection of the siRNAs and their targets to endogenous input variables is shown in Supplementary Table 2 online. We constructed circuits to evaluate two expressions in DNF form, D1: (A AND B AND C) OR (D AND E) and D2: (A AND C AND E) OR (NOT(A) AND B). The same siRNA (FF3) was used differently in D1 and D2, once as a variable E and once as a negated variable NOT(A). As a result, siRNAs T1 and FF3 were never applied together during D2 evaluation. We then tested all possible truth-value assignments for the variables in each expression: 32 for the D1 and 16 for D2 (Table 1a). The distribution of output levels in both expressions is shown in Supplementary Figure 4 online. It demonstrates a clear separation between the groups of False and True outputs as required from a Boolean evaluator, with an average 16-fold difference between output levels in False and True groups. The evaluation of the D1 expression, with all variables being True and no siRNAs present, resulted in more than twice the output of others owing to the parallel production of the output from both clause mRNAs. This high value is also interpreted as True10, 12. In the expression D2, we obtained one imperfect False evaluation (A:T, B:F, C:F, E:T) that generated 0.32 expression units relative to the lowest unsuppressed ('True') output level. This cannot be explained solely by the incomplete downregulation of the clause molecule Target-(E)-(A)-(C) by SI4, as the same siRNA worked about two to three times more efficiently when the clause molecule was tested alone (e.g., see Supplementary Fig. 3 online). However, increasing the amount of the SI4 siRNA from 2.5 pmol to 10 pmol per transfection resulted in a repression improvement down to 0.08 units (data not shown). Similar improvement was obtained with the (A:F, B:F, C:T, E:T) evaluation that generates 0.22 units under standard conditions but may be reduced
fourfold by an increase in the T1 siRNA level.
Table 1: Operation of the Boolean evaluator
Full table
We next fused siRNA targets to the 3'-UTR of the LacI repressor27 driven by the cytomegalovirus (CMV) promoter (Fig. 1d) to evaluate a single-clause CNF expression C1: (D OR E) and a two-clause, two-variable expression C2: (D) AND (E). In the latter expression, each single-variable clause molecule was modified by the triple tandem repeat of the target instead of a single occurrence to improve repression efficiency28. The dsRed-monomer reporter of the truth values in CNF evaluators was under the control of the CAGOP promoter27 (Fig. 2d). The CNF evaluator (Table 1b) performs an AND operation between clauses and an OR operation within a clause; however, currently the CNF evaluator is quantitatively less robust than its DNF counterpart. We expect that tight repression on the one hand, and efficient downregulation by the siRNA on the other, will improve its performance. Apart from increasing the strength of the operator (CAGOP versus CMV-LacO) and fusing tandem repeats, we also tested a stronger repressor LacI-KRAB and thus were able to double the performance of the C1 evaluator (Table 1b). Nonetheless, additional fine-tuning of both the operator and the targets is still needed to improve scalability.
Our design framework allows parallel evaluation of an expression and its negation; this can improve the overall performance of the system. When two anticorrelated outputs are produced in parallel, their difference is a better indicator of the process outcome than individual outputs2. For example, a DNF expression e generates an evaluator circuit and a sensory interface that correspond to this expression; the result is judged by output O1. We can construct a parallel circuit where the output O1 is replaced by a repressor that regulates an expression of a different output O2. It is easy to see that when both circuits use the same sensory interface, the output O2 reflects the truth value of the expression NOT(e) and therefore the outputs O1 and O2 are anticorrelated. Table 1c demonstrates this feature for the trivial single-literal expression E1: (D).
This report represents a step toward in vivo programmable decision-making molecular automata by implementation of a computing core that evaluates logic expressions in standard forms. These forms, evaluated using two-level logic circuits, may entail an exponential increase in size for representing certain logic functions relative to multilevel circuits12. However, a reduction in the number of computation stages reduces the overall processing time of the circuit. Noise and signal degradation are an issue in both circuit architectures; signal restoration, that is, improving the ON/OFF ratio at intermediate stages greatly improves scalability and performance. In the case where the two-level logic representation cannot be implemented efficiently owing to the accumulation of incompletely repressed clauses, it is also possible to subdivide the computation into a hierarchy and introduce signal restoration. Currently the performance of our circuits is comparable to similar in vitro and in vivo logic networks that do not use this restoration. Certain mammalian transcriptional logic gates achieve a
20-fold average difference between the molecular levels that correspond to True and False outputs in 2–3 input logic gates10, and an evolutionarily optimized single-input cascade29 enables about a sevenfold difference between these outputs. In vitro and in vivo riboswitch systems1, 4, 5, 13, 16 and a FokI-based protein-release system14 achieve
10- to 100-fold True to False ratios. Large-scale in vitro systems1, 2, 3 show
10-fold True:False ratio. An order-of-magnitude difference in our experiments may be enough for many applications. However, we expect that signal-restoration motifs will improve performance, as suggested by a >1,000-fold On:Off ratio in a transcriptional circuit30 and a >100-fold True:False ratio in an in vitro system12.
We propose a sensory mechanism whereby one siRNA mediates the presence, and another the absence, of a given input through direct and opposite regulatory links, with the latter implementing the logic NOT operation12 (Supplementary Fig. 5 online). We envision both activation and inactivation mechanisms of siRNA-like molecules by diverse molecular inputs, as required by the automaton architecture. For example, recent work6 has demonstrated both inhibition and activation of siRNA by a small molecule whereas a DNA automaton2 used distinct subsequences of an mRNA molecule to oppositely regulate two different siRNA-like double-stranded DNA structures. An alternative mechanism would involve only one kind of regulatory link between the input and one of the mediators, with an additional inhibitory interaction between this and the complementary mediator (Supplementary Fig. 5). Our approach seems preferable for two reasons. First, in our arrangement, we require two molecular interactions for an input that is tested for either presence or absence, and four interactions when an input is tested for both (that is, appears both as a positive and a negative literal in a logic expression). In the alternative, an input tested for its absence requires three interactions (Supplementary Fig. 5), increasing the total number of interactions per circuit. Second, our design requires at most two consecutive interactions upstream of the computing core, whereas the alternative requires three when we test for an input absence; an increased number of steps will increase the probability of a failure.
Implementation of our circuits is challenging as it requires multiple and efficient siRNA structures with minimal crosstalk. We have largely overcome these challenges by using siRNA molecules developed with the help of computer-aided design15. In the future, the utility of such design principles for the construction of automata could be further improved by taking into account the selectivity and efficiency of siRNA-mediators both as sensors and as regulators of gene expression. Ultimately, molecular computing and synthetic biology may create molecular information-processing networks that are better than natural ones in their quantitative performance while permitting novel functionalities.
Приложение Г
БИОГРАФИЯ МИСТЕРА СЕЙМОРА КРЭЯ
Сеймор Р.Крей в 1950 году получил степень бакалавра наук електроинженерии в Университете Миннесоты. В 1951 он закончил магистратуру по специальности прикладной математики в этом же Университете.
С 1950 по 1951 годы Крей занимал несколько разных должностей в Ассоциации Инженерных Исследований (ERA), Сент-Пол, Миннесота. В ERA он работал над усовершенствованием ERA 1101 научного компьютера для правительства США. Позже он разработал большую часть ERA 1103, первого коммерчески успешного научного компьютера. В это время он также работал над множеством других компьютерных технологий, от вакуумных труб и магнитных усилителей до транзисторов.
Мистер Крей начинал свою карьеру как разработчик высококлассного компьютерного оборудования. Он был одним из основателей Корпорации контроля информации (CDC) в 1957 году и занимался разработкой самых успешных компьютеров этой компании, систем CDC 1604, 6600 и 7600. Он был директором CDC с 1957 по 1965 годы и занимал должность старшего вице-президента к моменту своего ухода в 1972 году.
В 1972 году Крей основал Cray Research, Inc. для разработки и создания самых совершенных суперкомпьютеров широкого пользования. Его компьютер CRAY-1 открыл новый стандарт во сверхвысокопроизводительных вычислениях на момент своего выпуска в 1976 году, а компьютерная система CRAY-2 представленная в 1985 году продвинула программирование для суперкомпьютеров далеко вперед.
В июле 1989 года он основал Компьютерную Корпорацию Крея для продолжения расширения рамок научного и инженерного программирования. Он смог сопоставить галлий арсенид логическое программирование и микроминиатюрные суперкомпьютеры. CRAY-4 достиг тактовую чистоту в одну наносекунду.
Крей автор множества технологий, которые были запатентированы компаниями, в которых он работал. Среди наиболее значимых: технология векторного регистра CRAY-1, технологии охлаждения для компьютеров серии CRAY, CDC 6600 фреон-охлаждающая система, магнитный усилитель для ERA, трехмерная взаимосвязанная модульная конструкция, использованная для CRAY-3 и для CRAY-5, и галлий арсенид логическое программирование.