Современные методы анализа транскриптомных профилей



Скачать 0.52 Mb.
страница 1/4
Дата 27.08.2016
Размер 0.52 Mb.
  1   2   3   4
МИНОБРНАУКИ РОССИИ
Федеральное государственное автономное образовательное

учреждение высшего профессионального образования

«Южный федеральный университет»
Факультет биологических наук

Кафедра генетики

Научно-образовательные материалы для студентов по теме


Современные методы анализа транскриптомных профилей

Золотухин Петр Владимирович

Ростов-на-Дону

2013


Содержание

Введение 3

Микрочипы на основе нуклеиновых кислот 5

Методология транскриптомного анализа на микрочипах 8

Анализ экспрессии генов с помощью микрочипов 10

Сиквенс/тэговые инструменты транскриптомики 19

Новые инструменты транскриптомики: RNA-Seq 20

Методические проблемы RNA-Seq 24

Подготовка образца к транскриптомному анализу 25

Статистическая и биоинформационная методология транскриптомики 28

Первичная обработка данных транскриптомного эксперимента 30

Контроль качества эксперимента 31

Статистические подходы к анализу экспрессионных данных 32

Оценка качества обработки результатов (пост-статистическая статистика) 34

Подготовка данных к анализу регуляторных паттернов 35

Кластеризация как способ определения регуляторных паттернов 39

Транскриптомика - биоинформатике и геномике: картирование генов и границ экзонов 43

Заключение 44

Приложение 1. Рекомендуемые ресурсы для подготовки к проведению транскриптомного эксперимента 46

Приложение 2. Стандартное лабораторное оборудование для целей транскриптомики 48

Приложение 3. Обозначения азотистых оснований для многозначной записи последовательностей, некоторых модификаций и синтетических азотистых оснований 49

Список использованных источников 50

Тестовые задания 56
Введение

Транскриптом - это набор экспрессирующихся РНК у данного организма или определенного набора клеток при конкретных условиях [1, 2, 3]. Транскриптомика - это набор инструментов и подходов для глобального анализа экспрессии генов. Цель транскриптомики - определение, описание механизмов регуляции экспрессии генов [3].

По завершении проекта ENCODE (the Encyclopedia Of DNA Elements) стало ясно, что большая часть генов транскрибируется не единственным образом. Сегодня ген понимается как часть генома, которая может рассматриваться как транскрипционная единица и которая может транскрибироваться в различные транскрипт-варианты, в том числе благодаря альтернативному сплайсингу [4]. В связи с этим к задачам транскриптомики относятся: выявление всех транскрипционных единиц, включая мРНК, некодирующие РНК и малые РНК; анализ транскрипционной структуры генов - сайтов инициации транскрипции, 5’- и 3’-концов генов; анализ паттернов сплайсинга и других посттранскрипционных модификаций [2]. Основная идея, позволяющая проводить такой анализ, заключается в том, что одновременно экспрессирующиеся или репрессированные гены могут быть совместно регулируемыми или функционально связанными [3].

Технологии полногеномной транскриптомики могут быть подразделены на 2 ветви [2, 3]:



  • анализ на основе микрочипов, созданных на основе уже известных последовательностей;

  • сиквенсный подход, делающий возможным транскриптомный анализ, не требующий предположений относительно экспрессирующихся локусов. Важное место среди сиквенс-подходов занимает сегодня RNA-Seq.

Сегодня благодаря появлению и совершенствованию методов транскриптомики получен огромный массив данных о закономерностях контроля экспрессии генов в самых разных аспектах. Получена масштабная информация о влиянии различных факторов на активность генома, и сегодня такие данные доступны в базах NCBI Geo Profiles и Geo Datasets. Появляется все больше информации о тканеспецифичных уровнях экспрессии всех генов во всех тканях человека и других животных, ознакомиться с профилями экспрессии можно в базах GeneCards (только человек) и BioGPS (человек и животные).

В фундаментальном плане развитие техник транскриптомики позволяет лучше понять не только мир РНК и его особенности в клетках различных тканей и у разных организмов. Методы полного профилирования транскриптома позволили выявить (на сегодняшний день) у человека 70 000 РНК, не кодирующих белок, а также качественное разнообразие транскрипции 21 000 белок-кодирующих генов (GeneCards). В свете достижений транскриптомики меняется и трактовка понятия “псевдоген”. Вся эта информация оказывается чрезвычайно важной для понимания молекулярной биологии клетки, так как именно на основе выявления методами транскриптомики “читаемых” участков ДНК делается вывод о закономерностях регуляции работы генома.

Транскриптомика - это также инструмент прикладных исследований. Например, в области биомедицины данные о закономерностях экспрессии генов используются для выявления нарушений течения клеточных процессов при патологиях. В последнее десятилетие транскриптомика широко применялась для изучения молекулярных основ развития огромного количества заболеваний, и транскриптомика оказывается эффективной для изучения групп патологий, для которых характерна высокая этиологическая гетерогенность при сходстве фенотипической манифестации.

Большинство исследований, о которых идет речь, проводилось с помощью наиболее удачной и эффективной до недавнего времени техники - анализа на микрочипах. Достижения технологий последних лет открывают новые горизонты транскриптомики, и в основном это связано с развитием второй ветви технологий транскриптомики - секвенирования [2, 4].


Микрочипы на основе нуклеиновых кислот

Нуклеиновокислотные чипы представляют собой классический пример технологии, в которой увеличение масштабов работы приводит к качественным изменениям полезности этого метода. Чипы с нуклеиновыми кислотами на нитроцеллюлозе применялись многие годы (если учитывать точечные и ячеечные варианты блоттинга, используемые для оценки экспрессии генов с конца 70-х годов ХХ века). В последние годы чипы с нуклеиновыми кислотами перешли к ныне обычному «геномному» виду, для которого справедливо, при пересечении некоей границы (когда количество генов на чипе начинает представлять значительную часть генов генома, или представлен определенный набор важных генов), уже нелинейное повышение экспериментальной ценности чипа [5].

Гибридизационные подходы, как правило, связаны с инкубированием флуоресцентно меченых кДНК или антисэнс-РНК с собственными исследовательскими нуклеиновокислотными микрочипами или коммерческими высокоплотными олигонуклеотидными чипами (рисунок 1) [2, 4].

Рисунок 1 - Двуцветный (слева) и одноцветный (справа) варианты анализа транскриптома на микрочипах [4]. IVT (транскрипция in vitro) не является строго обязательным этапом анализа.


Технологией чипов с нуклеиновыми кислотами называется производство и использование чипов, содержащих тысячи образцов нуклеиновых кислот, связанных с твердым субстратом, например, предметными стеклами для микроскопии или тонкослойными силиконовыми носителями. В последние годы появился новый формат чипов, называемых жидкостными, однако твердый субстрат в них присутствует - в виде микрошариков (bead).

Так как физическая площадь, занимаемая каждым образцом, составляет от 50 до 200 мкм в диаметре (на нежидкостных чипах), то чипы нуклеиновых кислот, представляющие целые геномы, варьирующие в размере от 3000 до 32000 генов, могут быть эффективно расположены на одном обычном предметном стекле для микроскопии на площади, легко закрываемой покровным стеклом [5].

Для специальных задач транскриптомики существуют такие чипы, как, например, чипы с олигонуклеотидыми зондами, комплементарными сайтам сшивки экзонов, позволяющие анализировать сплайс-варианты РНК [2, 4].

Экзоновые чипы разработаны для идентификации известных или предсказанных экзонов. Экзоновые чипы - это модификация обычных чипов для экспрессионного анализа, отличающиеся расположением и количеством зондов на экзоны. При этом с помощью экзонных чипов можно анализировать не только сплайсинг, но и общую экспрессию генов [4].

Высокоплотные геномные чипы (tiling arrays) позволяют картировать транскрибируемые локусы с очень высоким разрешением - от сотен пар нуклеотидов и до всего нескольких пар нуклеотидов [2]. Отличием высокоплотных геномных чипов от стандартных экспрессионных чипов является то, что на высокоплотный чип наносятся зонды, комплементарные геномным областям на заданном расстоянии [4].

Гибридизационные подходы транскриптомики сравнительно дешевы (кроме высокоплотных геномных техник) и позволяют вести крупномасштабные по количеству образцов исследования. К недостаткам гибридизационных технологий относятся необходимость априорного знания анализируемых последовательностей генома, высокий уровень фонового шума из-за кросс-гибридизации и ограниченный динамический спектр детекции сигнала - из-за фона с одной стороны и насыщения спотов (зон нанесения зондов на матрицу чипа) - с другой. Неустранимая техническая особенность анализа на чипах - использование мечения молекул флуорохромами - осложняет анализ и даже в одноцветном варианте делает определение экспрессии непрямым.


Методология транскриптомного анализа на микрочипах

Среди гибридизационных подходов транскриптомики наиболее распространены 2 типа: одноцветный и двуцветный микрочиповые эксперименты.

Двуцветный вариант был разработан в середине 90-х годов XX века. Принцип метода заключается в конкурентной гибридизации двух образцов, помеченных разными флуорохромами. После гибридизации чип сканируется с помощью лазера с излучением соответствующей длины волны. Флуоресценция по обоим каналам отражает относительное количество РНК данного вида в обоих образцах, и после коррекции сканированных данных можно получить соотношение экспрессий генов двух образцов. Традиционно высокое качество чипов для транскриптомики характерно для NimbleGen (сейчас компания принадлежит Roche) [5, 6, 7].

В случае одноцветного метода РНК-образец метится флуоресцентной краской или биотином и гибридизуется на один чип с миллионами копий коротких (24 нт) олигонуклеотидных зондов, охватывающих выбранный исследователем (индивидуальный дизайн чипов может быть заказан NimbleGen/Roche; остальные авторитетные производители предлагают лишь выбор чипов по ширине охвата генома) набор генов (на каждый ген - по нескольку высококопийных зондов). После сканирования образца лазером получаются данные об абсолютном уровне экспрессии. Одними из наиболее популярных производителей одноцветных чипов являются Affymetrix и Illumina [8, 9].

Основные экспериментальные стадии анализа экспрессии на микрочипах:


  • Дизайн и печать или покупка чипов

  • Подготовка РНК к мечению

  • Обратная транскрипция (с мечением)

  • Транскрипция in vitro или ПЦР (с мечением) (опционально)

  • Гибридизация на чипе

  • Отмывка

  • Сканирование

Наиболее подходящий протокол проведения каждой из стадий подбирается в зависимости от целей и задач исследования, используемых образцов и материального оснащения лаборатории. В общем виде с протоколами проведения реакций можно ознакомиться в книге-сборнике протоколов Current Protocols in Molecular Biology [5]. Описанные там общие протоколы работы могут и должны быть модифицированы в соответствии с проводимым исследованием и достижениями технологий (в т.ч. совершенствования ферментов), не успевших найти отражение в этом (обновляемом) сборнике. Некоторые главы Current Protocols in Molecular Biology (и других сборников серии Current Protocols) могут быть найдены в свободном доступе в NCBI PubMed и PMC (остальные главы доступны через подписку, но также индексируются в PubMed).
Анализ экспрессии генов с помощью микрочипов

Дизайн и печать или покупка чипов. Первоначальный выбор типа чипа - коммерческий или внутрилабораторный - зависит от возможностей и задач лаборатории, и в каждом случае у чипов есть свои преимущества и недостатки.

Коммерческие чипы дешевы относительно количества анализируемых генов, количества нанесенных на чип зондов на отдельные участки гена; они проходят очень строгий контроль качества и, что немаловажно, приходят к покупателю в идеально чистом виде.

К недостаткам коммерческих чиповых технологий можно отнести общую дороговизну технологии и наметившуюся тенденцию к диверсификации формата чипов (и появлению жидкостных чипов), а это влечет за собой либо повышенные расходы на закупку оборудования разных производителей для одной цели, либо привязку к единственному производителю чипов. К общим недостаткам высокоплотных чипов можно отнести чрезвычайно ресурсоемкий этап математической и статистической обработки данных, а также зависимость от проприетарного программного обеспечения. Огромные объемы информации, генерируемой в эксперименте с высокоплотными чипами, требуют наличия в лаборатории мощных компьютеров (от 16 ГБ оперативной памяти), покупки ПО или использования свободного статистического ПО для анализа чипов, у которого, на настоящий момент, пользовательский интерфейс таков, что необходимо дополнительное обучение специальным языкам программирования (программные пакеты для обработки данных обсуждаются в соответствующем разделе).

Внутрилабораторные чипы имеют неоспоримое преимущество в обязательном индивидуальном дизайне зондов (однако это трудоемкий процесс) и чипа. Дизайн зондов также может быть позаимствован из открытых источников - баз NCBI GEO. Для собственной разработки зондов рекомендуется кросс-платформенная среда Oligo 7 или более старших версий. Стоимость собственного чипа гораздо ниже, чем у коммерческого. Для небольших лабораторий может иметь значение и то, что собственные чипы могут печататься на любом удобном носителе - микроскопном предметном стекле или мембране, и на каждом стекле можно печатать от одной до нескольких десятков чип-реплик. Чип-принтеры, как правило, имеют очень широкий спектр применения и позволяют не только печатать нуклеиновокислотные, но и белковые чипы, мембраны и планшеты.

В то же время внутрилабораторные чипы всегда низко- или средне-плотные, и чем выше плотность - тем выше проблема контроля качества и качества вообще. Низкоплотные чипы могут быть использованы для печати не более, чем 200 зонд-спотов в десятикратном повторении, что несравнимо с коммерческими высокоплотными чипами (40 и больше тысяч спотов). При этом стандартные требования дизайна чипов (базовая (не соль-доведенная) температура плавления зонда 75 градусов (удобный инструмент расчета - OligoCalc); температура гибридизации 65 градусов) могут представлять для исследователя серьезную проблему, несвойственную коммерческим чипам (где на каждый ген может приходиться по 10 разных зондов, а значит вычисление “истинной” экспрессии гена не представляет методологических трудностей). Каждый из этапов печати и хранения чипов сопровождается опасностью загрязнения чипа пылью, что является критическим для проведения анализа. Общее качество печати чипа, а также трудоемкость и цена зондов очень сильно зависят от выбранного субстрата.

В продаже имеется широкий спектр стекол с модификациями для печати чипов (рекомендуемый производитель стекла для чиповых технологий – Corning [10]: аминосилановые, эпоксидные, полилизиновые и др. Наиболее удобными для печати чипов выглядят эпоксидные стекла, так как они не требуют введения в зонды модификаций или кросслинкинга (в отличии от аминосилановых и полилизиновых). С другой стороны, полилизиновые стекла могут быть относительно легко произведены в лаборатории.

В общем случае для печати чипа (на основе авторского анализа протоколов из Current Protocols in Molecular Biology и от Corning) необходимы SSC, двузамещенный фосфат натрия, газообразный азот высокой очистки, стекла-субстрат (например - Corning® epoxide coated slides), реагенты для приготовления фосфатно-солевого буфера, Tween 20, этанол, деионизованная вода, соли для контроля влажности (если контроль влажности не поддерживается принтером), планшеты для зондов, зонды и контейнеры для безопасного хранения чипов. Рекомендуется использовать (на данном и других этапах работы) реагенты производства Sigma Aldrich [11], если не указывается другой производитель.

Подготовка РНК к мечению. В зависимости от целей исследования, исходного количества РНК и доступности расходных материалов, можно провести обогащение фракции поли-(А)-РНК колоночным методом (рекомендуемый производитель - Qiagen; например, могут быть использованы колоночные киты Oligotex mRNA). Оценить примерный выход тотальной и матричной (как правило, мРНК составляет 1-5% от тотальной) РНК можно по таблице 1 (по данным MACS Molecular/Miltenyi Biotec[12]:

По данным Qiagen [13], выход тотальной РНК из цельной крови составляет 1.2 - 8 мкг/мл.

Таблица 1 - примерный средний выход тотальной и матричной РНК из различных клеток и тканей

Обогащение фракции мРНК перед обратной транскрипции (ОТ) необязательно, а в случае работы с белок-кодирующими генами, для которых нехарактерны поли-(А), или малыми/некодирующими РНК, эта стадия должна быть пропущена.

Как альтернатива колоночной очистке существует способ снижения вовлечения рРНК в реакцию ОТ путем повышения температуры обратной транскрипции с 37-40 градусов до 50оС , при этом выход кДНК снижается (эта проблема частично решается выбором более устойчивой ревертазы, см. следующий раздел).

Еще одна альтернатива для обогащения кДНК-производной мРНК - уже на стадии ОТ - использование олиго(дТ)-праймеров. В случае использования при ОТ олиго(дТ)-праймеров, следует убедиться, что зонды микрочипов попадают в 600 последних нуклеотидов кодирующей последовательности, если только 3’-НТО не включает более 800 нуклеотидов - в таком случае часть 3’-НТО также может быть включена в область подбора зондов [5].



Обратная транскрипция. При обратной транскрипции могут использоваться разные праймеры - случайные гексамеры (в микрочиповых технологиях рекомендуется использовать random 6 только если для ОТ подготовлена очищенная мРНК), поли-(дТ), заякоренные поли-(дТ) (отжигаются на 5’-конец поли-(А) хвоста благодаря наличию на 3’-конце dVdN-димера). При непосредственном мечении кДНК могут быть использованы как флуоресцентные (или аминоаллильные для последующей конъюгации с флуорохромами) модификации нуклеотидов, так и меченые случайные n-меры. В качестве флуорохромов очень часто используют цианиновые красители Cy (Cy3 и Cy5; патент принадлежит GE Healthcare [14], по праву преемственности от Amersham), а в последнее время все чаще в микрочиповых технологиях находят применение более дешевые красители Alexa (производство - Life Technologies - компания, образовавшаяся в результате слияния Applied Biosystems и Invitrogen) [15]. Нужно помнить, что флуорохромы нестабильны, и, например, краски Cy3 и Cy5 чувствительны не только к свету, но и к концентрации озона в атмосфере (необходим контроль атмосферы - содержание озона не должно превышать 1:50000000 (20 ppb)) и влажности (влажность должна быть ниже 40%).

Выбор модифицируемого нуклеотида (dCTP, dTTP/dUTP, dGTP, dATP) и модификации зависят во многом от используемого в реакции фермента - обратной транскриптазы. Рекомендуемые к использованию ферменты семейства SuperScript (I, II, III) являются модификациями ревертазы M-MLV, разрабатываемыми бывшей Invitrogen (сейчас - часть Life Technologies). С характеристиками ферментов можно ознакомиться на сайте производителя [15] и на рисунке 2.





Рисунок 2 - Зависимость активности обратных транскриптаз Invitrogen и M-MLV от температуры и времени инкубации [15]

Частота инкорпорации (включения нуклеотида в синтезируемую цепь) определяющая способ приготовления реакционной смеси для ОТ, должна учитываться при разработке протокола эксперимента, так как даже модифицированные родственными красителями Cy3 и Cy5 нуклеотиды имеют заметно отличающиеся частоты инкорпорации. Оценить параметры инкорпорации различных нуклеотидов можно по запросу производителю. Например, данные Jena Biosciense [16] по различным модификациям dUTP приведены на рисунке 3.

Рисунок 3 - Частоты инкорпорации различных модификаций dUTP различными ферментами.

При использовании для микрочиповых целей ревертазы SuperScript III (Life Technologies) совместно с Alexa Fluor 555-aha-dUTP и Alexa Fluor 647-aha-dUTP необходимо 5 - 20 мкг тотальной РНК или 0.4 - 2 мкг мРНК; могут быть использованы и меньшие количества, но это может негативно сказаться на последующих стадиях работы и анализа.

После проведения ОТ с флуоресцентными модификациями нуклеотидов, необходимо удалить из смеси неизрасходованные нуклеотиды. Очистка меченой кДНК проводится колоночным методом с использованием картриджей Microcon YM-100, аналогов, или специальных коммерческих систем очистки (Qiagen, Life Technologies).

Согласно обобщенному протоколу, для мечения кДНК необходимы смеси нуклеотидтрифосфатов с пониженной концентрацией нуклеотида, по которому будет вестись мечение флуоресцентными аналогами; ингибитор РНКаз (доступен широкий выбор ингибиторов), ревертаза, дитиотреитол, ТРИС, гидроксид натрия, ЭДТА, блокирующая С0t-ДНК человека, агарозный гель (для проверки инкорпорации и хода ОТ), ТАЕ-буфер.

Транскрипция in vitro или ПЦР. В целях амплификации сигнала возможно проведение процедур in vitro-транскрипции (IVT) и ПЦР. IVT представляет собой метод количественной амплификации мРНК с получением антисенс-РНК. РНК образца реверс-транскрибируется с использованием праймера T7T24, т.е. праймера с сайтом связывания РНК-полимеразы T7 на 5’-конце и 24-(дТ) участком на 3’-конце. В таком случае в реакции гибридизации участвует меченая амплифицированная РНК, но всегда комплементарная матрице (антисэнс РНК). IVT на первых этапах проводится так же, как и обратная транскрипция с мечением, но без инкорпорации модифицированных нуклеотидов в кДНК и с синтезом второй цепи кДНК. Именно вторая цепь кДНК транскрибируется РНК-полимеразой Т7 с использованием модифицированных нуклеотидов с образованием антисенс-РНК.

Альтернативно, перед гибридизацией с низкоплотным чипом может быть проведена ПЦР с целью амплификации кДНК интересующих транскрибируемых локусов. Этот подход не рекомендуется, так как очень сложно или невозможно провести ПЦР так, чтобы амплификация всех интересующих генов прошла равномерно. Правомочность применения стадии амплификации, будь то IVT или, тем более, ПЦР, всегда остается под большим вопросом. Необходимо также учитывать, что IVT может быть использована для амплификации только поли-(А)-РНК.



Гибридизация на чипе. Общее правило при подборе объема наносимого на чип образца - на каждый 1 мм2 поверхности чипа приходится 0.033 мкл образца. Чип на основе предметного стекла, покрываемый стеклом 24х50 мм, потребует 40 мкл образца. Очень большое внимание должно уделяться как процедуре нанесения образца (избегать пузырей), так и качеству используемых расходных материалов (покровное стекло должно быть максимально возможно ровным).

Компоненты гибридизационной смеси, как правило, содержат меченые образцы, ДЭПК-воду, блокирующие молекулы (C0t-ДНК, тРНК дрожжей, раствор Дэнхардта (Denhardt’s solution); поли(дА) - если чипы печатаются с использованием кДНК), SDS (добавляется после смешивания предыдущих компонент, прогревания и охлаждения).

Необходимо помнить, что флуоресцентно меченая кДНК имеет тенденцию к образованию агрегатов, мешающих считыванию сигналов. Агрегаты могут быть удалены центрифугированием.

Образец наносится на покровное стекло и покрывается перевернутым чипом. После нанесения образца, чип помещают в гибридизационную камеру и в увлажняющий отсек камеры или на матовый край наносят 3х SSC. Помимо образцов, рекомендуется загружать чип с раствором, в котором отсутствует образец - для проверки вытекания и высыхания гибридизационного раствора (при сканировании будет сильный флуоресцентный шум). Инкубация (гибридизация) проводится обычно при 65 градусах в течение 16 и более часов (до 20 или дольше, если необходимо).



Отмывка. По рекомендации NimbleGen/Roche, все реагенты для отмывки следует готовить на воде производства VWR [17] и с добавлением восстановителя дитиотреитола.

Перед тем, как достать чип, необходимо дать остыть и высохнуть гибридизационной камере (если она погружается). Чип с покровным стеклом помещают в промывочную камеру (сосуд Коплина) с раствором SSC/SDS. Покровное стекло должно отойти самостоятельно, после чего его можно удалить пинцетом. Отмывка проводится 2-5 минут, после чего чип переносят в сосуд с 0.06x SSC и инкубируют 2-5 минут. Затем чип быстро переносят на держатель и помещают на планшетную центрифугу. Проводят мягкое центрифугирование (167 g) во избежание образования флуоресцирующих разводов из-за высохшей на чипе жидкости.



Сканирование. Настройки сканера сильно зависят от самого прибора. В общем случае при двуцветном сканировании напряжение фотоумножителя и мощность излучения подбираются так, чтобы самые яркие сигналы считывались в почти максимальную величину, а свечение фона (пространства между спотами) стремилось к нулю (отдельно для каждого канала, но с максимальным сходством параметров считывания самых ярких сигналов и фона).
  1   2   3   4


База данных защищена авторским правом ©infoeto.ru 2022
обратиться к администрации
Как написать курсовую работу | Как написать хороший реферат
    Главная страница