Введение в scRNA-Seq

Введение в scRNA-Seq

 

Принципиальная схема scRNA-Seq эксперимента

источник

 

Методы секвенирования РНК одиночных клеток (scRNA-Seq) теперь надежны и экономически обоснованны и становятся мощным инструментом для высокопроизводительного анализа состояний и динамики популяций клеток с помощью анализа их транскриптомов, и теперь это можно делать с высокой пропускной способностью. Подходы для одиночных клеток позволяют обходить артефакты усреднения, связанные с традиционными проблемами данных для массовой популяции, давая новые представления о клеточном разнообразии внутри поверхностно однородных популяций. До сих пор scRNA-Seq уже показало большую эффективность в обнаружении сложных популяций клеток, восстановлении траекторий развития и моделировании динамики транскрипции. Продолжающиеся технические усовершенствования пропускной способности и чувствительности scRNA-Seq, разработка более сложных аналитических структур для данных с одной ячейкой и увеличение набора дополнительных анализов с одной ячейкой все обещают расширить полезность и потенциальные применения scRNA-Seq транскрипционного профилирования.

 

Введение

Появление секвенирования NGS более десятилетия назад стимулировало разработку целого ряда технологий секвенирования для исследования геномных вариаций и их динамики. Из этих методов РНК-секвенирование (RNA-Seq) позволило осуществлять транскриптомное профилирование с беспрецедентной чувствительностью и охватом, что привело к открытию новых видов РНК и углублению нашего понимания динамики транскриптома. В последние годы методы RNA-Seq с низкой входной РНК были адаптированы для работы c одиночными клетками. Эти scRNAseq технологии могут количественно определять внутригрупповую гетерогенность и позволяют изучать состояния и переходы клеток при очень высоком разрешении, потенциально выявляющие клеточные подтипы или динамику экспрессии генов, которые не видны в массовых, усредненных по популяции измерениях. 

В этом обзоре мы обсудим последние достижения и текущие ограничения методологий scRNA-seq и выделим основные применения scRNA-seq в биологических исследованиях.

 

Технологии scRNA-seq

За последние шесть лет были разработаны многочисленные протоколы экспериментов для scRNA-seq. В настоящее время опубликованные протоколы scRNA-seq следуют одному общему принципу:

- отдельные клетки изолируют; 

- клетки лизируют; 

- методом обратной транскрипции на матрице РНК получают комплементарную ДНК (кДНК); 

- кДНК амплифицируют, а затем используют для получения библиотек для секвенирования и последующего анализа. 

В работе Kolodziejczyk et al. представлен всесторонний обзор отдельных протоколов scRNA-seq и их относительных сильные и слабые стороны.

Хотя предварительная амплификация кДНК необходима, потому что только небольшие количества РНК возможно изолировать из каждой клетки, ошибка амплификации, возникающая во время предварительной амплификации, ограничивает количественную точность scRNA-seq. Уникальные молекулярные идентификаторы (UMI) могут быть использованы для  баркодирования отдельных молекул РНК на стадии обратной транскрипции, что позволяет осуществлять прямой подсчет транскриптов, и многие из новых протоколов scRNA-seq используют UMI для улучшения количественного определения транскриптов. Альтернативным вариантом служат экзогенные контроли РНК, такие как стандарты от Внешнего консорциума по контролю РНК (External RNA Control Consortium, ERCC), могут быть «добавлены» в   пробу содержащую клеточную РНК для сопоставления между относительным и абсолютным количеством транскриптов [20,30]. Stegle et al. предоставляют более подробное обсуждение методов количественного определения транскриптов scRNA-seq и выдвигают на первый план некоторые аналитические проблемы, уникальные для одноклеточных данных.

Методы scRNA-seq также улучшились с точки зрения пропускной способности и масштабируемости. В то время как большинство ранних методов ограничивалось измерением сотен или тысяч клеток за один раз, последние достижения в стратегиях баркодирования клеток на основе microwell и droplet-based технологий позволили провести анализ десятков тысяч клеток в одном эксперименте. Высокая пропускная способность этих новых технологий увеличивает разрешение одноклеточных экспериментов, улучшает их способность обнаруживать подтипы редких клеток или переходные состояния.

 

Возможности и ограничения scRNA-seq

Современные технологии scRNA-seq по-прежнему сталкиваются с рядом проблем. В совокупности существующие методы scRNA-seq имеют низкую эффективность захвата. Так как в последних библиотеках секвенирования представлена лишь небольшая часть транскриптов каждой клетки (приблизительно 10% для многих протоколов), scRNA-seq обладает ограниченной чувствительностью и не может надежно обнаруживать транскрипты с низкой копийностью. Низкое количество входного материала для библиотек scRNA-seq также приводит к высоким уровням технических шумов, что усложняет анализ данных и может маскировать лежащие в основе биологические вариации. Были предложены методы моделирования технических изменений в данных scRNA-seq; Однако большинство подходов используют вариацию внутри выборки в показаниях рид каунтов ERCC для моделирования и контроля технических шумов в данных scRNA-seq и, таким образом, могут использоваться только в экспериментах, включающих в себя элементы управления внутренними контролями (spike-in). Более того, эти подходы предполагают, что транскрипты внутренних контролей обрабатываются так же, как клеточная РНК во время подготовки библиотеки. Однако "голая" контрольная РНК не проходит через клеточный лизис и не находится в комплексе с рибосомами или РНК-связывающими белками. Таким образом, несмотря на то, что процедуры внутреннего контроля служат полезными показателями частоты и чувствительности транскриптов в эксперименте, существует множество источников изменчивости, которые по-прежнему трудно контролировать в scRNA-seq исследованиях.

Другой потенциальный источник ошибок связан с процедурами изоляции и захвата отдельных клеток. Хотя методы микроманипуляции или лазерной диссекции могут изолировать отдельные клетки от известных мест в клеточной популяции или ткани, эти методы являются трудозатратными или требуют специального оборудования. Большинство протоколов scRNA-seq и все существующие высокопроизводительные методы сначала диссоциируют ткани до образования одноклеточной суспензии перед захватом отдельных клеток. Эта стадия клеточной диссоциации часто нетривиальна, и ферментативные обработки, методы используемые для разрушения тканей, могут влиять на жизнеспособность клеток, что потенциально влияет на транскрипционные профили клеток. Чтобы избежать ошибок, вызванных такими ферментативными обработками, Grindberg et al. разработали методы для выполнения RNA-seq непосредственно на отдельных ядрах, которые могут быть выделены без использования жесткой обработки протеазами.

Для большинства процедур изоляции одиночных клеток информация об исходном пространственном контексте клетки и окружающей клеточной среде теряется. Недавно были разработаны вычислительные методы, позволяющие вывести исходное положение клетки в трехмерном пространстве из ее профиля транскрипции с использованием карты экспрессии референсных генов, построенной на основе существующих данных in situ. Однако эти методы основаны на существовании данных пространственного экспрессии для группы референсных генов в представляющей интерес ткани. Альтернативным вариантом служат возникающие стратегии секвенирования in situ способные захватывать и амплифицировать РНК в исходном контексте ткани, хотя современные методы могут измерять вплоть до нескольких десятков генов на клетку. Эти методы секвенируют РНК непосредственно внутри неразрушенной клетки: ампликоны кДНК генерируются и циркулируют, амплифицируются через циклическую амплификацию и затем секвенируются путем лигирования с помощью платформы SOLiD. Такие подходы к секвенированию in situ отличаются от стратегий флуоресцентной гибридизации in situ (fluorescence in situ hybridization, FISH), которая обнаруживает транскрипты посредством связывания флуоресцентно меченных зондов. Однако, хотя методы секвенирования in situ сохраняют пространственную информацию и могут измерять паттерны экспрессии РНК на субклеточном уровне, эти подходы в настоящее время ограничены по пропускной способности и требуют специализированных инструментов, которые могут быть недоступны.

Наконец, основная часть литературных источников по scRNA-seq была сосредоточена исключительно на мРНК; Почти все опубликованные протоколы scRNA-seq изолируют клеточную РНК с использованием поли-Т прайминга, который захватывает только полиаденилированные транскрипты. Следовательно, современные методы плохо подходят для исследования классов не-полиаденилированных транскриптов, таких как регуляторная некодирующая РНК (например, микроРНК, длинная нкРНК или кольцевые РНК) или бактериальной РНК. Случайный гексамерный прайминг может сработать как способ одновременного захвата как полиаденилированных, так и неполиаденилированных транскриптов в отдельных клетках, и выбранные с помощью вычислительных методов «неслучайные» праймеры могут быть потенциально использованы для захвата поли (A)+ И поли (А)- видов при истощении рибосомальной РНК . Включение этих альтернативных стратегий прайминга в существующие технологии scRNA-seq позволило бы изучить более широкий спектр типов транскриптов, расширив сферу применения и применимость scRNA-seq.

 

Применение scRNA-seq

Недавние исследования продемонстрировали высокую степень межклеточной транскриптомной вариативности даже в генетически гомогенных популяциях клеток. Следовательно, измерения большого количества клеток могут маскировать важную клеточную гетерогенность и приводить к артефактам усреднения . Одним из основных преимуществ scRNA-seq является его способность обнаруживать такую межклеточную гетерогенность и использовать ее, чтобы выявить структуру популяции и клеточную динамику, скрытую на групповом уровне. ScRNA-seq используется для выделения гетерогенных клеточных популяций и сложных тканей, таких как кишечник, селезенка, легкие или мозг. Методы кластеризации  или методы уменьшения размерности  могут быть использованы непосредственно в данных по экспрессии одиночных клеток для группировки с помощью транскриптомного сходства и для обнаружения базовой популяционной структуры без предварительных данных.

Подгруппы клеток, идентифицированные из таких анализов, часто могут быть сопоставлены с известными типами клеток с помощью ранее установленных маркерных генов; Однако структурный анализ одноклеточных данных также привел к открытию новых подтипов клеток, а также к идентификации новых маркерных генов для известных типов клеток. В контексте онкологических заболеваний для оценки внутриопухолевой гетерогенности и классификации субпопуляций опухолей может быть использовано scRNA-Seq. Профилирование scRNA-seq также может обнаруживать вариацию среди клеточных состояний в кажущейся гомогенной популяции, например, различия в стадиях клеточного цикла или клеточные ответы на внешний стимул.

ScRNA-seq также широко используется для изучения клеточных переходов между различными состояниями и выявления траекторий клеточных процессов, подобных дифференцированию.

 

В ряде работ предложено несколько аналитических подходов для выявления таких траекторий: в данной статье вводится понятие «псевдовремени» как количественной меры «прогресса через биологический процесс» и использует методы вычислительной геометрии для упорядочивания клеток в псевдовремени на основе их транскрипционных профилей. Wanderlust использует совершенно другой алгоритм, основанный на локальной топологической кластеризации для размещения клеток вдоль траектории развития с использованием протеомных измерений одиночных клеток. Позднее Shin et al. и Moignard et al. наметили дополнительные стратегии для восстановления траекторий клеток. Как только клетки упорядочены вдоль траектории, можно проанализировать экспрессию генов в образцах в течение установленной траектории развития, чтобы идентифицировать ключевые регуляторы и гены с «переключающим» поведением. Чувствительность для идентификации промежуточных состояний дифференциации также может быть улучшена с использованием моделей со скрытой переменной для учета возможных мешающих факторов (таких как клеточный цикл) в данных экспрессии до применения методов траекторного анализа.

Данные недавних экспериментов свидетельствуют о том, что гены не транскрибируются непрерывно, а скорее проходят короткие всплески транскрипции с чередующимися интервалами молчания. Переходы между состояниями «включено» и «выключено» регулируются несколькими стохастическими процессами, и этот феномен «транскрипционного разрыва» является основным источником гетерогенности экспрессии генов между клетками. ScRNA-seq может использоваться для изучения механики транскрипции и моделирования кинетики стохастической транскрипции генов.

Недавние исследования также сообщали о клетках, преимущественно экспрессирующих один аллель или единственную изоформу сплайсинга; Однако низкая эффективность захвата мРНК scRNA-seq затрудняет получение окончательных выводов об аллель-специфической или изоформ-специфичной экспрессии на уровне одиночных клеток. Врожденная вариабельность экспрессии гена между клетками в данных scRNA-Seq может быть использована для построения регуляторных сетей генов (gene regulatory networks, GRN). Чаще всего, гены сгруппированы в ко-регулируемые «модули» по сходству профиля экспрессии.

Анализ таких сетей из данных scRNA-seq ставит несколько задач. Из-за низкой эффективности захвата и стохастической экспрессии гена, выпадение гена (случай, когда экспрессия гена равно нулю в данной клетке) является довольно распространенным явлением, приводящим к "нулевому раздуванию" данных экспрессии. Хотя для обеспечения ожидаемого отсева могут использоваться нуль-завышенные распределения, такие модели также имеют большее число параметров и их сложнее подобрать, чем более простые модели, особенно когда размер выборки ограничен. Как упоминалось ранее, данные scRNA-seq содержат очень шума, и отделение биологической вариации от технического шума остается нерешенной проблемой. Кроме того, количество параметров модели, подлежащих оценке (гены и взаимодействия генов), как правило, значительно превышает количество выборок наблюдений (измеренных клеток), и это несоответствие создает проблемы для оценки параметров. Упрощение модели на основе предварительных знаний или сосредоточение внимания только на небольшой подсети ключевых генов могут оказаться необходимыми для обеспечения возможности оценки параметров. Наконец, экспериментальная проверка выведенных GRN может быть очень сложной; В то время как нокаут одного гена относительно прост, нарушение взаимодействия между двумя белками или между белком и его мишенью может быть намного сложнее, и очень немногие гипотетические модели были тщательно протестированы.

 

Выводы.

Технология scRNA-seq значительно усовершенствовалась с момента ее создания, продвинувшись с точки зрения как количественной оценки транскриптов, так и экспериментальной пропускной способности. В то время как низкая эффективность захвата и высокие уровни технических шумов ограничивают чувствительность и точность scRNA-seq, появляются более изощренные аналитические подходы, облегчающие интерпретацию данных scRNA-seq. Сопоставление транскрипционных данных одиночных клеток с  информацией  геномных анализов одиночных клеток также обещает дать новое понимание динамики транскрипции и механизмов, лежащих в основе генной регуляции. scRNA-Seq была очень эффективной при разделении сложных гетерогенных клеточных популяций, что давало возможность изучения структуры популяции  и открытия новых подтипов и редких видов клеток без предварительных данных. В контексте динамических процессов, траектории клеток, восстановленные из  транскрипционных данных scRNA-Seq, обеспечили понимание переходных промежуточных клеточных состояний и помогли идентифицировать ключевые регуляторные гены.

 Наконец, scRNA-seq также показывает большой потенциал для выяснения стохастической кинетики транскрипции и выведения регуляторных сетей генов. Тем не менее, анализ сетей из данных scRNA-seq является сложным с точки зрения вычислений и трудно поддающимся проверке; Предполагаемые сетевые модели должны подвергаться критической оценке и, по возможности, испытываться экспериментально.

все для dle
+3
Добавить комментарий

Оставить комментарий