Выбор алгоритма формирования олигонуклеотидных кластеров при подготовке к массовому параллельному секвенированию ДНК
Дмитрий А. Белов, Антон Л. Буляница, Яков И. Алексеев, Анатолий А. Евстрапов;
Институт аналитического приборостроения РАН, Санкт-Петербург, Россия
Abstract
Наиболее популярным методом высокопроизводительного секвенирования ДНК является метод массового параллельного секвенирования путем синтеза, реализуемый, в том числе, компанией Illumina. Современная реализация метода заключается в предварительном формировании множества кластеров олигонуклеотидов в структурированных лунках на поверхности проточной ячейки, и последующем определении последовательностей олигонуклеотидов путем детектирования флуоресцентных меток.
При подготовке ячейки необходимо, чтобы максимальное количество лунок было занято единичными копиями олигонуклеотидов. Одноэтапное заполнение лунок предполагало бы использование сразу всех олигонуклеотидов числом N от сотен тысяч до миллиардов.
Отбор пробы может осуществляться в несколько этапов. Распределение числа частиц k, попавших в каждую из М лунок, описывается законом распределения Пуассона с параметром, равным средней заселенности, т.е. отношению NN/M, где NN – число олигонуклеотидов после разбавления пробы на определенном этапе анализа. От числа олигонуклеотидов (фрагментов ДНК), попавших в конкретную ячейку, зависит эффективность их расшифровки, а в случае попадания более, чем одного олигонуклеотида может быть зарегистрирован и расшифрован только один из них.
Требуется подобрать схему анализа, обеспечивающую выполнение комплекса трудно сочетаемых требований: повышение эффективности использования лунок, минимизация потерь информации из-за нерегистрируемых олигонуклеотидов и снижение времени анализа.
Представлены решения, соответствующие схемам заполнения ячейки при различных интегральных показателях качества. На основе этих решений даны рекомендации по выбору алгоритма анализа в зависимости от относительной значимости характеристик: минимизация числа лунок М, минимизация доли «потерянных» нуклеотидов или/и использованных лунок, максимизация экспрессности анализа и различных комбинаций указанных требований.
Speaker
Антон Л. Буляница
Институт аналитического приборостроения Российской академии наук
Россия
Discussion
Ask question