технология определения анеуплоидии методом секвенирования
Классы МПК: | G01N33/48 биологических материалов, например крови, мочи; приборы для подсчета и измерения клеток крови (гемоцитометры) C40B50/00 Способы получения библиотек, например комбинаторный синтез G06F19/20 для гибридизации или генной экспрессии, например микроматрицы, секвенирование с помощью гибридизации, нормализация, профилирование, модели коррекций шума, оценка выражения отношения, конструкция зонда или оптимизация |
Автор(ы): | Ахтительнова Юлия Александровна (RU), Мазур Александр Михайлович (RU), Прохорчук Егор Борисович (RU), Шанько Андрей Викторович (RU), Чеканов Николай Николаевич (RU), Пантюх Катерина Сергеевна (UA) |
Патентообладатель(и): | Закрытое акционерное общество "Геноаналитика" (RU) |
Приоритеты: |
подача заявки:
2012-12-26 публикация патента:
27.09.2014 |
Изобретение относится к области медицины и предназначено для определения анеуплоидии методом секвенирования. Получают внеклеточную ДНК из образца крови беременной женщины. Из полученной внеклеточной ДНК создают геномные библиотеки. Геномные библиотеки секвенируют с целью получения множества чтений ДНК и определяют представленность каждой хромосомы в геноме. Определяют количество чтений, выровненных на разные хромосомы. Вывод о наличии анеуплоидии по какой-либо хромосоме делают при обнаружении отличий в представленности отдельных хромосом от среднего значения по геному, при этом отличие в представленности отдельных хромосом от среднего значения по геному идентифицируют при p-value < 0.0001 в результате применения одностороннего двухвыборочного t-критерия Стьюдента для независимых выборок к покрытиям окон. Изобретение обеспечивает эффективную пренатальную неинвазивную диагностику анеуплоидии плода начиная с периода первого триместра беременности. 8 з.п. ф-лы,1 пр.
Формула изобретения
1. Способ определения анеуплоидии методом секвенирования, включающий:
а. получение внеклеточной ДНК из образца крови беременной женщины;
b. получение геномных библиотек из выделенной внеклеточной ДНК;
с. секвенирование геномных библиотек на секвенаторе с целью получения множества чтений ДНК, в котором количество чтений, приходящихся на каждую хромосому генома, определяет представленность данной хромосомы в геноме;
d. выравнивание множества чтений на референсный геном человека для определения их координат;
е. определение количества чтений, выровненных на разные хромосомы, которое осуществляют посредством определения покрытия референсного генома человека в окнах (т.е. неперекрывающихся последовательных участках) длиной от 1000 до 100000 нуклеотидов;
f. вывод о наличии анеуплоидии по какой-либо хромосоме делают при обнаружении отличий в представленности отдельных хромосом от среднего значения по геному, при этом отличие в представленности отдельных хромосом от среднего значения по геному идентифицируют при p-value < 0.0001 в результате применения одностороннего двухвыборочного t-критерия Стьюдента для независимых выборок к покрытиям окон.
2. Способ по п.1, отличающийся тем, что ДНК выделяют из плазмы беременной женщины.
3. Способ по п.1, отличающийся тем, что получение геномных библиотек осуществляется по модифицированному протоколу, в котором пропущены стадии фрагментирования и селективного отбора, а время реакции лигирования адаптеров для последующего секвенирования составляет не менее 5 часов.
4. Способ по п.1, отличающийся тем, что после секвенирования из полученного множества чтений исключают чтения, среднее качество которых составляет менее 20 по шкале PHRED.
5. Способ по п.1, отличающийся тем, что после выравнивания чтений на референсный геном человека исключают чтения, попадающие на районы, известные как регионы вариативной копийности человека.
6. Способ по п.1, отличающийся тем, что длину окон задают равной 20000 нуклеотидов.
7. Способ по п.1, отличающийся тем, что после определения покрытия окон определяют медиану М и стандартное отклонение SD данного параметра по всем окнам и исключают из дальнейшего анализа окна с покрытием более чем M+2SD.
8. Способ по п.1, отличающийся тем, что перед определением покрытия окон для каждого окна определяют GC-состав и из последующего анализа исключают окна с GC-составом более 0.68 или менее 0.32.
9. Способ по п.8, отличающийся тем, что производят подсчет коэффициентов коррекции окон по GC-составу, при котором для каждого GC-состава в диапазоне от 0.32 до 0.68 с шагом 0.001 определяют среднее наблюдаемое покрытие, которое нормируют на общее покрытие по всем окнам; в последующем анализе покрытия окон умножают на соответствующие коэффициенты коррекции.
Описание изобретения к патенту
Изобретение относится к области медицины, клинической молекулярной биологии, генетическим исследованиям и может быть использовано в качестве пренатальной неинвазивной диагностики анеуплоидии плода начиная с периода первого триместра беременности.
Используемый на сегодняшний день метод пренатальной диагностики анеуплоидии плода - УЗИ в сочетании с биохимическим анализом крови беременной (тройной тест с использованием альфафетопротеина АФП, хорионического гонадотропина ХГЧ и неконъюгированного эстриола НЭ, patent US 5324667, 1992, patent US 5622176, 1995) - позволяет выявить более 90% случаев заболевания. У 3-5% пациенток группы высокого риска может проводиться забор генетического материала плода посредством амниоцентеза или биопсии ворсин хориона. Эти методы являются инвазивными и связаны с 1% риском развития ятрогенного аборта. Альтернативой являются современные технологии, которые позволяют проводить пренатальную диагностику анеуплоидии плода неинвазивно: анализируя следы генетического материала плода, находящиеся в крови матери. Внеклеточная ДНК (вкДНК) плода выявляется в крови матери начиная с первого месяца беременности и составляет в норме от 3 до 6% от общей вкДНК матери [1]. Посредством поиска специфических нуклеотидных последовательностей вкДНК успешно анализируется с целью определения пола будущего ребенка, а также его резус-фактора у резус-негативных женщин (patent US 6258540, 1999).
Существует метод, в котором применен аналогичный подход для выявления анеуплоидии у плода. Клиническая эффективность и практическая значимость разработанной оригинальной методики были оценены в недавнем многоцентровом исследовании, проведенном в Гонконге, Великобритании и Голландии [2]. Авторами был применен метод секвенирования индексированных геномных библиотек для определения трисомии по 21 хромосоме. Данный способ включает следующие технологические стадии: выделение вкДНК из плазмы матери в период первого триместра беременности, приготовление индексированных геномных библиотек, секвенирование, статистический анализ полученных после секвенирования данных и определение количества 21 хромосомы в доле вкДНК, принадлежащей плоду. Существенным недостатком данного способа, как метода пренатальной диагностики, является нормирование количества плодной ДНК по Y хромосоме, что допустимо только в случае беременности мальчиком (male pregnancy).
Существует патент (patent US 8148078, Система и методы определения количества копийных вариантов), в котором перечислены принципы и методы молекулярной биологии, которые могут быть применены при решении задачи - определения количества хромосом в геноме плода. Основным и существенным недостатком данного патента является отсутствие метода исследования как такового, что отразилось в формуле, которая представляет собой простое перечисление методов лабораторной молекулярно-биологической работы. Несостоятельность данного патента, как самостоятельного метода исследования, подтверждена тем фактом, что непосредственно после публикации патента были опубликованы другие, более содержательные методы в области цифровой экспрессии и анализа количества вариантов генов, т.е. в той области исследований, в которую входит анализ вкДНК, циркулирующей в кровотоке матери, и определение анеуплоидии плода.
Близким аналогом предлагаемого изобретения является метод, предложенный компанией Sequenom (США, Сан Диего, Калифорния, patent US 6258540, Неинвазивная пренатальная диагностика). Это обширное исследование опубликовано в 2011 году [3], а в 2012 году метод неинвазивной пренатальной диагностики нашел свое коммерческое применение в виде теста «MaterniT21». Недостатком данного патента является слишком широкое толкование методов и принципов лабораторной работы в данной области исследований. Также существенным недостатком данного патента является анализ плодной ДНК по участкам отцовской наследственности, что усложняет анализ в целом и делает его менее информативным.
Существует патент (patent US 8318430, Метод детекции плодных аномалий), в котором перечислены принципы и методы молекулярной биологии, которые могут быть применены при решении задачи определения количества хромосом в геноме плода. Основным отличительным признаком данного метода является предварительное селективное обогащение ДНК целевыми участками, что должно привести к общему увеличению чувствительности метода определения плодных аномалий по вкДНК, циркулирующей в кровотоке матери. Авторы предлагают использовать от 300 до 500 специфических последовательностей, как на анализируемых хромосомах, так и на референсных.
Близким аналогом предлагаемого изобретения является метод опубликованный в октябре 2012 года (patent US 8296076, Неинвазивная диагностика анеуплоидии плода методом секвенирования). Данный способ цифрового количественного определения ДНК основан на методике полногеномного секвенировании ДНК. Основным отличительным признаком данного метода является минимальна корректировка последовательностей, полученных в процессе полногеномного секвенирования, что не может не отразиться отрицательно на качестве всего анализа и точности определения анеуплоидии плода.
В Российской Федерации в настоящий момент нет прямых или косвенных аналогов данной методики. Технической задачей настоящего изобретения является упрощение способа, повышение чувствительности и точности анализа описанных выше зарубежных аналогов.
Сущность способа определения трисомии методом секвенирования заключается в цифровом количественном анализе ДНК, в расчете идентичных последовательностей ДНК, полученных при параллельном массовом секвенировании. В основу метода легла методика полногеномного секвенирования, которая позволяет получать до миллиарда коротких чтений за один запуск секвенатора за счет амплификации геномной ДНК в полимеразной цепной реакции по типу молекулярных колоний. Полученные короткие чтения последовательностей ДНК подвергаются статистическому компьютерному анализу. При этом количество чтений, приходящихся на каждую хромосому генома, определяет представленность данной хромосомы в геноме, и таким образом может быть определен статус эуплоидии или анеуплоидии. Основное преимущество данного метода заключается в отсутствии необходимости разграничения ДНК на принадлежащую матери или плоду, т.к. большие объемы данных для расчетов, полученные в результате массового параллельного секвенирования, способствуют обнаружению минимальных отличий в представленности отдельных хромосом от среднего значения по геному, а ряд предложенных мер по фильтрации и коррекции данных in silico позволяет нивелировать проблемы, связанные с особенностями биологических образцов и погрешностями прибора.
Технология определения трисомии осуществляется следующим способом.
У женщин, проходящих пренатальную генетическую диагностику в первом триместре беременности, была собрана кровь в пробирки с ЭДТА, объемом 4 мл. Кровь хранили не более трех часов при +4°C. Не позднее чем через три часа после флеботомии пробирки с кровью центрифугировали 10 мин 2000 g для получения плазмы, богатой тромбоцитами.
Далее плазму повторно центрифугировали в течение 15 мин при 16000 g для получения плазмы, свободной от целых клеток крови. Внеклеточную ДНК получали из очищенной плазмы крови с помощью набора реактивов QIAamp Circulating Nucleic Acid Kit (Qiagen), руководствуясь инструкцией к набору. Концентрацию полученной вкДНК определяли с помощью флюориметра Qubit 2.0 (Life Technologies). Качество полученных геномных библиотек определяли, используя платформу Bioanalizer 2100 (Agilent).
При работе с внеклеточной ДНК возникает ряд технологических особенностей, связанных с характеристикой материала. В первую очередь это размер молекул ДНК и их концентрация в растворе при выделении. В плазме крови вкДНК сильно фрагментирована и представлена в виде отрезков ДНК длиной от 150 до 170 пар нуклеотидов, т.к. появляется в кровотоке по причине апоптоза клеток тела, в том числе и плаценты в случае беременности. Концентрация вкДНК в плазме составляет около 50 пг/мл, при этом доля плодной ДНК в общем количестве вкДНК беременных составляет около 6%. ДНК в такой низкой концентрации подлежит лабораторному анализу только после амплификации, в противном случае концентрация ДНК окажется ниже порога чувствительности большинства методов анализа. Для преодоления этого затруднения в целях повышения концентрации исследуемой ДНК был модифицирован протокол приготовления геномных библиотек.
Модификации протокола приготовления геномных библиотек для полногеномного секвенирования.
Модификации протокола приготовления геномных библиотек способствуют технологическому упрощению способа, увеличению чувствительности метода и уменьшению количества крови пациента, необходимого для анализа. Протокол имеет следующие существенные изменения:
- Исключена стадия фрагментирования ДНК. ВкДНК имеет средний размер около 160 н.п. и дополнительное фрагментирование, будь то ферментативное или с помощью ультразвука, не оказывает какого-либо положительного влияния на процесс приготовления библиотек, наоборот, значительно уменьшает при этом количественный выход библиотек.
- Увеличено время легирования адаптеров. Стандартная процедура легирования адаптера не приводит к достаточно полноценному легированию. В нашей модификации время легирования увеличено до 5 часов, что значительно увеличивает количество полученных библиотек с адаптерами.
- Исключена стадия селективного отбора библиотек по размеру. ВкДНК имеет достаточно компактный диапазон длин. Легирование адаптеров увеличивает длину двухцепочечных отрезков вкДНК на фиксированную длину. По этой причине отпадает необходимость в дополнительном отборе участков необходимой длины, а используется весь объем библиотек с адаптерами. Применение техники селективного отбора приводит к дополнительным и неоправданным потерям материала.
Анализ данных и определение анеуплоидии.
После проведения полногеномного секвенирования полученные данные - последовательности нуклеотидов или чтения, проходили процедуру контроля качества. Для начала отсеивались чтения, среднее качество которых составляло менее 20 по шкале PHRED. Оставшиеся чтения выравнивались на референсный геном человека для определения геномных координат. После этого исключались чтения, попадающие на районы, известные как районы вариативной копийности, поскольку в противном случае они могут вносить непредсказуемые существенные помехи в статистику и тем самым снижать достоверность метода. При дальнейшем анализе определялась степень покрытия референсного генома участками длиной 20000 нуклеотидов. Длина участка покрытия или окна может варьировать от 1 до 100 тыс. нуклеотидов в зависимости от целей вычислений, требований точности или калибровки метода на выборке с известными диагнозами. В первую очередь, производился подсчет отношения количества гуанина и цитозина к общему количеству нуклеотидов для каждого окна, т.е. определение GC-состава. Исключались окна с GC-составом более 0.68 или менее 0.32, поскольку крайние случаи, как правило, характерны для последовательностей с высокой повторяемостью. Пороговые значения GC-состава могут варьироваться. Как следствие, ожидается, что процесс выравнивания в данном случае окажется менее точным, что может приводить к эффекту переамплификации in silico. Определялось покрытие генома - количество выровненных на каждое окно чтений, а также медиана М и стандартное отклонение SD данного параметра по всем окнам; окна с покрытием более чем M+2SD исключались с целью избавления от наименее приемлемых случаев переамплификации ДНК. Производился подсчет коэффициентов коррекции окон по GC-составу: для каждого GC-состава в диапазоне от 0.32 до 0.78 с шагом 0.001 определяется среднее наблюдаемое покрытие, которое нормируется на общее покрытие по всем окнам. Для статистических расчетов использовалось корректированное покрытие, равное произведению покрытия окна на соответствующий его GC-составу коэффициент коррекции. Данный шаг необходим для избавления от систематической зависимости представленности последовательностей от их GC-состава, которая может проявляться на стадиях от амплификации до непосредственно секвенирования ДНК образца.
Для проверки анеуплоидии по какой-либо хромосоме все окна были разделены на две выборки: окна с целевой хромосомы Wchr и все остальные окна Wgenome. Использовался односторонний двухвыборочный t-критерий для независимых выборок. В качестве нулевой гипотезы принималось утверждение, что корректированные покрытия окон выборки Wchr не выше (в случае проверки на три- или полисемию; или не ниже при проверке на моно- или нуллисомию, в т.ч. X-хромосомы для определения пола), чем корректированные покрытия окон выборки Wgenome. Заключение об анеуплоидии дается в случае, если вероятность принятия нулевой гипотезы при наблюдаемых данных составляет менее 0.0001 (р-value < 0.0001).
Определяющими отличительными признаками предлагаемого способа, по сравнению с зарубежными аналогами, являются:
1. Модифицированный и улучшенный протокол получения геномных библиотек из внеклеточной ДНК.
2. Улучшенный протокол подготовки и анализа полученных после секвенирования данных, включающий в себя отсев некачественных чтений и чтений из потенциально-многокопийных участков, а также участков с аномальным покрытием и/или GC-составом.
Источники информации
1. Lo YM, Corbetta N, Chamberlain PF, Rai V, Sargent IL, Redman CW, Wainscoat JS. Presence of fetal DNA in maternal plasma and serum. Lancet. 1997 Aug 16; 350 (9076): 485-7.
2. Eric Z. Chen, Rossa W.K. Chiu, Hao Sun, Ranjit Akolekar, K.C. Allen Chan, Tak Y. Leung, Peiyong Jiang, Yama W.L. Zheng, Fiona M.F. Lun, Lisa Y.S. Chan, Yongjie Jin, Attie T.J.I. Go, Elizabeth T. Lau, William W.K. To, Wing C. Leung, Rebecca Y.K. Tang, Sidney K.C. Au-Yeung, Helena Lam, Yu Y. Kung, Xiuqing Zhang, John M.G. van Vugt, Ryoko Minekawa, Mary H.Y. Tang, Jun Wang, Cees B.M. Oudejans, Tze K. Lau, Kypros H. Nicolaides, and Y.M. Dennis Lo. Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study. PLoS One. 2011; 6 (7): e21791.
3. Palomaki GE, Kloza EM, Lambert-Messerlian GM, Haddow JE, Neveux LM, Ehrich M, van den Boom D, Bombard AT, Deciu C, Grody WW, Nelson SF, Canick JA. DNA sequencing of maternal plasma to detect Down syndrome: an international clinical validation study. Genet Med. 2011 Nov; 13 (11): 913-20.
Класс G01N33/48 биологических материалов, например крови, мочи; приборы для подсчета и измерения клеток крови (гемоцитометры)
Класс C40B50/00 Способы получения библиотек, например комбинаторный синтез
Класс G06F19/20 для гибридизации или генной экспрессии, например микроматрицы, секвенирование с помощью гибридизации, нормализация, профилирование, модели коррекций шума, оценка выражения отношения, конструкция зонда или оптимизация