Эта статья является кандидатом в добротные статьи

FANTOM: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
викификация, оформление, стилевые правки
Строка 1: Строка 1:
'''FANTOM''' ({{lang-en|FANTOM}} — Functional Annotation of the Mammalian Genome, [[Русский язык|русс.]] ''ФАНТОМ'' — Функциональная Аннотация геномов Млекопитающих) — международный исследовательский [[консорциум]], основанный доктором ''Хаяшизаки''<ref name=":0">{{Cite web|url=https://www.future-science.com/doi/10.2144/05383SP01|title=Yoshihide Hayashizaki}}</ref> и его коллегами в 2000 году с целью функционального аннотирования полноразмерных [[кДНК]], которые были собраны в ходе проекта ''Mouse Encyclopedia''<ref>{{Cite web|url=https://web.archive.org/web/20160917191531/http://www.osc.riken.jp/english/contents/mice/|title=The Mouse Encyclopedia Project|author=|work=Omics Science Center|date=|publisher=|accessdate=09-04-2020|archiveurl=https://web.archive.org/web/20160917191531/http://www.osc.riken.jp/english/contents/mice/|archivedate=2016-09-17}}</ref> в научном центре ''[[RIKEN]]''. С тех пор FANTOM стал самостоятельным и развитым проектом, который затрагивает разные сферы анализа [[Транскриптом|траскриптомов]]. Цель проекта — прийти от понимания «элементов» — [[Транскрипт (биология)|транскриптов]] до понимания «системы» — транскрипционной регуляторной сети<ref name="multiple">{{Cite web|url=https://web.archive.org/web/20181102155217/http://fantom.gsc.riken.jp/|title=FANTOM|date=2018-11-02|publisher=web.archive.org|accessdate=2020-04-09}}</ref>.
'''FANTOM''' ({{lang-en|FANTOM}} — Functional Annotation of the Mammalian Genome, {{lang-ru|Функциональная аннотация геномов млекопитающих}}) — международный исследовательский [[консорциум]], основанный доктором Хаяшизаки<ref name=":0">{{Cite web|url=https://www.future-science.com/doi/10.2144/05383SP01|title=Yoshihide Hayashizaki}}</ref> и его коллегами в 2000 году с целью функционального {{нп5|Аннотирование генома|аннотирования|en|DNA annotation}} полноразмерных [[кДНК]], которые были [[Сборка генома|собраны]] в ходе проекта ''Mouse Encyclopedia''<ref>{{Cite web|url=https://web.archive.org/web/20160917191531/http://www.osc.riken.jp/english/contents/mice/|title=The Mouse Encyclopedia Project|author=|work=Omics Science Center|date=|publisher=|accessdate=09-04-2020|archiveurl=https://web.archive.org/web/20160917191531/http://www.osc.riken.jp/english/contents/mice/|archivedate=2016-09-17}}</ref> в научном центре [[RIKEN]]. С тех пор FANTOM стал самостоятельным и развитым проектом, который затрагивает разные сферы анализа [[Транскриптом|траскриптомов]]. Цель проекта — прийти от понимания «элементов» — [[Транскрипт (биология)|транскриптов]] до понимания «системы» — транскрипционной регуляторной сети<ref name="multiple">{{Cite web|url=https://web.archive.org/web/20181102155217/http://fantom.gsc.riken.jp/|title=FANTOM|date=2018-11-02|publisher=web.archive.org|accessdate=2020-04-09}}</ref>.


== Этапы работы проекта: история и публикации ==
== Этапы работы проекта: история и публикации ==
Строка 5: Строка 5:
=== FANTOM1 ===
=== FANTOM1 ===
[[Файл:FANTOM History v2 Draft.jpg|thumb|Развитие FANTOM]]
[[Файл:FANTOM History v2 Draft.jpg|thumb|Развитие FANTOM]]
''The RIKEN Mouse Gene Encyclopaedia Project''<ref name=":0" /> — проект, методы которого позволяют определить полный потенциал кодирующего [[геном]]а [[Мышиные|мыши]]. В ходе данного проекта была получена коллекция последовательностей полноразмерных [[Комплементарная ДНК|кДНК]] с последующим [[Картирование генов|картированием]] соответствующих [[ген]]ов на геноме мыши. Следствием этого проекта стало основание ассоциации FANTOM с целью аннотирования первых 21,076 [[Комплементарная ДНК|кДНК]]. Эта коллекция [[Комплементарная ДНК|кДНК]] стала одной из крупнейших для какого-либо организма на тот момент. Анализ этих [[Комплементарная ДНК|кДНК]] расширил уже существующие семейства генов и определил новые <ref>{{Статья|ссылка=https://www.nature.com/articles/35055500|автор=J. Kawai, A. Shinagawa, K. Shibata, M. Yoshino, M. Itoh|заглавие=Functional annotation of a full-length mouse cDNA collection|год=2001-02|язык=en|издание=Nature|том=409|выпуск=6821|страницы=685–690|issn=1476-4687|doi=10.1038/35055500}}</ref>.
''The RIKEN Mouse Gene Encyclopaedia Project''<ref name=":0" /> — проект, методы которого позволяют определить полный потенциал кодирующего [[геном]]а [[Мышиные|мыши]]. В ходе данного проекта была получена коллекция последовательностей полноразмерных [[Кодирующая область|кДНК]] с последующим [[Картирование генов|картированием]] соответствующих [[ген]]ов на геноме мыши. Следствием этого проекта стало основание ассоциации FANTOM с целью аннотирования первых 21076 кДНК. Эта коллекция кДНК стала одной из крупнейших для какого-либо организма на тот момент. Анализ этих [[Комплементарная ДНК|кДНК]] расширил уже существующие {{нп5|Семейство генов|семейства генов|en|Gene family}} и определил новые<ref>{{cite doi|10.1038/35055500}}</ref>.


В ходе первого этапа работы [[консорциум]]а была разработана эффективная система функциональной аннотации [[ген]]ов, основанная на разработанных [[De novo сборка транскриптома|de novo]] правилах и методах. Основные результаты были опубликованы в журнале ''[[Nature]]'' в 2001 году<ref>{{Статья|автор = |заглавие = Functional annotation of a full-length mouse cDNA collection|издание = Nature|тип = |год = 2001|номер = 409|страницы = |issn = |doi = 10.1038/35055500}}</ref>.
В ходе первого этапа работы [[консорциум]]а была разработана эффективная система функциональной аннотации генов, основанная на разработанных [[De novo сборка транскриптома|de novo]] правилах и методах. Основные результаты были опубликованы в журнале ''[[Nature]]'' в 2001 году<ref>{{cite doi|10.1038/35055500}}</ref>.


==== Технология получения полноразмерных кДНК ====
==== Технология получения полноразмерных кДНК ====
Общий вид последовательных стадий можно представить следующим образом<ref>{{Статья|ссылка=https://www.nature.com/articles/srep19420|автор=Nan Chen, Wei-Min Wang, Huan-Ling Wang|заглавие=An efficient full-length cDNA amplification strategy based on bioinformatics technology and multiplexed PCR methods|год=2016-01-13|язык=en|издание=Scientific Reports|том=6|выпуск=1|страницы=1–9|issn=2045-2322|doi=10.1038/srep19420}}</ref>:
Общий вид последовательных стадий можно представить следующим образом<ref>{{cite doi|10.1038/srep19420}}</ref>:


# [[Экстракция]] [[Рибонуклеиновая кислота|РНК]] из клеток
# [[Экстракция]] [[Рибонуклеиновая кислота|РНК]] из клеток;
# Синтез полноразмерных [[Комплементарная ДНК|кДНК]]
# Синтез полноразмерных [[Комплементарная ДНК|кДНК]];
# Селекция полноразмерных [[Комплементарная ДНК|кДНК]]
# Селекция полноразмерных [[Комплементарная ДНК|кДНК]];
# Нормировка
# Нормировка;
# [[Клонирование ДНК|Клонирование]]
# [[Клонирование ДНК|Клонирование]];
# [[Секвенирование]]
# [[Секвенирование]];
# Компьютерный анализ
# Компьютерный анализ.


==== Трегалозный метод синтеза полноразмерных кДНК ====
==== Трегалозный метод синтеза полноразмерных кДНК ====
Раньше одной из самых больших трудностей получения полноразмерных [[Комплементарная ДНК|кДНК]] являлась неэффективность работы [[Ревертаза|ревертазы]] при синтезе второй цепи. Было показано, что добавление [[Трегалоза|трегалозы]] значительно увеличивает термостабильность и активность [[Ферменты|фермента]]<ref>{{Статья|автор = |заглавие = Thermostabilization and thermoactivation of thermolabile enzymes by trehalose and its application for the synthesis of full length cDNA|издание = Proc Natl Acad Sci U S A|тип = |год = 1998|номер = 95|страницы = |issn = |doi = 10.1073/pnas.95.2.520}}</ref>. Это открытие позволило проводить [[Обратная транскриптаза|ревертазные]] реакции при 60 °C вместо 42°С, как раньше. При температуре 60 °C [[вторичная структура]] [[Рибонуклеиновая кислота|РНК]] из образца подплавляется и участок на 5'-конце [[Матричная РНК|мРНК]] становится доступным для [[Транскрипция (биология)|транскрипции]]<ref>{{Статья|ссылка=https://www.pnas.org/content/95/2/520|автор=Piero Carninci, Yoko Nishiyama, Arthur Westover, Masayoshi Itoh, Sumiharu Nagaoka|заглавие=Thermostabilization and thermoactivation of thermolabile enzymes by trehalose and its application for the synthesis of full length cDNA|год=1998-01-20|язык=en|издание=Proceedings of the National Academy of Sciences|том=95|выпуск=2|страницы=520–524|issn=0027-8424, 1091-6490|doi=10.1073/pnas.95.2.520}}</ref>.
Раньше одной из самых больших трудностей получения полноразмерных кДНК являлась неэффективность работы [[Ревертаза|ревертазы]] при синтезе второй цепи. Было показано, что добавление [[Трегалоза|трегалозы]] значительно увеличивает термостабильность и активность [[фермент]]а<ref>{{cite doi|10.1073/pnas.95.2.520}}</ref>. Это открытие позволило проводить [[Обратная транскриптаза|ревертазные]] реакции при 60 °C вместо 42 °С, как раньше. При температуре 60 °C [[вторичная структура]] [[РНК]] из образца подплавляется и участок на 5'-конце [[Матричная РНК|мРНК]] становится доступным для транскрипции<ref>{{cite doi|10.1073/pnas.95.2.520}}</ref>.


==== Метод биотинилированной кэп-ловушки для отсеивания неполноразмерных кДНК ====
==== Метод биотинилированной кэп-ловушки для отсеивания неполноразмерных кДНК ====
Метод разработан для селекции только полноразмерных [[Комплементарная ДНК|кДНК]]. Сначала [[кэп]], который есть на 5'-конце всех [[Эукариоты|эукариотических]] [[Матричная РНК|мРНК]] биотинилируется. Затем происходит [[обратная транскрипция]], и оцРНК подвергается деградации. Если [[Транскрипция (биология)|траскрипция]] [[Комплементарная ДНК|кДНК]] прервалась, то после расщепления одноцепочечных участков [[биотин]] на их 5'-конце будет отсутствовать. Оставшиеся полноразмерные [[Комплементарная ДНК|кДНК]] с биотинилированным [[кэп]]ом «вылавливаются» стрептавидиновыми бусинами. Затем в щелочной среде цепи [[Дезоксирибонуклеиновая кислота|ДНК]] элюируются и производится достраивание второй цепи [[Дезоксирибонуклеиновая кислота|ДНК]]<ref>{{Статья|автор = |заглавие = High efficiency selection of full-length cDNA by improved biotinylated cap trapper|издание = DNA Res|тип = |год = 1997|номер = 4|страницы = |issn = |doi = 10.1093/dnares/4.1.61}}</ref><ref>{{Статья|автор = |заглавие = High-efficiency full-length cDNA cloning by biotinylated CAP trapper|издание = Genomics|тип = |год = 1996|номер = 37|страницы = |issn = |doi = 10.1006/geno.1996.0567}}</ref>.
Метод разработан для селекции только полноразмерных кДНК. Сначала [[кэп]], который есть на 5'-конце всех [[Эукариоты|эукариотических]] мРНК [[биотин]]илируется. Затем происходит [[обратная транскрипция]], и оцРНК подвергается деградации. Если траскрипция кДНК прервалась, то после расщепления одноцепочечных участков биотин на их 5'-конце будет отсутствовать. Оставшиеся полноразмерные кДНК с биотинилированным кэпом «вылавливаются» {{нп5|Стрептавидин|стрептавидиновыми|en|Streptavidin}} бусинами. Затем в [[Щёлочь|щелочной]] среде цепи [[ДНК]] {{нп5|Элюция|элюируются|en|Elution}} и производится достраивание второй цепи ДНК<ref>{{cite doi|10.1006/geno.1996.0567}}</ref>.


==== Вектор для клонирования ====
==== Вектор для клонирования ====
Проблема того, что короткие [[Матричная РНК|мРНК]] более вероятно будут иметь больше клонов, чем более длинные, была решена разработкой нового [[Вектор (молекулярная биология)|вектора]], подходящего для [[Клонирование ДНК|клонирования]] [[Комплементарная ДНК|кДНК]] размером 6 кб ~ 20 кб, — λFlcIII-L. Этот [[Вектор (молекулярная биология)|вектор]] был усовершенствован (фоновое [[Лигазы|лигирование]] снижено практически до нуля) и назван λFlcIV. Именно он использовался для [[Клонирование (биология)|клонирования]]<ref>{{Статья|автор = |заглавие = Balanced-size and long-size cloning of full-length, cap-trapped cDNAs into vectors of the novel lambda-FLC family allows enhanced gene discovery rate and functional analysis|издание = Genomics|тип = |год = 2001|номер = 77|страницы = |issn = |doi = 10.1006/geno.2001.6601}}</ref>.
Проблема того, что короткие мРНК более вероятно будут иметь больше клонов, чем более длинные, была решена разработкой нового [[Вектор (молекулярная биология)|вектора]], подходящего для клонирования кДНК размером от 6 тысяч [[Спаренные основания|пар оснований]] (п. о.) до 20 кб, — λFlcIII-L. Этот вектор был усовершенствован (фоновое [[Лигазы|лигирование]] снижено практически до нуля) и назван λFlcIV. Именно он использовался для клонирования<ref>{{cite doi|10.1006/geno.2001.6601}}</ref>.


==== Нормировка ====
==== Нормировка ====
Так как 50 ~ 60 % всей [[Рибонуклеиновая кислота|РНК]] клетки соответствуют [[Гены домашнего хозяйства|генам «домашнего хозяйства»]], то для оценки относительно низкого уровня [[Рибонуклеиновая кислота|РНК]] необходимо нормализовать библиотеки частоты встречаемости конкретных [[Комплементарная ДНК|кДНК]]<ref>{{Статья|автор = |заглавие = Normalization and subtraction of cap-trapper-selected cDNAs to prepare full-length cDNA libraries for rapid discovery of new genes|издание = Genome Res|тип = |год = 2000|номер = 10|страницы = |issn = |язык = |doi = 10.1006/geno.2001.6601}}</ref>.
Так как от 50 до 60 % всей РНК [[Клетка (биология)|клетки]] соответствуют [[Гены домашнего хозяйства|генам домашнего хозяйства]], то для оценки относительно низкого уровня РНК необходимо нормализовать {{нп5|Библиотека (биология)|библиотеки|en|Library (biology)}} частоты встречаемости конкретных кДНК<ref>{{cite doi|10.1006/geno.2001.6601}}</ref>.


=== FANTOM2 ===
=== FANTOM2 ===
После первого съезда [[консорциум]]а FANTOM, группа из RIKEN продолжила создание [[Мышиные|мышиных]] полноразмерных [[Комплементарная ДНК|кДНК]]. В ходе второй фазы были определены последовательности и созданы функциональные аннотации для этого набора из 60,770 полноразмерных [[кДНК]] [[Мышиные|мыши]]. Это стало первым всемирным проектом по стандартизации полноразмерных [[кДНК]] [[Млекопитающие|млекопитающих]]<ref>{{Cite web|url=https://fantom.gsc.riken.jp/2/fantom2/doc/history.html|title=FANTOM|publisher=fantom.gsc.riken.jp|accessdate=2020-05-11}}</ref>.
После первого съезда [[консорциум]]а FANTOM, группа из RIKEN продолжила создание мышиных полноразмерных кДНК. В ходе второй фазы были определены последовательности и созданы функциональные аннотации для этого набора из 60770 полноразмерных кДНК мыши. Это стало первым всемирным проектом по стандартизации полноразмерных кДНК [[Млекопитающие|млекопитающих]]<ref>{{Cite web|url=https://fantom.gsc.riken.jp/2/fantom2/doc/history.html|title=FANTOM|publisher=fantom.gsc.riken.jp|accessdate=2020-05-11}}</ref>.


Проект ''FANTOM2''<ref>{{cite web |url=https://fantom.gsc.riken.jp/2/|title=FANTOM2}}</ref> состоял из трёх частей:
Проект ''FANTOM2''<ref>{{cite web |url=https://fantom.gsc.riken.jp/2/|title=FANTOM2}}</ref> состоял из трёх частей: собрания «Typhoon», телеконференции MATRICS и собрания «Cherry Blossom».


==== Собрание «Typhoon» ====
==== «Typhoon» собрание (коллективное обсуждение развития новых концепций аннотирования) ====
Собрание было проведено 15-19 октября 2001 года. Обсуждались стратегии и правила аннотации для более эффективного аннотирования с использованием информации о профилях [[Экспрессия генов|экспрессии]], картирования и данных о [[Белок-белковые взаимодействия|белок-белковых взаимодействиях]], а также традиционного выравнивания последовательностей. Также обсуждалась организация MATRICS — онлайн аннотация последовательностей RIKEN ('''M'''ouse '''A'''nnotation '''T'''eleconference for '''RI'''KEN '''c'''DNA '''s'''equences). В качестве тестовой выборки для встречи «Typhoon» FANTOM2 были подготовлены и проанализированы 46,000 последовательностей<ref>{{Статья|ссылка=https://www.ncbi.nlm.nih.gov/pmc/articles/PMC403710/|автор=Takeya Kasukawa, Masaaki Furuno, Itoshi Nikaido, Hidemasa Bono, David A. Hume|заглавие=Development and Evaluation of an Automated Annotation Pipeline and cDNA Annotation System|год=2003-6|издание=Genome Research|том=13|выпуск=6b|страницы=1542–1551|issn=1088-9051|doi=10.1101/gr.992803}}</ref>.
Собрание «Typhoon» было проведено 15—19 октября 2001 года. Обсуждались стратегии и правила аннотации для более эффективного аннотирования с использованием информации о [[Количественный анализ экспрессии генов|профилях]] [[Экспрессия генов|экспрессии]], картирования и данных о [[Белок-белковые взаимодействия|белок-белковых взаимодействиях]], а также традиционного выравнивания последовательностей. В качестве тестовой выборки для встречи «Typhoon» FANTOM2 были подготовлены и проанализированы 46000 последовательностей<ref>{{cite doi|10.1101/gr.992803}}</ref>.


==== MATRICS (Mouse Annotation Teleconference for RIken CDNA Sequences) ====
==== MATRICS (Mouse Annotation Teleconference for RIken CDNA Sequences) ====
MATRICS ('''M'''ouse '''A'''nnotation '''T'''eleconference for '''RI'''ken '''C'''DNA '''S'''equences) — телеконференция, в ходе которой кураторы аннотировали последовательности [[Комплементарная ДНК|кДНК]] из [[RIKEN]] через интернет, используя систему защищённых серверов и систему FANTOM. Система FANTOM предумастривает использование большого количества онлайн ресурсов<ref>{{Cite web|url=https://fantom.gsc.riken.jp/2/fantom2/doc/links.html|title=Online resources for MATRICS FANTOM2}}</ref> .
MATRICS (от {{lang-en|'''M'''ouse '''A'''nnotation '''T'''eleconference for '''RI'''ken '''C'''DNA '''S'''equences}}) — телеконференция, в ходе которой кураторы аннотировали последовательности кДНК из RIKEN через [[Интернет]], используя систему защищённых серверов и систему FANTOM. Система FANTOM предусмастривает использование большого количества онлайн ресурсов<ref>{{Cite web|url=https://fantom.gsc.riken.jp/2/fantom2/doc/links.html|title=Online resources for MATRICS FANTOM2}}</ref> .
==== «Cherry Blossom» собрание ====
==== Собрание «Cherry Blossom» ====
После MATRICS была проведена встреча (29.04  04.05.2002) для доклада и обсуждения результатов функциональных аннотаций и биологически интересных находок<ref>{{Cite web|url=https://web.archive.org/web/20181121004519/http://fantom.gsc.riken.jp/2/fantom2/doc/history.html|title=FANTOM|date=2018-11-21|publisher=web.archive.org|accessdate=2020-04-09}}</ref>.
После MATRICS была проведена встреча «Cherry Blossom» (с 29 апреля по 4 мая 2002 года) для доклада и обсуждения результатов функциональных аннотаций и биологически интересных находок<ref>{{Cite web|url=https://web.archive.org/web/20181121004519/http://fantom.gsc.riken.jp/2/fantom2/doc/history.html|title=FANTOM|date=2018-11-21|publisher=web.archive.org|accessdate=2020-04-09}}</ref>.


По результатам была опубликована статья в журнале ''[[Nature]]'' в 2002 году<ref>{{Статья|автор = |заглавие = Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs|издание = Nature|тип = |год = 2002|номер = 420|страницы = |issn = }}</ref>.
По результатам была опубликована статья в журнале ''[[Nature]]'' в 2002 году<ref>{{cite doi|10.1038/nature01266}}</ref>.


=== FANTOM3 ===
=== FANTOM3 ===
Аналогично двум другим этапам были проведены встречи до начала работы (Tanabata Meeting: 04.07 — 08.07.2004, RIKEN, GSC, Japan) и после окончания работы проекта (Harvest Meeting: 10.09 — 15.09.2004, RIKEN, Japan)<ref>{{Cite web|url=http://fantom3.gsc.riken.jp/history.html|title=FANTOM3::History|publisher=fantom3.gsc.riken.jp|accessdate=2020-05-11}}</ref>.
Аналогично двум другим этапам были проведены встречи до начала работы (Tanabata Meeting: 04.07 — 08.07.2004, RIKEN, GSC, [[Япония]]) и после окончания работы проекта (Harvest Meeting: 10.09 — 15.09.2004, RIKEN, Япония)<ref>{{Cite web|url=http://fantom3.gsc.riken.jp/history.html|title=FANTOM3::History|publisher=fantom3.gsc.riken.jp|accessdate=2020-05-11}}</ref>.


В FANTOM3<ref>{{Cite web|url=http://fantom3.gsc.riken.jp|title=FANTOM3}}</ref> для получения данных, которые раскрывают динамическое регулирование [[транскриптом]]а, была изменена стратегия аннотации<ref>{{Cite web|url=https://fantom.gsc.riken.jp/3/doc/annotation.html|title=Стратегия аннотации FANTOM3}}</ref>. В частности, были подготовлены новые датасеты для:
В FANTOM3<ref>{{Cite web|url=http://fantom3.gsc.riken.jp|title=FANTOM3}}</ref> для получения данных, которые раскрывают динамическое регулирование [[транскриптом]]а, была изменена стратегия аннотации<ref>{{Cite web|url=https://fantom.gsc.riken.jp/3/doc/annotation.html|title=Стратегия аннотации FANTOM3}}</ref>. В частности, были подготовлены новые {{нп5|Набор данных|наборы данных|en|Data set}} для:


# Идентификации новых полноразмерных [[Комплементарная ДНК|кДНК]] для 103,000 клонов
# Идентификации новых полноразмерных кДНК для 103000 клонов;
# Детерминирования и аннотирования [[Транскрипт (биология)|транскриптов]], транскрипционных единиц, анализа их сложности и [[Экспрессия генов|экспрессии]]
# Детерминирования и аннотирования транскриптов, транскрипционных единиц, анализа их сложности и экспрессии;
# Экспериментальной идентификации стартовых позиций инициации [[Транскрипция (биология)|транскрипции]] и её терминации, а также вычисления непомерной сложности человеческого [[транскриптом]]а
# Экспериментальной идентификации стартовых позиций инициации транскрипции и её терминации, а также вычисления сложности человеческого транскриптома;
# Выявления регионов [[промотор]]ов
# Выявления [[промотор]]ов.


Таким образом, помимо подготовления новых данных для более функционального анализа [[транскриптом]]а, идентификации и аннотирования новых и низкоуровневых [[Матричная РНК|мРНК]], конечной целью FANTOM3 было функционально аннотировать сложность [[транскриптом]]а, идентифицировать стартовые сайты инициации [[Транскрипция (биология)|транскрипции]], сайты терминации [[Транскрипция (биология)|транскрипции]], а также [[промотор]]ы. Ещё одним аспектом понимания сложности [[транскриптом]]а было осмысление [[Некодирующие РНК|некодирущих РНК]], которые составляют до половины [[транскриптом]]а. В новвовведения входили также технологии ''[[Кэп-анализ экспрессии генов|CAGE]]'', ''GIS'' (''Gene Identification Signature'') и ''GSC'' (''Genome Signature Cloning'')<ref>{{Статья|ссылка=https://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.0020062|автор=Norihiro Maeda, Takeya Kasukawa, Rieko Oyama, Julian Gough, Martin Frith|заглавие=Transcript Annotation in FANTOM3: Mouse Gene Catalog Based on Physical cDNAs|год=2006-04-28|язык=en|издание=PLOS Genetics|том=2|выпуск=4|страницы=e62|issn=1553-7404|doi=10.1371/journal.pgen.0020062}}</ref>.
Таким образом, помимо подготовления новых данных для более функционального анализа транскриптома, идентификации и аннотирования новых и низкоуровневых мРНК, конечной целью FANTOM3 было функционально аннотировать сложность транскриптома, идентифицировать стартовые сайты инициации транскрипции, сайты терминации транскрипции, а также промоторы. Ещё одним аспектом понимания сложности транскриптома было осмысление [[Некодирующие РНК|некодирущих РНК]], которые составляют до половины транскриптома. В новвовведения входили также технологии [[Кэп-анализ экспрессии генов|CAGE]], GIS (от {{lang-en|Gene Identification Signature}}) и GSC (от {{lang-en|Genome Signature Cloning}})<ref>{{cite doi|10.1371/journal.pgen.0020062}}</ref>.


==== MATRICS-RELOADED ====
==== MATRICS-RELOADED ====
103,000 полноразмерных [[Комплементарная ДНК|кДНК]] были аннотированы в ходе телеконференции MATRICS-RELOADED, аналогичной MATRICS FANTOM2. В телемосте участвовало свыше 100 учёных со всего мира. Функциональные аннотации полноразмерных [[Комплементарная ДНК|кДНК]] можно найти на сервере ''FANTOM3''<ref>{{Cite web|url=https://fantom.gsc.riken.jp/3/download/fantomdb/3.0|title=Сервер FANTOM3}}</ref>.
103000 полноразмерных кДНК были аннотированы в ходе телеконференции MATRICS-RELOADED, аналогичной MATRICS FANTOM2. В телемосте участвовало свыше 100 учёных со всего мира. Функциональные аннотации полноразмерных кДНК можно найти на сервере ''FANTOM3''<ref>{{Cite web|url=https://fantom.gsc.riken.jp/3/download/fantomdb/3.0|title=Сервер FANTOM3}}</ref>.


==== Технология CAGE ====
==== Технология CAGE ====
Технология ''[[Кэп-анализ экспрессии генов|CAGE]]'' позволяет проводить высокопроизводительный анализ [[Экспрессия генов|экспрессии генов]], получать профили транскрипционных сайтов<ref>{{Cite web|url=https://fantom.gsc.riken.jp/3/history.html|title=FANTOM3::History|publisher=fantom.gsc.riken.jp|accessdate=2020-04-09}}</ref>.
Технология кэп-анализа экспрессии генов (CAGE) позволяет проводить высокопроизводительный анализ экспрессии генов, получать профили участков транскрипции<ref>{{Cite web|url=https://fantom.gsc.riken.jp/3/history.html|title=FANTOM3::History|publisher=fantom.gsc.riken.jp|accessdate=2020-04-09}}</ref>.


Применение новой технологии ''[[Кэп-анализ экспрессии генов (CAGE)|CAGE]]'' показало, что более чем 63 % генома (а не как раньше считалось ~1,5 % белок-кодирующих экзонов) транскрибируется с образованием [[Рибонуклеиновая кислота|РНК]]. Также было обнаружено более 23,000 [[Некодирующие РНК|некодирующих РНК]] (''non-coding RNAs, ncRNAs'') и что >73 % [[Транскрипт (биология)|транскриптов]] способны к смысловой и антисмысловой [[Транскрипция (биология)|транскрипции]]. Также был начат анализ [[Комплементарная ДНК|кДНК]] и профилей [[Экспрессия генов|экспрессии генов]] человека<ref>{{Статья|автор = |заглавие = Antisense transcription in the mammalian transcriptome|издание = Science|тип = |год = 2005|номер = 309|страницы = |issn = |doi = 10.1126/science.1112009}}</ref><ref>{{Статья|автор = |заглавие = The transcriptional landscape of the mammalian genome|издание = Science|тип = |год = 2005|номер = 309|страницы = |issn = |doi = 10.1126/science.1112014}}</ref>.
Применение новой технологии CAGE] показало, что более чем 63 % генома (а не около 1,5 % [[белок]]-кодирующих [[экзон]]ов, как считалось ранее) транскрибируется с образованием РНК. Также было обнаружено более 23000 некодирующих РНК и что более 73 % генов могут подвергаться смысловой и [[Антисмысловые РНК|антисмысловой]] транскрипции. Также был начат анализ кДНК и профилей экспрессии генов человека<ref>{{cite doi|10.1126/science.1112009}}</ref><ref>{{cite doi|10.1126/science.1112014}}</ref>.


=== FANTOM4 ===
=== FANTOM4 ===
Для работы четвёртой фазы проекта динамические паттерны [[Экспрессия генов|экспрессии генов]] [[Матричная РНК|мРНК]], [[микроРНК]] и активности [[промотор]]ов были измерены для дифференцирующихся клеток [[Острый миелоидный лейкоз|миелоидной лейкемии]] человека — клеточной линии [[:en:THP-1 cell line|THP-1]]<ref>{{Статья|ссылка=https://doi.org/10.1186/gb-2010-11-s1-o11|автор=Harukazu Suzuki, Piero Carninci, Carsten Daub, Jun Kawai, Yoshihide Hayashizaki|заглавие=Beyond the FANTOM4|год=2010-10-11|издание=Genome Biology|том=11|выпуск=1|страницы=O11|issn=1474-760X|doi=10.1186/gb-2010-11-s1-o11}}</ref>.
Для работы четвёртой фазы проекта динамические паттерны экспрессии генов мРНК, [[микроРНК]] и активности промоторов были измерены для [[Дифференцировка клеток|дифференцирующихся]] клеток [[Острый миелоидный лейкоз|миелоидной лейкемии]] [[человек]]а — {{нп5|Клеточная линия|клеточной линии|en|Immortalised cell line}} {{нп5|THP-1||en|THP-1 cell line}}<ref>{{cite doi|10.1186/gb-2010-11-s1-o11}}</ref>.


Во время работы этого этапа для мониторинга динамики использования точек инициации транскрипции ([[wikiversity:Transcription start sites|TSS]]) в ходе клеточной дифференциации использовалась технология deepCAGE<ref>{{Cite web|url=http://fantom.gsc.riken.jp/protocols/deep.html|title=deepCAGE}}</ref>. Для построения модели транскрипционной регуляторной сети были использованы предсказанные сайты связывания [[Факторы транскрипции|транскрипционных факторов]] и данные об уровнях [[Экспрессия генов|экспресии]] [[промотор]]ов. Благодаря этому стало возможным предсказывать регуляторные границы (EDGES) между [[Факторы транскрипции|транскрипционным фактором]] и целевым [[промотор]]ом, делать выводы о регуляции [[Транскрипция (биология)|транскрипции]] с исследуемого [[промотор]]а определённым [[Факторы транскрипции|транскрипционным фактором]]. На основе этих данных была разработана EDGE EXPRESS DB<ref>{{Cite web|url=http://fantom.gsc.riken.jp/4/edgeexpress/about/|title=EDGE EXPRESS DB}}</ref>, в которой можно найти регуляционные сети одного или нескольких интересующих [[ген]]ов<ref>{{Статья|автор = |заглавие = The transcriptional network that controls growth arrest and differentiation in a human myeloid leukemia cell line|издание = Nature Genetics|тип = |год = 2009|номер = 41|страницы = |issn = |doi = 10.1038/ng.375}}</ref>.
Во время работы этого этапа для мониторинга динамики использования точек инициации транскрипции ({{lang-en|transcription start site, TSS}}) в ходе клеточной дифференцировки использовалась технология deepCAGE<ref>{{Cite web|url=http://fantom.gsc.riken.jp/protocols/deep.html|title=deepCAGE}}</ref>. Для построения модели транскрипционной регуляторной сети были использованы предсказанные сайты связывания [[Факторы транскрипции|транскрипционных факторов]] и данные об уровнях активности промоторов. Благодаря этому стало возможным предсказывать регуляторные границы (EDGES) между транскрипционным фактором и целевым промотором, делать выводы о регуляции транскрипции с исследуемого промотора определённым транскрипционным фактором. На основе этих данных была разработана EDGE EXPRESS DB<ref>{{Cite web|url=http://fantom.gsc.riken.jp/4/edgeexpress/about/|title=EDGE EXPRESS DB}}</ref>, в которой можно найти регуляционные сети одного или нескольких интересующих генов<ref>{{cite doi|10.1038/ng.375}}</ref>.


Также были созданы геномные браузеры<ref>{{Cite web|url=http://fantom.gsc.riken.jp/4/gev/gbrowse/hg18/|title=геномные браузеры}}</ref> для графического отображения в [[геном]]е [[Мышиные|мыши]] или [[Человек разумный|человека]] важных мест, таких как [[промотор]]ы, [[экзон]]ы, места ацетилирования His3 (''[[:en:H3K9ac|H3K9ac]]'') и сайты связывания [[Факторы транскрипции|транскрипционных факторов]]<ref>{{Cite web|url=https://fantom.gsc.riken.jp/4/gev/gbrowse/hg18/|title=Human (hg18) genome viewer for THP-1 analysis [Release 2009/03/02]: chr16:31160546..31269948|publisher=fantom.gsc.riken.jp|accessdate=2020-05-14}}</ref>.
Также были созданы {{нп5|Геномный браузер|геномные браузеры|en|Genome browser}}<ref>{{Cite web|url=http://fantom.gsc.riken.jp/4/gev/gbrowse/hg18/|title=геномные браузеры}}</ref> для графического отображения в геноме мыши или человека важных мест, таких как промоторы, экзоны, места [[Ацетилирование|ацетилирования]] {{нп5|Гистон H3|гистона H3|en|Histone H3}} ({{нп5|H3K9ac||en|H3K9ac}}) и [[Участок связывания лиганда с рецептором|сайты связывания]] транскрипционных факторов<ref>{{Cite web|url=https://fantom.gsc.riken.jp/4/gev/gbrowse/hg18/|title=Human (hg18) genome viewer for THP-1 analysis [Release 2009/03/02]: chr16:31160546..31269948|publisher=fantom.gsc.riken.jp|accessdate=2020-05-14}}</ref>.


=== FANTOM5 ===
=== FANTOM5 ===
Эта стадия проекта, полностью основанная на опыте предыдущих стадий, продолжается по настоящее время с целью поиска общих правил клеточной дифференциации. Главной целью является систематическое исследование наборов генов, используемых при кодировании большинства типов клеток. Создаётся карта основных промоторв человека и относительная модель транскрипционной сети регуляции каждого клеточного состояния. Для этого используется deepCAGE<ref>{{Cite web|url=http://fantom.gsc.riken.jp/protocols/deep.html|title=deepCAGE}}</ref> [[секвенирование РНК]], выделенных из всех основных [[Органы человека|органов человека]] и более 200 [[Злокачественные клетки|раковых]] [[Культура клеток|клеточных линий]]<ref name="multiple"> </ref>.


В ходе первой фазы были получены карты для наборов транскриптов, транскрипционных факторов, промоторов и [[энхансер]]ов, активных в большинстве первичных клеток млекопитающих и части [[Злокачественная опухоль|раковых]] [[Культура клеток|клеточных линий]]<ref>{{cite doi|10.1038/nature13182}}</ref><ref>{{cite doi|10.1038/nature12787}}</ref>. Примерно 30 публикаций этой фазы проекта описывают такие разные результаты, как первичные клетки, семейства генов, полногеномные исследования и новые [[Биоинформатика|биоинформатические]] инструменты<ref>{{Cite web|lang=en|url=https://fantom.gsc.riken.jp/5/|title=FANTOM - FANTOM5|author=DGT PR|publisher=FANTOM|accessdate=2020-05-11}}</ref>.
====== Введение ======
Эта стадия проекта, полностью основанная на опыте предыдущих стадий, продолжается по настоящее время с целью поиска общих правил клеточной дифференциации. Главной целью является систематическое исследование наборов [[ген]]ов, используемых при кодировании большинства типов клеток. Создаётся карта основных [[промотор]]ов человека и относительная модель транскрипционной сети регуляции каждого клеточного состояния. Для этого используется deepCAGE<ref>{{Cite web|url=http://fantom.gsc.riken.jp/protocols/deep.html|title=deepCAGE}}</ref> [[секвенирование РНК]], выделенных из всех основных [[Органы человека|органов человека]] и более 200 раковых [[Культура клеток|клеточных линий]]<ref name="multiple"> </ref>.
==== Фаза 1 ====
Были получены карты для наборов [[Транскриптом|транскриптов]], [[Факторы транскрипции|транскрипционных факторов]], [[промотор]]ов и [[энхансер]]ов, активных в большинстве первичных клеток [[Млекопитающие|млекопитающих]] и части [[Злокачественная опухоль|раковых]] [[Культура клеток|клеточных линий]]<ref>{{Статья|заглавие = A promoter level mammalian expression atlas|издание = Nature|тип = |год = 2014|номер = 507|страницы = |doi = 10.1038/nature13182}}</ref><ref>{{Статья|автор = |заглавие = An atlas of active enhancers across human cell types and tissues.|издание = Nature|тип = |год = 2014|номер = 507|страницы = |doi = 10.1038/nature12787}}</ref>.


В ходе второй фазы сравнительный анализ уровней РНК в разных типах клеток показал, что когда клетка дифференцируется, первичная активация этого процесса случается в энхансерных участках ДНК<ref>{{cite doi|10.1126/science.1259418}}</ref>.
Примерно 30 публикаций этой фазы проекта описывают такие разные результаты, как первичные клетки, семейства [[ген]]ов, полногеномные исследования и новые [[Биоинформатика|биоинформатические]] инструменты<ref>{{Cite web|lang=en|url=https://fantom.gsc.riken.jp/5/|title=FANTOM - FANTOM5|author=DGT PR|publisher=FANTOM|accessdate=2020-05-11}}</ref>.


Существуют серьёзные споры о том, являются ли тысячи длинных некодирующих РНК, транскрибируемые с наших геномов, функциональными или просто побочными продуктами шумового ранскрипционного механизма. Учёные из консорциума FANTOM5 под руководством RIKEN использовали технологию, известную как CAGE, для создания атласа [[Длинные некодирующие РНК|длинных некодирующих РНК]] человека с точными 5'-концами и суммировали их паттерны экспрессии по основным типам клеток. При публикации после пересечения этого атласа экспрессии с другими [[Генетика|генетическими]] и геномными наборами данных авторы предположили, что многие из этих длинных некодирующих РНК могут быть функциональными<ref>{{cite doi|10.1038/nature21374}}</ref>.
==== Фаза 2 ====
Сравнительный анализ уровней [[Рибонуклеиновая кислота|РНК]] в разных типах клеток показал, что когда клетка дифференцируется, первичная активация этого процесса случается в [[энхансер]]ных участках [[Дезоксирибонуклеиновая кислота|ДНК]]<ref>{{Статья|автор = |заглавие = Transcribed enhancers lead waves of coordinated transcription in transitioning mammalian cells|издание = Science|тип = |год = 2015|номер = 347|страницы = |doi = 10.1126/science.1259418}}</ref>.


CAGE в большой коллекции первичных типов клеток показал, что многие промоторы млекопитающих представляют собой составные объекты, состоящие из множества близко расположенных точек инициаций транскрипций, с независимыми профилями экспрессии, специфичными для типа клеток. Атлас экспрессии, ориентированный на промотор FANTOM5<ref>{{Cite web|url=https://web.archive.org/web/20181102155217/http://fantom.gsc.riken.jp/|title=FANTOM5}}</ref>, обеспечивает профили экспрессии для большинства кодирующих и [[Мусорная ДНК|некодирующих]] транскриптов в геномах человека и мыши<ref>{{cite doi|10.1038/nature13182}}</ref>.
==== Результаты ====
Существуют серьёзные споры о том, являются ли тысячи длинных [[Некодирующие РНК|некодирующих РНК]], транскрибируемые с наших [[геном]]ов, функциональными или просто побочными продуктами шумового [[Транскрипция (биология)|транскрипционного]] механизма. Учёные из консорциума FANTOM5 под руководством RIKEN использовали технологию, известную ''[[Кэп-анализ экспрессии генов|CAGE]]'', для создания атласа длинных [[Некодирующие РНК|некодирующих РНК]] [[Человек разумный|человека]] с точными 5'-концами и суммировали их паттерны экспрессии по основным типам клеток. В публикации, после пересечения этого атласа [[Экспрессия генов|экспрессии]] с другими генетическими и [[геном]]ными наборами данных, предположили, что многие из этих длинных [[Некодирующие РНК|некодирующих РНК]] могут быть функциональными<ref>{{Статья|ссылка=https://www.nature.com/articles/nature21374|автор=Chung-Chau Hon, Jordan A. Ramilowski, Jayson Harshbarger, Nicolas Bertin, Owen J. L. Rackham|заглавие=An atlas of human long non-coding RNAs with accurate 5′ ends|год=2017-03|язык=en|издание=Nature|том=543|выпуск=7644|страницы=199–204|issn=1476-4687|doi=10.1038/nature21374}}</ref>. <br>


С помощью FANTOM5<ref>{{Cite web|url=https://web.archive.org/web/20181101021343/http://fantom.gsc.riken.jp/5/|title=FANTOM5}}</ref> был получен транскриптом свежеизолированных [[тучные клетки|тучных клеток]] [[Кожа|кожи]] человека. Тучные клетки уникальны в [[Гемопоэз|гемопоэтической линии]] и только отдалённо связаны с [[базофил]]ами. Было показано, что тучные клетки экспрессируют [[Костный морфогенетический белок|BMP]]-[[Клеточный рецептор|рецепторы]] и что BMP может способствовать выживанию и восстановлению после стимуляции тучных клеток человека<ref>{{cite doi|10.1182/blood-2013-02-483792}}</ref>.
''[[Кэп-анализ экспрессии генов|CAGE]]'' в большой коллекции первичных типов клеток показал, что многие [[промотор]]ы [[Млекопитающие|млекопитающих]] представляют собой составные объекты, состоящие из множества близко расположенных точек инициаций транскрипций (''[[wikiversity:Gene transcriptions/Start sites|TSS]])'', с независимыми профилями [[Экспрессия генов|экспрессии]], специфичными для типа клеток. Атлас [[Экспрессия генов|экспрессии]], ориентированный на [[промотор]] FANTOM5<ref>{{Cite web|url=https://web.archive.org/web/20181102155217/http://fantom.gsc.riken.jp/|title=FANTOM5}}</ref>, обеспечивает профили [[Экспрессия генов|экспрессии]] для большинства кодирующих и некодирующих [[Транскрипт (биология)|транскриптов]] в [[геном]]ах [[Человек разумный|человека]] и [[Мышиные|мыши]]<ref>{{Статья|ссылка=https://www.nature.com/articles/nature13182|автор=Alistair R. R. Forrest, Hideya Kawaji, Michael Rehli, J. Kenneth Baillie, Michiel J. L. de Hoon|заглавие=A promoter-level mammalian expression atlas|год=2014-03|язык=en|издание=Nature|том=507|выпуск=7493|страницы=462–470|issn=1476-4687|doi=10.1038/nature13182}}</ref>.


С помощью FANTOM5<ref>{{Cite web|url=https://web.archive.org/web/20181101021343/http://fantom.gsc.riken.jp/5/|title=FANTOM5}}</ref> был получен транскриптом свежеизолированных [[тучные клетки|тучных клеток]] кожи [[Человек разумный|человека]]. [[Тучные клетки]] уникальны в гематопоэтической линии и только отдалённо связаны с [[Базофилы|базофилами]]. Было показано, что [[тучные клетки]] [[Экспрессия генов|экспрессируют]] [[Костный морфогенетический белок|BMP]]-рецепторы, и что [[Костный морфогенетический белок|BMP]] могут способствовать выживанию и восстановлению после стимуляции [[Тучные клетки|тучных клеток]] [[Человек разумный|человека]]<ref>{{Статья|ссылка=https://ashpublications.org/blood/article/123/17/e58/32574/Redefinition-of-the-human-mast-cell-transcriptome|автор=Efthymios Motakis, Sven Guhl, Yuri Ishizu, Masayoshi Itoh, Hideya Kawaji|заглавие=Redefinition of the human mast cell transcriptome by deep-CAGE sequencing|год=2014-04-24|язык=en|издание=Blood|том=123|выпуск=17|страницы=e58–e67|issn=0006-4971|doi=10.1182/blood-2013-02-483792}}</ref>.

<br />
<gallery mode="packed" width=200px heights=200px perrow=7>
<gallery mode="packed" width=200px heights=200px perrow=7>
File:An_atlas_of_human_long_non-coding_RNAs_with_accurate_5’_ends.png|Атлас длинных некодирующих РНК человека
File:An_atlas_of_human_long_non-coding_RNAs_with_accurate_5’_ends.png|Атлас длинных некодирующих РНК человека
Строка 107: Строка 100:


== Примечания ==
== Примечания ==
{{примечания}}
{{примечания|2}}


== Ссылки ==
== Ссылки ==

Версия от 18:05, 14 мая 2020

FANTOM (англ. FANTOM — Functional Annotation of the Mammalian Genome, рус. Функциональная аннотация геномов млекопитающих) — международный исследовательский консорциум, основанный доктором Хаяшизаки[1] и его коллегами в 2000 году с целью функционального аннотирования[англ.] полноразмерных кДНК, которые были собраны в ходе проекта Mouse Encyclopedia[2] в научном центре RIKEN. С тех пор FANTOM стал самостоятельным и развитым проектом, который затрагивает разные сферы анализа траскриптомов. Цель проекта — прийти от понимания «элементов» — транскриптов до понимания «системы» — транскрипционной регуляторной сети[3].

Этапы работы проекта: история и публикации

FANTOM1

Развитие FANTOM

The RIKEN Mouse Gene Encyclopaedia Project[1] — проект, методы которого позволяют определить полный потенциал кодирующего генома мыши. В ходе данного проекта была получена коллекция последовательностей полноразмерных кДНК с последующим картированием соответствующих генов на геноме мыши. Следствием этого проекта стало основание ассоциации FANTOM с целью аннотирования первых 21076 кДНК. Эта коллекция кДНК стала одной из крупнейших для какого-либо организма на тот момент. Анализ этих кДНК расширил уже существующие семейства генов[англ.] и определил новые[4].

В ходе первого этапа работы консорциума была разработана эффективная система функциональной аннотации генов, основанная на разработанных de novo правилах и методах. Основные результаты были опубликованы в журнале Nature в 2001 году[5].

Технология получения полноразмерных кДНК

Общий вид последовательных стадий можно представить следующим образом[6]:

  1. Экстракция РНК из клеток;
  2. Синтез полноразмерных кДНК;
  3. Селекция полноразмерных кДНК;
  4. Нормировка;
  5. Клонирование;
  6. Секвенирование;
  7. Компьютерный анализ.

Трегалозный метод синтеза полноразмерных кДНК

Раньше одной из самых больших трудностей получения полноразмерных кДНК являлась неэффективность работы ревертазы при синтезе второй цепи. Было показано, что добавление трегалозы значительно увеличивает термостабильность и активность фермента[7]. Это открытие позволило проводить ревертазные реакции при 60 °C вместо 42 °С, как раньше. При температуре 60 °C вторичная структура РНК из образца подплавляется и участок на 5'-конце мРНК становится доступным для транскрипции[8].

Метод биотинилированной кэп-ловушки для отсеивания неполноразмерных кДНК

Метод разработан для селекции только полноразмерных кДНК. Сначала кэп, который есть на 5'-конце всех эукариотических мРНК биотинилируется. Затем происходит обратная транскрипция, и оцРНК подвергается деградации. Если траскрипция кДНК прервалась, то после расщепления одноцепочечных участков биотин на их 5'-конце будет отсутствовать. Оставшиеся полноразмерные кДНК с биотинилированным кэпом «вылавливаются» стрептавидиновыми?! бусинами. Затем в щелочной среде цепи ДНК элюируются[англ.] и производится достраивание второй цепи ДНК[9].

Вектор для клонирования

Проблема того, что короткие мРНК более вероятно будут иметь больше клонов, чем более длинные, была решена разработкой нового вектора, подходящего для клонирования кДНК размером от 6 тысяч пар оснований (п. о.) до 20 кб, — λFlcIII-L. Этот вектор был усовершенствован (фоновое лигирование снижено практически до нуля) и назван λFlcIV. Именно он использовался для клонирования[10].

Нормировка

Так как от 50 до 60 % всей РНК клетки соответствуют генам домашнего хозяйства, то для оценки относительно низкого уровня РНК необходимо нормализовать библиотеки[англ.] частоты встречаемости конкретных кДНК[11].

FANTOM2

После первого съезда консорциума FANTOM, группа из RIKEN продолжила создание мышиных полноразмерных кДНК. В ходе второй фазы были определены последовательности и созданы функциональные аннотации для этого набора из 60770 полноразмерных кДНК мыши. Это стало первым всемирным проектом по стандартизации полноразмерных кДНК млекопитающих[12].

Проект FANTOM2[13] состоял из трёх частей: собрания «Typhoon», телеконференции MATRICS и собрания «Cherry Blossom».

Собрание «Typhoon»

Собрание «Typhoon» было проведено 15—19 октября 2001 года. Обсуждались стратегии и правила аннотации для более эффективного аннотирования с использованием информации о профилях экспрессии, картирования и данных о белок-белковых взаимодействиях, а также традиционного выравнивания последовательностей. В качестве тестовой выборки для встречи «Typhoon» FANTOM2 были подготовлены и проанализированы 46000 последовательностей[14].

MATRICS (Mouse Annotation Teleconference for RIken CDNA Sequences)

MATRICS (от англ. Mouse Annotation Teleconference for RIken CDNA Sequences) — телеконференция, в ходе которой кураторы аннотировали последовательности кДНК из RIKEN через Интернет, используя систему защищённых серверов и систему FANTOM. Система FANTOM предусмастривает использование большого количества онлайн ресурсов[15] .

Собрание «Cherry Blossom»

После MATRICS была проведена встреча «Cherry Blossom» (с 29 апреля по 4 мая 2002 года) для доклада и обсуждения результатов функциональных аннотаций и биологически интересных находок[16].

По результатам была опубликована статья в журнале Nature в 2002 году[17].

FANTOM3

Аналогично двум другим этапам были проведены встречи до начала работы (Tanabata Meeting: 04.07 — 08.07.2004, RIKEN, GSC, Япония) и после окончания работы проекта (Harvest Meeting: 10.09 — 15.09.2004, RIKEN, Япония)[18].

В FANTOM3[19] для получения данных, которые раскрывают динамическое регулирование транскриптома, была изменена стратегия аннотации[20]. В частности, были подготовлены новые наборы данных?! для:

  1. Идентификации новых полноразмерных кДНК для 103000 клонов;
  2. Детерминирования и аннотирования транскриптов, транскрипционных единиц, анализа их сложности и экспрессии;
  3. Экспериментальной идентификации стартовых позиций инициации транскрипции и её терминации, а также вычисления сложности человеческого транскриптома;
  4. Выявления промоторов.

Таким образом, помимо подготовления новых данных для более функционального анализа транскриптома, идентификации и аннотирования новых и низкоуровневых мРНК, конечной целью FANTOM3 было функционально аннотировать сложность транскриптома, идентифицировать стартовые сайты инициации транскрипции, сайты терминации транскрипции, а также промоторы. Ещё одним аспектом понимания сложности транскриптома было осмысление некодирущих РНК, которые составляют до половины транскриптома. В новвовведения входили также технологии CAGE, GIS (от англ. Gene Identification Signature) и GSC (от англ. Genome Signature Cloning)[21].

MATRICS-RELOADED

103000 полноразмерных кДНК были аннотированы в ходе телеконференции MATRICS-RELOADED, аналогичной MATRICS FANTOM2. В телемосте участвовало свыше 100 учёных со всего мира. Функциональные аннотации полноразмерных кДНК можно найти на сервере FANTOM3[22].

Технология CAGE

Технология кэп-анализа экспрессии генов (CAGE) позволяет проводить высокопроизводительный анализ экспрессии генов, получать профили участков транскрипции[23].

Применение новой технологии CAGE] показало, что более чем 63 % генома (а не около 1,5 % белок-кодирующих экзонов, как считалось ранее) транскрибируется с образованием РНК. Также было обнаружено более 23000 некодирующих РНК и что более 73 % генов могут подвергаться смысловой и антисмысловой транскрипции. Также был начат анализ кДНК и профилей экспрессии генов человека[24][25].

FANTOM4

Для работы четвёртой фазы проекта динамические паттерны экспрессии генов мРНК, микроРНК и активности промоторов были измерены для дифференцирующихся клеток миелоидной лейкемии человека — клеточной линии[англ.] THP-1[англ.][26].

Во время работы этого этапа для мониторинга динамики использования точек инициации транскрипции (англ. transcription start site, TSS) в ходе клеточной дифференцировки использовалась технология deepCAGE[27]. Для построения модели транскрипционной регуляторной сети были использованы предсказанные сайты связывания транскрипционных факторов и данные об уровнях активности промоторов. Благодаря этому стало возможным предсказывать регуляторные границы (EDGES) между транскрипционным фактором и целевым промотором, делать выводы о регуляции транскрипции с исследуемого промотора определённым транскрипционным фактором. На основе этих данных была разработана EDGE EXPRESS DB[28], в которой можно найти регуляционные сети одного или нескольких интересующих генов[29].

Также были созданы геномные браузеры[англ.][30] для графического отображения в геноме мыши или человека важных мест, таких как промоторы, экзоны, места ацетилирования гистона H3[англ.] (H3K9ac[англ.]) и сайты связывания транскрипционных факторов[31].

FANTOM5

Эта стадия проекта, полностью основанная на опыте предыдущих стадий, продолжается по настоящее время с целью поиска общих правил клеточной дифференциации. Главной целью является систематическое исследование наборов генов, используемых при кодировании большинства типов клеток. Создаётся карта основных промоторв человека и относительная модель транскрипционной сети регуляции каждого клеточного состояния. Для этого используется deepCAGE[32] секвенирование РНК, выделенных из всех основных органов человека и более 200 раковых клеточных линий[3].

В ходе первой фазы были получены карты для наборов транскриптов, транскрипционных факторов, промоторов и энхансеров, активных в большинстве первичных клеток млекопитающих и части раковых клеточных линий[33][34]. Примерно 30 публикаций этой фазы проекта описывают такие разные результаты, как первичные клетки, семейства генов, полногеномные исследования и новые биоинформатические инструменты[35].

В ходе второй фазы сравнительный анализ уровней РНК в разных типах клеток показал, что когда клетка дифференцируется, первичная активация этого процесса случается в энхансерных участках ДНК[36].

Существуют серьёзные споры о том, являются ли тысячи длинных некодирующих РНК, транскрибируемые с наших геномов, функциональными или просто побочными продуктами шумового ранскрипционного механизма. Учёные из консорциума FANTOM5 под руководством RIKEN использовали технологию, известную как CAGE, для создания атласа длинных некодирующих РНК человека с точными 5'-концами и суммировали их паттерны экспрессии по основным типам клеток. При публикации после пересечения этого атласа экспрессии с другими генетическими и геномными наборами данных авторы предположили, что многие из этих длинных некодирующих РНК могут быть функциональными[37].

CAGE в большой коллекции первичных типов клеток показал, что многие промоторы млекопитающих представляют собой составные объекты, состоящие из множества близко расположенных точек инициаций транскрипций, с независимыми профилями экспрессии, специфичными для типа клеток. Атлас экспрессии, ориентированный на промотор FANTOM5[38], обеспечивает профили экспрессии для большинства кодирующих и некодирующих транскриптов в геномах человека и мыши[39].

С помощью FANTOM5[40] был получен транскриптом свежеизолированных тучных клеток кожи человека. Тучные клетки уникальны в гемопоэтической линии и только отдалённо связаны с базофилами. Было показано, что тучные клетки экспрессируют BMP-рецепторы и что BMP может способствовать выживанию и восстановлению после стимуляции тучных клеток человека[41].

Доступность данных

Интерактивные базы данных (interactive viewer, data exporter) и все файлы за время работы всех стадий проекта находятся в свободном доступе в общей FANTOM database[42].

Все полноразмерные кДНК клоны доступны в Dnaform, Invitrogen, RZPD и Gene Service[43][44][45].

Примечания

  1. 1 2 Yoshihide Hayashizaki.
  2. The Mouse Encyclopedia Project. Omics Science Center. Дата обращения: 9 апреля 2020. Архивировано 17 сентября 2016 года.
  3. 1 2 FANTOM. web.archive.org (2 ноября 2018). Дата обращения: 9 апреля 2020.
  4. The RIKEN Genome Exploration Research Group Phase II Team and the FANTOM Consortium. Functional annotation of a full-length mouse cDNA collection (англ.) // Nature. — 2001. — February (vol. 409, no. 6821). — P. 685—690. — ISSN 0028-0836. — doi:10.1038/35055500. [исправить]
  5. The RIKEN Genome Exploration Research Group Phase II Team and the FANTOM Consortium. Functional annotation of a full-length mouse cDNA collection (англ.) // Nature. — 2001. — February (vol. 409, no. 6821). — P. 685—690. — ISSN 0028-0836. — doi:10.1038/35055500. [исправить]
  6. Chen Nan, Wang Wei-Min, Wang Huan-Ling. An efficient full-length cDNA amplification strategy based on bioinformatics technology and multiplexed PCR methods (англ.) // Scientific Reports. — 2016. — 13 January (vol. 6, no. 1). — ISSN 2045-2322. — doi:10.1038/srep19420. [исправить]
  7. Carninci P., Nishiyama Y., Westover A., Itoh M., Nagaoka S., Sasaki N., Okazaki Y., Muramatsu M., Hayashizaki Y. Thermostabilization and thermoactivation of thermolabile enzymes by trehalose and its application for the synthesis of full length cDNA (англ.) // Proceedings of the National Academy of Sciences. — 1998. — 20 January (vol. 95, no. 2). — P. 520—524. — ISSN 0027-8424. — doi:10.1073/pnas.95.2.520. [исправить]
  8. Carninci P., Nishiyama Y., Westover A., Itoh M., Nagaoka S., Sasaki N., Okazaki Y., Muramatsu M., Hayashizaki Y. Thermostabilization and thermoactivation of thermolabile enzymes by trehalose and its application for the synthesis of full length cDNA (англ.) // Proceedings of the National Academy of Sciences. — 1998. — 20 January (vol. 95, no. 2). — P. 520—524. — ISSN 0027-8424. — doi:10.1073/pnas.95.2.520. [исправить]
  9. Carninci Piero, Kvam Catrine, Kitamura Akiko, Ohsumi Tomoya, Okazaki Yasushi, Itoh Mitsuteru, Kamiya Mamoru, Shibata Kazuhiro, Sasaki Nobuya, Izawa Masaki, Muramatsu Masami, Hayashizaki Yoshihide, Schneider Claudio. High-Efficiency Full-Length cDNA Cloning by Biotinylated CAP Trapper (англ.) // Genomics. — 1996. — November (vol. 37, no. 3). — P. 327—336. — ISSN 0888-7543. — doi:10.1006/geno.1996.0567. [исправить]
  10. Carninci Piero, Shibata Yuko, Hayatsu Norihito, Itoh Masayoshi, Shiraki Toshiyuki, Hirozane Tomoko, Watahiki Akira, Shibata Kazuhiro, Konno Hideaki, Muramatsu Masami, Hayashizaki Yoshihide. Balanced-Size and Long-Size Cloning of Full-Length, Cap-Trapped cDNAs into Vectors of the Novel λ-FLC Family Allows Enhanced Gene Discovery Rate and Functional Analysis (англ.) // Genomics. — 2001. — September (vol. 77, no. 1-2). — P. 79—90. — ISSN 0888-7543. — doi:10.1006/geno.2001.6601. [исправить]
  11. Carninci Piero, Shibata Yuko, Hayatsu Norihito, Itoh Masayoshi, Shiraki Toshiyuki, Hirozane Tomoko, Watahiki Akira, Shibata Kazuhiro, Konno Hideaki, Muramatsu Masami, Hayashizaki Yoshihide. Balanced-Size and Long-Size Cloning of Full-Length, Cap-Trapped cDNAs into Vectors of the Novel λ-FLC Family Allows Enhanced Gene Discovery Rate and Functional Analysis (англ.) // Genomics. — 2001. — September (vol. 77, no. 1-2). — P. 79—90. — ISSN 0888-7543. — doi:10.1006/geno.2001.6601. [исправить]
  12. FANTOM. fantom.gsc.riken.jp. Дата обращения: 11 мая 2020.
  13. FANTOM2.
  14. Kasukawa T. Development and Evaluation of an Automated Annotation Pipeline and cDNA Annotation System (англ.) // Genome Research. — 2003. — 2 June (vol. 13, no. 6). — P. 1542—1551. — ISSN 1088-9051. — doi:10.1101/gr.992803. [исправить]
  15. Online resources for MATRICS FANTOM2.
  16. FANTOM. web.archive.org (21 ноября 2018). Дата обращения: 9 апреля 2020.
  17. The FANTOM Consortium and the RIKEN Genome Exploration Research Group Phase I & II Team. Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs (англ.) // Nature. — 2002. — December (vol. 420, no. 6915). — P. 563—573. — ISSN 0028-0836. — doi:10.1038/nature01266. [исправить]
  18. FANTOM3::History. fantom3.gsc.riken.jp. Дата обращения: 11 мая 2020.
  19. FANTOM3.
  20. Стратегия аннотации FANTOM3.
  21. Maeda Norihiro, Kasukawa Takeya, Oyama Rieko, Gough Julian, Frith Martin, Engström Pär G, Lenhard Boris, Aturaliya Rajith N, Batalov Serge, Beisel Kirk W, Bult Carol J, Fletcher Colin F, Forrest Alistair R. R, Furuno Masaaki, Hill David, Itoh Masayoshi, Kanamori-Katayama Mutsumi, Katayama Shintaro, Katoh Masaru, Kawashima Tsugumi, Quackenbush John, Ravasi Timothy, Ring Brian Z, Shibata Kazuhiro, Sugiura Koji, Takenaka Yoichi, Teasdale Rohan D, Wells Christine A, Zhu Yunxia, Kai Chikatoshi, Kawai Jun, Hume David A, Carninci Piero, Hayashizaki Yoshihide. Transcript Annotation in FANTOM3: Mouse Gene Catalog Based on Physical cDNAs (англ.) // PLoS Genetics. — 2006. — 28 April (vol. 2, no. 4). — P. e62. — ISSN 1553-7404. — doi:10.1371/journal.pgen.0020062. [исправить]
  22. Сервер FANTOM3.
  23. FANTOM3::History. fantom.gsc.riken.jp. Дата обращения: 9 апреля 2020.
  24. RIKEN Genome Exploration Research Group and Genome Science Group (Genome Network Project Core Group) and the FANTOM Consortium. Antisense Transcription in the Mammalian Transcriptome (англ.) // Science. — 2005. — 2 September (vol. 309, no. 5740). — P. 1564—1566. — ISSN 0036-8075. — doi:10.1126/science.1112009. [исправить]
  25. The FANTOM Consortium. The Transcriptional Landscape of the Mammalian Genome (англ.) // Science. — 2005. — 2 September (vol. 309, no. 5740). — P. 1559—1563. — ISSN 0036-8075. — doi:10.1126/science.1112014. [исправить]
  26. Suzuki Harukazu, Carninci Piero, Daub Carsten, Kawai Jun, Hayashizaki Yoshihide. Beyond the FANTOM4 (англ.) // Genome Biology. — 2010. — Vol. 11, no. Suppl 1. — P. O11. — ISSN 1465-6906. — doi:10.1186/gb-2010-11-s1-o11. [исправить]
  27. deepCAGE.
  28. EDGE EXPRESS DB.
  29. The FANTOM Consortium, Riken Omics Science Center. The transcriptional network that controls growth arrest and differentiation in a human myeloid leukemia cell line (англ.) // Nature Genetics. — 2009. — 19 April (vol. 41, no. 5). — P. 553—562. — ISSN 1061-4036. — doi:10.1038/ng.375. [исправить]
  30. геномные браузеры.
  31. Human (hg18) genome viewer for THP-1 analysis [Release 2009/03/02]: chr16:31160546..31269948. fantom.gsc.riken.jp. Дата обращения: 14 мая 2020.
  32. deepCAGE.
  33. The FANTOM Consortium and the RIKEN PMI and CLST (DGT). A promoter-level mammalian expression atlas (англ.) // Nature. — 2014. — March (vol. 507, no. 7493). — P. 462—470. — ISSN 0028-0836. — doi:10.1038/nature13182. [исправить]
  34. Andersson Robin, The FANTOM Consortium, Gebhard Claudia, Miguel-Escalada Irene, Hoof Ilka, Bornholdt Jette, Boyd Mette, Chen Yun, Zhao Xiaobei, Schmidl Christian, Suzuki Takahiro, Ntini Evgenia, Arner Erik, Valen Eivind, Li Kang, Schwarzfischer Lucia, Glatz Dagmar, Raithel Johanna, Lilje Berit, Rapin Nicolas, Bagger Frederik Otzen, Jørgensen Mette, Andersen Peter Refsing, Bertin Nicolas, Rackham Owen, Burroughs A. Maxwell, Baillie J. Kenneth, Ishizu Yuri, Shimizu Yuri, Furuhata Erina, Maeda Shiori, Negishi Yutaka, Mungall Christopher J., Meehan Terrence F., Lassmann Timo, Itoh Masayoshi, Kawaji Hideya, Kondo Naoto, Kawai Jun, Lennartsson Andreas, Daub Carsten O., Heutink Peter, Hume David A., Jensen Torben Heick, Suzuki Harukazu, Hayashizaki Yoshihide, Müller Ferenc, Forrest Alistair R. R., Carninci Piero, Rehli Michael, Sandelin Albin. An atlas of active enhancers across human cell types and tissues (англ.) // Nature. — 2014. — March (vol. 507, no. 7493). — P. 455—461. — ISSN 0028-0836. — doi:10.1038/nature12787. [исправить]
  35. DGT PR. FANTOM - FANTOM5 (англ.). FANTOM. Дата обращения: 11 мая 2020.
  36. Arner Erik et al. Transcribed enhancers lead waves of coordinated transcription in transitioning mammalian cells (англ.) // Science. — 2015. — 12 February (vol. 347, no. 6225). — P. 1010—1014. — ISSN 0036-8075. — doi:10.1126/science.1259418. [исправить]
  37. Hon Chung-Chau, Ramilowski Jordan A., Harshbarger Jayson, Bertin Nicolas, Rackham Owen J. L., Gough Julian, Denisenko Elena, Schmeier Sebastian, Poulsen Thomas M., Severin Jessica, Lizio Marina, Kawaji Hideya, Kasukawa Takeya, Itoh Masayoshi, Burroughs A. Maxwell, Noma Shohei, Djebali Sarah, Alam Tanvir, Medvedeva Yulia A., Testa Alison C., Lipovich Leonard, Yip Chi-Wai, Abugessaisa Imad, Mendez Mickaël, Hasegawa Akira, Tang Dave, Lassmann Timo, Heutink Peter, Babina Magda, Wells Christine A., Kojima Soichi, Nakamura Yukio, Suzuki Harukazu, Daub Carsten O., de Hoon Michiel J. L., Arner Erik, Hayashizaki Yoshihide, Carninci Piero, Forrest Alistair R. R. An atlas of human long non-coding RNAs with accurate 5′ ends (англ.) // Nature. — 2017. — March (vol. 543, no. 7644). — P. 199—204. — ISSN 0028-0836. — doi:10.1038/nature21374. [исправить]
  38. FANTOM5.
  39. The FANTOM Consortium and the RIKEN PMI and CLST (DGT). A promoter-level mammalian expression atlas (англ.) // Nature. — 2014. — March (vol. 507, no. 7493). — P. 462—470. — ISSN 0028-0836. — doi:10.1038/nature13182. [исправить]
  40. FANTOM5.
  41. Motakis Efthymios, Guhl Sven, Ishizu Yuri, Itoh Masayoshi, Kawaji Hideya, de Hoon Michiel, Lassmann Timo, Carninci Piero, Hayashizaki Yoshihide, Zuberbier Torsten, Forrest Alistair R. R., Babina Magda. Redefinition of the human mast cell transcriptome by deep-CAGE sequencing (англ.) // Blood. — 2014. — 24 April (vol. 123, no. 17). — P. e58—e67. — ISSN 0006-4971. — doi:10.1182/blood-2013-02-483792. [исправить]
  42. FANTOM database.
  43. RIKEN Human cDNA Clones | K.K. DNAFORM. Дата обращения: 14 мая 2020.
  44. Cloning - US (англ.). www.thermofisher.com. Дата обращения: 14 мая 2020.
  45. Tips on Finding cDNA Clones. www.ncbi.nlm.nih.gov. Дата обращения: 14 мая 2020.

Ссылки

  • FANTOM. Functional Annotation of the Mammalian Genome (англ.). RIKEN. — Сайт проекта ФАНТОМ. Дата обращения: 14 апреля 2020.
  • The Mouse Encyclopedia Project (англ.).
  • CAGE homepage at the RIKEN Omics Science Center. (англ.)
  • Protocols. Detailed descriptions on protocols used in FANTOM (англ.). RIKEN. — Подробное описание протоколов, использованных в проекте. Дата обращения: 14 апреля 2020.
  • RIKEN Omics Science Center (англ.).