Idéntico por descendencia
Un segmento de ADN es idéntico por estado (IBS) en dos o más individuos si tienen secuencias de nucleótidos idénticas en este segmento. Un segmento de IBS es idéntico por descendencia (IBD, del inglés identical by descent) en dos o más individuos si lo han heredado de un ancestro común sin recombinación, es decir, el segmento tiene el mismo origen ancestral en estos individuos. Los segmentos de ADN que son IBD son IBS por definición, pero los segmentos que no son IBD aún pueden ser IBS debido a las mismas mutaciones en diferentes individuos o recombinaciones que no alteran el segmento.
Teoría
[editar]Todos los individuos en una población finita están relacionados si se remontan el tiempo suficiente y, por lo tanto, compartirán segmentos de sus genomas IBD. Durante la meiosis, los segmentos de IBD se dividen por recombinación. Por lo tanto, la longitud esperada de un segmento de IBD depende del número de generaciones desde el ancestro común más reciente en el locus del segmento. La longitud de los segmentos de IBD que resultan de un ancestro común n generaciones en el pasado (por lo tanto, involucrando 2n meiosis) se distribuye exponencialmente con la media 1/(2n) Morgans (M).[1] El número esperado de segmentos de EII disminuye con el número de generaciones desde el ancestro común en este lugar. Para un segmento de ADN específico, la probabilidad de ser EII disminuye a 2−2n, ya que en cada meiosis la probabilidad de transmitir este segmento es 1/2.[2]
Aplicaciones
[editar]Los segmentos de IBD identificados se pueden usar para una amplia gama de propósitos. Como se señaló anteriormente, la cantidad (longitud y número) de compartir IBD depende de las relaciones familiares entre los individuos evaluados. Por lo tanto, una aplicación de la detección del segmento de IBD es cuantificar la relación.[3][4][5][6] La medición de la relación se puede utilizar en genética forense,[7] pero también puede aumentar la información en el mapeo de enlaces genéticos[8] y ayudar a disminuir el sesgo por relaciones indocumentadas en estudios de asociación estándar.[9] Otra aplicación de la IBD es la imputación de genotipos y la inferencia de fase de haplotipos.[10][11][12] Segmentos compartidos largos de IBD, que están divididos por regiones cortas pueden ser indicativos de errores de fase.[13] : SI
Mapeo de IBD
[editar]El mapeo de IBD[3] es similar al análisis de ligamiento, pero puede realizarse sin un pedigrí conocido en una cohorte de individuos no relacionados. El mapeo de la IBD puede verse como una nueva forma de análisis de asociación que aumenta el poder de mapear genes o regiones genómicas que contienen múltiples variantes de susceptibilidad a enfermedades raras.[6][14]
Utilizando datos simulados, se demostró que el mapeo de IBD tiene mayor poder que las pruebas de asociación cuando múltiples variantes raras dentro de un gen contribuyen a la susceptibilidad a la enfermedad.[14] Mediante el mapeo de la IBD, se encontraron regiones significativas de todo el genoma en poblaciones aisladas, así como poblaciones exógenas, mientras que las pruebas de asociación estándar fallaron.[11][15] Se ha utilizado el intercambio de IBD para identificar la ubicación cromosómica de un gen responsable de la colestasis intrahepática recurrente benigna en una población pesquera aislada.[16] También se ha usado una población aislada para mapear una señal encontrada por un estudio de asociación de genoma completo (GWAS) de los niveles de esteroles de plantas (PPS) en plasma, una medida sustituta de la absorción de colesterol del intestino.[17] Se ha identificado un posible locus de susceptibilidad para la esquizofrenia y el trastorno bipolar con datos de genotipo de muestras de casos y controles.[18] Se ha encontrado una señal de enlace significativa en todo el genoma en un conjunto de datos de pacientes con esclerosis múltiple.[19] También se ha utilizado el mapeo de IBD para buscar mutaciones fundadoras en muestras de cáncer.[20]
IBD en genética de poblaciones
[editar]La detección de la selección natural en el genoma humano también es posible a través de segmentos de IBD detectados. La selección generalmente tenderá a aumentar el número de segmentos de IBD entre los individuos de una población. Al buscar regiones con exceso de IBD, se pueden identificar regiones en el genoma humano que han estado bajo una selección muy reciente.[21][22]
Además de eso, los segmentos de IBD pueden ser útiles para medir e identificar otras influencias en la estructura de la población.[6][23][24][25][26] Se ha demostrado que los segmentos de IBD se pueden usar con modelos adicionales para estimar el historial demográfico, incluidos los cuellos de botella y la mezcla. Utilizando modelos similares, se ha reconstruido la historia demográfica de los judíos Ashkenazi y los Maasai de Kenia.[27] Además, se investigó las diferencias en la ascendencia africana entre las poblaciones europea,[28] se utilizó la detección de IBD para cuantificar la ascendencia común de diferentes poblaciones europeas[29] y de manera similar trató de sacar conclusiones de la historia genética de las poblaciones en las Américas.[30] Se utilizó la estructura geográfica de los segmentos de IBD para estimar la dispersión dentro de Europa del Este durante los últimos siglos.[31] Utilizando los datos de 1000 genomas, se encontraron diferencias en el intercambio de IBD entre poblaciones africanas, asiáticas y europeas, así como en segmentos de IBD que se comparten con genomas antiguos como el Neanderthal o Denisova.[13]
Métodos y software
[editar]Programas para la detección de segmentos de IBD en individuos no relacionados:
- RAPID: Identidad ultrarrápida por detección de descenso en cohortes a escala de biobanco utilizando la transformación de madriguera posicional[32]
- Parente: identifica segmentos de IBD entre pares de individuos en datos de genotipo sin fase[33]
- BEAGLE/fastIBD: encuentra segmentos de IBD entre pares de individuos en datos SNP de todo el genoma[34]
- BEAGLE/RefinedIBD: encuentra segmentos de IBD en pares de individuos usando un método de hash y evalúa su significado a través de una razón de probabilidad[35]
- IBDseq: detecta segmentos de IBD por pares en la secuencia de datos[36]
- GERMLINE: descubre en segmentos de IBD de tiempo lineal en pares de individuos[5]
- DASH: se basa en segmentos de IBD por parejas para inferir grupos de individuos que probablemente compartan un solo haplotipo[15]
- PLINK: es un conjunto de herramientas para la asociación del genoma completo y análisis de ligamiento basados en la población que incluye un método para la detección de segmentos de IBD por parejas[6]
- Relacionar: estima la probabilidad de IBD entre pares de individuos en un locus específico utilizando SNP[3]
- MCMC_IBDfinder: se basa en la cadena de Markov Monte Carlo (MCMC) para encontrar segmentos de IBD en múltiples individuos[37]
- IBD-Groupon: detecta segmentos de IBD grupales basados en relaciones de IBD por pares[38]
- HapFABIA: identifica segmentos muy cortos de IBD caracterizados por variantes raras en grandes datos de secuenciación simultánea en múltiples individuos[13]
Véase también
[editar]- Mapeo de asociación
- Asociación genética
- Enlace genético
- Estudio de asociación del genoma completo
- Desequilibrio de ligamiento
- Genética de poblaciones
- Identidad por tipo
Referencias
[editar]- ↑ Browning, S. R. (2008). «Estimation of Pairwise Identity by Descent from Dense Genetic Marker Data in a Population Sample of Haplotypes». Genetics 178 (4): 2123-2132. PMC 2323802. PMID 18430938. doi:10.1534/genetics.107.084624.
- ↑ Thompson, E. A. (2008-5). «The IBD process along four chromosomes». Theoretical population biology 73 (3): 369-373. ISSN 0040-5809. PMC 2518088. PMID 18282591. doi:10.1016/j.tpb.2007.11.011.
- ↑ a b c Albrechtsen, A.; Sand Korneliussen, T.; Moltke, I.; Van Overseem Hansen, T.; Nielsen, F. C.; Nielsen, R. (2009). «Relatedness mapping and tracts of relatedness for genome-wide data in the presence of linkage disequilibrium». Genetic Epidemiology 33 (3): 266-274. PMID 19025785. doi:10.1002/gepi.20378.
- ↑ Browning, S. R.; Browning, B. L. (2010). «High-Resolution Detection of Identity by Descent in Unrelated Individuals». The American Journal of Human Genetics 86 (4): 526-539. PMC 2850444. PMID 20303063. doi:10.1016/j.ajhg.2010.02.021.
- ↑ a b Gusev, A.; Lowe, J. K.; Stoffel, M.; Daly, M. J.; Altshuler, D.; Breslow, J. L.; Friedman, J. M.; Pe'Er, I. (2008). «Whole population, genome-wide mapping of hidden relatedness». Genome Research 19 (2): 318-326. PMC 2652213. PMID 18971310. doi:10.1101/gr.081398.108.
- ↑ a b c d Purcell, S.; Neale, B.; Todd-Brown, K.; Thomas, L.; Ferreira, M. A. R.; Bender, D.; Maller, J.; Sklar, P. et al. (2007). «PLINK: A Tool Set for Whole-Genome Association and Population-Based Linkage Analyses». The American Journal of Human Genetics 81 (3): 559-575. PMC 1950838. PMID 17701901. doi:10.1086/519795.
- ↑ Ian W. Evett; Bruce S. Weir (January 1998). Interpreting DNA Evidence: Statistical Genetics for Forensic Scientists. Sinauer Associates, Incorporated. ISBN 978-0-87893-155-2.
- ↑ Leutenegger, A.; Prum, B.; Genin, E.; Verny, C.; Lemainque, A.; Clergetdarpoux, F.; Thompson, E. (2003). «Estimation of the Inbreeding Coefficient through Use of Genomic Data». The American Journal of Human Genetics 73 (3): 516-523. PMC 1180677. PMID 12900793. doi:10.1086/378207.
- ↑ Voight, B. F.; Pritchard, J. K. (2005). «Confounding from Cryptic Relatedness in Case-Control Association Studies». PLoS Genetics 1 (3): e32. PMC 1200427. PMID 16151517. doi:10.1371/journal.pgen.0010032.
- ↑ Kong, A.; Masson, G.; Frigge, M. L.; Gylfason, A.; Zusmanovich, P.; Thorleifsson, G.; Olason, P. I.; Ingason, A. et al. (2008). «Detection of sharing by descent, long-range phasing and haplotype imputation». Nature Genetics 40 (9): 1068-1075. PMC 4540081. PMID 19165921. doi:10.1038/ng.216.
- ↑ a b Gusev, A.; Shah, M. J.; Kenny, E. E.; Ramachandran, A.; Lowe, J. K.; Salit, J.; Lee, C. C.; Levandowsky, E. C. et al. (2011). «Low-Pass Genome-Wide Sequencing and Variant Inference Using Identity-by-Descent in an Isolated Human Population». Genetics 190 (2): 679-689. PMC 3276614. PMID 22135348. doi:10.1534/genetics.111.134874.
- ↑ Browning, B. L.; Browning, S. R. (2009). «A Unified Approach to Genotype Imputation and Haplotype-Phase Inference for Large Data Sets of Trios and Unrelated Individuals». The American Journal of Human Genetics 84 (2): 210-223. PMC 2668004. PMID 19200528. doi:10.1016/j.ajhg.2009.01.005.
- ↑ a b c Hochreiter, S. (2013). «HapFABIA: Identification of very short segments of identity by descent characterized by rare variants in large sequencing data». Nucleic Acids Research 41 (22): e202. PMC 3905877. PMID 24174545. doi:10.1093/nar/gkt1013.
- ↑ a b Browning, S. R.; Thompson, E. A. (2012). «Detecting Rare Variant Associations by Identity-by-Descent Mapping in Case-Control Studies». Genetics 190 (4): 1521-1531. PMC 3316661. PMID 22267498. doi:10.1534/genetics.111.136937.
- ↑ a b Gusev, A.; Kenny, E. E.; Lowe, J. K.; Salit, J.; Saxena, R.; Kathiresan, S.; Altshuler, D. M.; Friedman, J. M. et al. (2011). «DASH: A Method for Identical-by-Descent Haplotype Mapping Uncovers Association with Recent Variation». The American Journal of Human Genetics 88 (6): 706-717. PMC 3113343. PMID 21620352. doi:10.1016/j.ajhg.2011.04.023.
- ↑ Houwen, R. H. J.; Baharloo, S.; Blankenship, K.; Raeymaekers, P.; Juyn, J.; Sandkuijl, L. A.; Freimer, N. B. (1994). «Genome screening by searching for shared segments: Mapping a gene for benign recurrent intrahepatic cholestasis». Nature Genetics 8 (4): 380-386. PMID 7894490. doi:10.1038/ng1294-380.
- ↑ Kenny, E. E.; Gusev, A.; Riegel, K.; Lutjohann, D.; Lowe, J. K.; Salit, J.; Maller, J. B.; Stoffel, M. et al. (2009). «Systematic haplotype analysis resolves a complex plasma plant sterol locus on the Micronesian Island of Kosrae». Proceedings of the National Academy of Sciences 106 (33): 13886-13891. PMC 2728990. PMID 19667188. doi:10.1073/pnas.0907336106.
- ↑ Francks, C.; Tozzi, F.; Farmer, A.; Vincent, J. B.; Rujescu, D.; St Clair, D.; Muglia, P. (2008). «Population-based linkage analysis of schizophrenia and bipolar case–control cohorts identifies a potential susceptibility locus on 19q13». Molecular Psychiatry 15 (3): 319-325. PMID 18794890. doi:10.1038/mp.2008.100.
- ↑ Lin, R.; Charlesworth, J.; Stankovich, J.; Perreau, V. M.; Brown, M. A.; Anzgene, B. V.; Taylor, B. V. (2013). «Identity-by-Descent Mapping to Detect Rare Variants Conferring Susceptibility to Multiple Sclerosis». En Toland, Amanda Ewart, ed. PLoS ONE 8 (3): e56379. PMC 3589405. PMID 23472070. doi:10.1371/journal.pone.0056379.
- ↑ Letouzé, E.; Sow, A.; Petel, F.; Rosati, R.; Figueiredo, B. C.; Burnichon, N.; Gimenez-Roqueplo, A. P.; Lalli, E. et al. (2012). «Identity by Descent Mapping of Founder Mutations in Cancer Using High-Resolution Tumor SNP Data». En Mailund, Thomas, ed. PLoS ONE 7 (5): e35897. PMC 3342326. PMID 22567117. doi:10.1371/journal.pone.0035897.
- ↑ Albrechtsen, A.; Moltke, I.; Nielsen, R. (2010). «Natural Selection and the Distribution of Identity-by-Descent in the Human Genome». Genetics 186 (1): 295-308. PMC 2940294. PMID 20592267. doi:10.1534/genetics.110.113977.
- ↑ Han, L.; Abney, M. (2011). «Identity by descent estimation with dense genome-wide genotype data». Genetic Epidemiology 35 (6): 557-567. PMC 3587128. PMID 21769932. doi:10.1002/gepi.20606.
- ↑ Cockerham, C. C.; Weir, B. S. (1983). «Variance of actual inbreeding». Theoretical Population Biology 23 (1): 85-109. PMID 6857551. doi:10.1016/0040-5809(83)90006-0.
- ↑ Gusev, A.; Palamara, P. F.; Aponte, G.; Zhuang, Z.; Darvasi, A.; Gregersen, P.; Pe'Er, I. (2011). «The Architecture of Long-Range Haplotypes Shared within and across Populations». Molecular Biology and Evolution 29 (2): 473-486. PMC 3350316. PMID 21984068. doi:10.1093/molbev/msr133.
- ↑ Palamara, P. F.; Lencz, T.; Darvasi, A.; Pe’Er, I. (2012). «Length Distributions of Identity by Descent Reveal Fine-Scale Demographic History». The American Journal of Human Genetics 91 (5): 809-822. PMC 3487132. PMID 23103233. doi:10.1016/j.ajhg.2012.08.030.
- ↑ Palamara, P. F.; Pe'Er, I. (2013). «Inference of historical migration rates via haplotype sharing». Bioinformatics 29 (13): i180-i188. PMC 3694674. PMID 23812983. doi:10.1093/bioinformatics/btt239.
- ↑ Carmi, S.; Palamara, P. F.; Vacic, V.; Lencz, T.; Darvasi, A.; Pe'Er, I. (2012). «The Variance of Identity-by-Descent Sharing in the Wright-Fisher Model». Genetics 193 (3): 911-928. PMC 3584006. PMID 23267057. doi:10.1534/genetics.112.147215.
- ↑ Botigue, L. R.; Henn, B. M.; Gravel, S.; Maples, B. K.; Gignoux, C. R.; Corona, E.; Atzmon, G.; Burns, E. et al. (2013). «Gene flow from North Africa contributes to differential human genetic diversity in southern Europe». Proceedings of the National Academy of Sciences 110 (29): 11791-11796. PMC 3718088. PMID 23733930. doi:10.1073/pnas.1306223110.
- ↑ Ralph, P.; Coop, G. (2013). «The Geography of Recent Genetic Ancestry across Europe». En Tyler-Smith, Chris, ed. PLoS Biology 11 (5): e1001555. PMC 3646727. PMID 23667324. doi:10.1371/journal.pbio.1001555.
- ↑ Gravel, S.; Zakharia, F.; Moreno-Estrada, A.; Byrnes, J. K.; Muzzio, M.; Rodriguez-Flores, J. L.; Kenny, E. E.; Gignoux, C. R. et al. (2013). «Reconstructing Native American Migrations from Whole-Genome and Whole-Exome Data». En Williams, Scott M, ed. PLoS Genetics 9 (12): e1004023. PMC 3873240. PMID 24385924. doi:10.1371/journal.pgen.1004023.
- ↑ Ringbauer, Harald; Coop, Graham; Barton, Nicholas H. (1 de marzo de 2017). «Inferring Recent Demography from Isolation by Distance of Long Shared Sequence Blocks». Genetics (en inglés) 205 (3): 1335-1351. ISSN 0016-6731. PMC 5340342. PMID 28108588. doi:10.1534/genetics.116.196220.
- ↑ Naseri A, Liu X, Zhang S, Zhi D. Ultra-fast Identity by Descent Detection in Biobank-Scale Cohorts using Positional Burrows-Wheeler Transform BioRxiv 2017.
- ↑ Rodriguez JM, Batzoglou S, Bercovici S. An accurate method for inferring relatedness in large datasets of unphased genotypes via an embedded likelihood-ratio test. RECOMB 2013, LNBI 7821:212-229.
- ↑ Browning, B. L.; Browning, S. R. (2011). «A Fast, Powerful Method for Detecting Identity by Descent». The American Journal of Human Genetics 88 (2): 173-182. PMC 3035716. PMID 21310274. doi:10.1016/j.ajhg.2011.01.010.
- ↑ Browning, B. L.; Browning, S. R. (2013). «Improving the Accuracy and Efficiency of Identity-by-Descent Detection in Population Data». Genetics 194 (2): 459-471. PMC 3664855. PMID 23535385. doi:10.1534/genetics.113.150029.
- ↑ Browning, B. L.; Browning, S. R. (2013). «Detecting Identity by Descent and Estimating Genotype Error Rates in Sequence Data». The American Journal of Human Genetics 93 (5): 840-851. PMC 3824133. PMID 24207118. doi:10.1016/j.ajhg.2013.09.014.
- ↑ Moltke, I.; Albrechtsen, A.; Hansen, T. V. O.; Nielsen, F. C.; Nielsen, R. (2011). «A method for detecting IBD regions simultaneously in multiple individuals--with applications to disease genetics». Genome Research 21 (7): 1168-1180. PMC 3129259. PMID 21493780. doi:10.1101/gr.115360.110.
- ↑ He, D. (2013). «IBD-Groupon: An efficient method for detecting group-wise identity-by-descent regions simultaneously in multiple individuals based on pairwise IBD relationships». Bioinformatics 29 (13): i162-i170. PMC 3694672. PMID 23812980. doi:10.1093/bioinformatics/btt237.