Michael Cieslak1, Melanie Pruvost1,2*, Norbert Benecke2, Michael Hofreiter3,4, Arturo Morales5, Monika Reissmann6 y Arne Ludwig1*
Los caballos domésticos representan una paradoja genética: aunque disponen del mayor número de líneas maternas (mtDNA) de todas las especies domésticas, sus líneas paternas son extremadamente homogéneas en el cromosoma Y. Para acometer la enorme variedad de mtDNA y el origen e historia de las líneas maternas en el caballo doméstico, en este estudio se analizaron 1961 secuencias parciales del bucle de desplazamiento de 207 remanentes antiguos y de 1754 caballos modernos de diversas razas y procedencias. El alcance del grupo de muestras va desde Alaska y el nordeste de Siberia hasta la península ibérica y desde el Pleistoceno superior hasta los tiempos actuales. Se encontraron 87 haplotipos antiguos, de los cuales 56 se observaron también en caballos domésticos, aunque hasta el momento solo se ha confirmado la supervivencia de 39 haplotipos.
Resumen
Los caballos domésticos representan una paradoja genética: aunque disponen del mayor número de líneas maternas (mtDNA) de todas las especies domésticas, sus líneas paternas son extremadamente homogéneas en el cromosoma Y. Para acometer su enorme variedad de mtDNA y el origen e historia de las líneas maternas en el caballo doméstico, hemos analizado 1961 secuencias parciales del bucle de desplazamiento de 207 remanentes antiguos y de 1754 caballos modernos. El alcance del grupo de muestras va desde Alaska y el nordeste de Siberia hasta la península ibérica y desde el Pleistoceno superior hasta los tiempos actuales. Encontramos una población panmíctica de caballos del Pleistoceno superior desde Alaska hasta los Pirineos. Posteriormente, durante el Holoceno temprano y la Edad de Cobre, se señalaron unas subpoblaciones más o menos separadas sobre la región de la estepa Euroasiática e Iberia. Nuestros datos sugerían la domesticación e introgresión múltiple de yeguas, especialmente durante la Edad de Hierro. Aunque todas las regiones Euroasiáticas contribuyeron al pedigrí genético de las razas modernas, la mayoría de los haplotipos tuvieron sus raíces en la Europa del Este y en Siberia. Encontramos 87 haplotipos antiguos (Pleistoceno a Edad Media); 56 de estos haplotipos también se observaron en caballos domésticos, aunque hasta ahora solo se ha confirmado la supervivencia de 39 haplotipos.
Artículo Original:
Origin and History of Mitochondrial DNA Lineages in Domestic Horses
Editor: Manfred Kayser, Erasmus University Medical Center, The Netherlands
Recibido el 18 de agosto de 2010. Aceptado el 8 de noviembre de 2010. Publicado el 20 de diciembre de 2010 en Plos One
Derechos de autor: © 2010 Cieslak et al. Este es un artículo de acceso abierto, distribuido de acuerdo a los términos de Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que sea reconocido el autor original y la fuente.
Financiación: este trabajo fue financiado mediante becas concedidas por la Deutsche Forschungsgemeinschaft (LU852-7/2-3) y por el Instituto Max Planck. Los patrocinadores no participaron en el diseño del estudio, recolección de datos y análisis, en la decisión sobre la publicación o en la redacción del manuscrito.
Conflicto de intereses: los autores declaran no tener conflicto de intereses.
*E-mail: ludwig@izw-berlin.de (AL); melpruvost@googlemail.com (MP)
Citación: Cieslak M, Pruvost M, Benecke N, Hofreiter M, Morales A, et al. (2010) Origin and History of Mitochondrial DNA Lineages in Domestic Horses 1. Leibniz-Institut für Zoo- und Wildtierforschung, Genética Evolutiva, Berlín, Alemania, 2 Deutsches Archäologisches Institut, Berlín, Alemania, 3 Max-Planck-Institut für evolutionäre Anthropologie, Leipzig, Alemania, 4 Department of Biology, The University of York, Heslington, York, Reino Unido, 5 Laboratorio de Arqueozoología, Universidad Autónoma Madrid, Madrid, España, 6 Department Züchtungsbiologie und molekulare Genetik, Humboldt Universität zu Berlin, Berlín, Alemania.
Introducción
La domesticación de animales y plantas fue una innovación clave al inicio de las sociedades urbanas modernas. Descifrar el origen espacial y temporal de las especies domésticas parece primordial para entender los cambios culturales de la civilización y por ello ha atraído un interés científico y público considerable(1,2). Entre los animales domésticos primarios, dos especies de gran importancia difieren de todas las demás por haber sido criadas no solo como fuentes de alimento: el perro y el caballo. Mientras el perro, aunque susceptible de discusión, podría ser el primer animal domesticado(3,4) (normalmente usado para la caza, guarda y para las acciones militares), los caballos obtuvieron un papel destacado como animales de transporte y guerra, y así cambiaron las sociedades a escala continental. Como remarcaba acertadamente M. Levine: «Antes del desarrollo de las armas de fuego, el caballo era elemental para la guerra y antes de la invención de la máquina de vapor, era la forma de transporte más veloz y fiable»(5). A pesar del papel central que el caballo ha jugado en el desarrollo de las sociedades humanas, el origen y la historia de las razas modernas siguen sin aclararse en varios aspectos. Por ejemplo, a veces es difícil diferenciar entre los restos de caballos primitivos y domésticos. Al contrario que en perros o cerdos, la plasticidad del esqueleto del género Equus es casi nula. Por ello, especies tan diferentes como las cebras y los asnos son casi indistinguibles en base a su osamenta. La estabilidad estructural explica el problema que encuentran los paleontólogos cuando tratan de entender la historia evolutiva de los caballos(6).
Para complicar todavía más la materia, la domesticación del caballo no se tradujo en cambios relevantes de tamaño corporal, como sí fue el caso de los demás animales domésticos. La falta de criterios diagnósticos anatómicos y biométricos dificulta la asignación de los restos arqueozoológicos(5). Por este motivo, los analistas de la fauna recibieron de buen grado la introducción del análisis molecular hace unos años.
Debido al número elevado de copias de mtDNA en las células, a su evolución molecular relativamente rápida y a su herencia estrictamente materna, a lo largo de las dos últimas décadas el mtDNA se ha convertido en una herramienta valiosa para los estudios filogenéticos y filogeográficos mediante el análisis de DNA antiguo. No obstante, tanto la escasez de secuencias antiguas de caballos predomésticos y domésticos tempranos, como la ausencia de una estructura filogeográfica en las razas modernas, han obstaculizado una conclusión firme hasta el momento. Estudios previos han demostrado la dificultad de restringir las líneas mitocondriales a un área geográfica determinada o a una raza específica. Para mayor confusión, el ancestro salvaje del caballo doméstico parece estar extinto, ya que el estado agriotípico de los pocos caballos Przewalski se encuentra en debate. Además, y en contraste con muchas otras especies domésticas(8-11), se ha descubierto una variabilidad impresionante en la región de control mitocondrial de los caballos modernos(12-15), mientras que esta especie exhibe una diversidad de nucleótidos extremadamente baja en el cromosoma Y. Recientemente se informó de la primera descripción de dos haplotipos diferentes de cromosoma Y en razas de caballo indígenas chinas(16). Por tanto, se ha asumido un sesgo en función del sexo para los progenitores del caballo doméstico. Es probable que solo unos pocos sementales, pero muchas yeguas, fueron domesticados(17).
Aunque varios estudios recientes enfocan la variabilidad del mtDNA del caballo en regiones geográficas y periodos delimitados(15,18), algunas cuestiones importantes siguen sin resolverse, p. ej. si la gran variabilidad de mtDNA también estuvo presente en la población predoméstica y cómo se distribuía esta variación geográficamente. En el presente estudio intentamos iluminar estas cuestiones al combinar una serie amplia de secuencias de mtDNA de caballos predomésticos, domésticos tempranos y modernos.

Figura 1. Análisis de conexiones de red (median joining networks) basado en 247pb de bucle de desplazamiento mitocondrial de 207 muestras antiguas (en color) y de 601 secuencias modernas de razas primitivas (blanco). Se encontraron ochenta y siete haplotipos entre las muestras antiguas; 103 haplotipos diferentes entre las razas primitivas y 36 haplotipos compartidos (tabla S5). La figura 1A muestra los haplotipos denominados según la nomenclatura antigua(13-14), mientras la figura 1B muestra la nueva nomenclatura (tabla S4). Los haplogrupos se señalan por un código de color.
Resultados
Haplogrupos y haplotipos
Hemos secuenciado con éxito el DNA de 85 de las 157 muestras antiguas, con una tasa de éxito del 54% (tabla S1), esto es, muestras procedentes de: nordeste siberiano 6, este asiático 6, oeste y sur siberiano 24, Armenia 6 y Europa 22 (incluida la península ibérica), así como 2 muestras de Asia Menor y 19 restos ibéricos. Todas las secuencias se depositaron en GenBank (vea los números de acceso en la tabla S2). En un esfuerzo por mejorar la información genética y la resolución de la filogeografía del caballo, hemos amplificado el área completa de estudio (bucle de desplazamiento) del DNA mitocondrial (722 pb de 15.468 a 16.190 np). Pero al contrario de otras especies domésticas(19), hemos aclarado que la longitud de la secuencia no influye sobre la resolución filogénica en el caballo y hemos decidido centrar nuestros análisis en la región HVR1, incluyendo la mayor parte de las secuencias de GenBank (247 pb de 15.494 a 15.740 np). Tras la incorporación a nuestro conjunto de datos (85 secuencias) de 122 secuencias antiguas publicadas con anterioridad, el alineamiento de las 207 secuencias antiguas produjeron 78 lugares variables (4 de los cuales son indel), y se definieron 113 haplotipos. Al usar todas las secuencias (1754 caballos modernos y 207 muestras antiguas), hemos identificado 4 puntos calientes de fuerte mutación; 3 de ellos fueron descritos en estudios anteriores(13,18) en las posiciones de los nucleótidos 15585, 15597 y 15650 y un nuevo punto caliente en posición 15604. Estas posiciones no se incluyeron en los cálculos filogenéticos. Además, se redujo el valor de unos pocos puntos calientes mutuacionales de forma individual (tabla S3). Una vez eliminados del conjunto de datos estos puntos calientes mutuacionales, el número de haplotipos bajó a 87. Así que introdujimos una nueva nomenclatura para los haplotipos/haplogrupos (figura 1A, B; tabla S4).
Sorprendentemente, la inclusión de todas las secuencias disponibles para el caballo moderno (n=1754) y para las muestras antiguas (n=207) llevó a una red desestructurada y no resuelta. Por este motivo, se recalculó la red (figura 1B) centrada en 599 secuencias de 46 razas primitivas, dos haplotipos przewalski y las 207 muestras antiguas. Dividimos las secuencias en 19 haplogrupos de la A a la K y de X1 a X7, en base a la estructura de la red (figura 1B).
Origen geográfico de las líneas mitocondriales
La tabla 1 y la figura 2 dan una visión general del origen geográfico de las líneas mitocondriales.
Norte y este de Siberia. Solo 2 de las 12 líneas del Pleistoceno superior identificadas en 12 individuos siguen presentes en las razas modernas. Entre estas, el haplotipo basal A se registra desde el Pleistoceno superior hasta los tiempos medievales en varias regiones eurasiáticas, mientras que K1 solo se encontró en los tipos modernos. Solo X8a se encontró tanto en Alaska como en Siberia en el Pleistoceno superior, aunque X8a se encuentre extinto actualmente. X2d solo se encontró en los caballos salvajes de la Edad de Hierro, pero jamás en los caballos domésticos, aunque el haplogrupo X2 es uno de los haplogrupos más comunes en las razas modernas.
Asia Oriental (China, Mongolia y Corea). No había disponibilidad de caballos predomésticos de esta región. Se encontró el Haplotipo D3a cinco veces en las muestras de la Edad de Bronce. El Haplotipo K3 apareció en China por primera vez durante la Edad de Bronce. Siete de las 20 líneas asiáticas orientales de la Edad de Hierro (n=36) solo se observaron en esta región, mientras que 13 líneas también estuvieron presentes en otras regiones y periodos.
Oeste y sur de Siberia, Kazajistán. Como en el caso de Asia Oriental, no había disponibilidad de datos de tiempos previos a la domesticación en esta región. X3 apareció primero en Siberia occidental durante la Edad de Cobre, y después, en China durante la Edad de Bronce. X5 se encontraba confinado a esta región. Las ocho líneas restantes de la Edad de Bronce también se encontraron en otras regiones. Seis de las 18 líneas de la Edad de Hierro (n=26) solo se encontraron en esta región.
Europa y Asia Menor (al oeste de los Montes Urales y del Mar Caspio hasta los Pirineos, incluyendo Armenia). Nos beneficiamos del gran número de muestras disponibles para esta región, fechadas entre el Pleistoceno superior hasta los tiempos medievales. Curiosamente, encontramos el haplotipo B1 antes y después de la domesticación en esta región. Es más, encontramos que 4 de 7 líneas que estuvieron presentes en el caballo del Pleistoceno superior (muestra n=9), 6 de las 8 líneas predomésticas (n=12), 4 de las 11 líneas de la Edad de Bronce (n=12), 5 de las 8 líneas de la Edad de Hierro (n=8) y 9 de las 18 líneas medievales (n=27) se encontraban confinadas a esta región. Además, 3 líneas del Pleistoceno superior, 2 líneas predomésticas, 8 líneas de la Edad de Bronce, 3 líneas de la Edad de Hierro y 9 líneas medievales, también se encontraron en otras regiones y periodos.
Península ibérica. Tres líneas predomésticas (B, H1, J) (n=13) se encontraban confinadas a esta región. Estuvieron presentes durante la Edad de Cobre y la Edad de Bronce temprana. El haplotipo B también se encontró en los caballos de la Edad de Hierro. El haplogrupo dominante durante la Edad de Cobre y la Edad de Bronce fue el H1. Sin embargo, los tres haplotipos de la Edad de Cobre y de la Edad de Bronce, A, D2 y X4a, también se encontraron en otras regiones. Igualmente, las dos lineas medievales (X2, X2b) se encontraron por toda Eurasia, probablemente debido al intercambio de animales domésticos.
Razas de caballo primitivas (tabla S5). En la Figura 3 se muestra la distribución de los haplogrupos de las razas primitivas en Eurasia. Encontramos 39 de las 87 líneas antiguas en nuestro conjunto de muestras de razas modernas (tabla S6). Once de estos 39 haplotipos eran líneas que estuvieron confinadas a una sola raza primitiva (B/árabe; D2d/cheju; G1/akhal teke; H/garrano; H1/marismeño; H1a/lusitano; K2b1/purasangre siciliano oriental; K3b/yakut; X1/pottoka; X2a/debao; X3c/lusitano; X5/fulani). Los haplotipos D, D2, E, K2 y X7a son raros o inexistentes en Europa y en Asia Menor; sin embargo son más bien comunes en la Asia continental (figura 3). De forma similar, el haplotipo A no estaba presente en el noroeste europeo o en la península ibérica. Es notorio que el haplogrupo K3 está presente principalmente en Mongolia, Yakutia, Corea, África y Hungría. Contrariamente, el haplotipo D3 y F se encuentra principalmente en Europa /Asia Menor, mientras que B1 es particularmente común en las regiones nórdicas de Europa y el haplotipo I aparece especialmente en la península ibérica, África y Asia Central. K2b, X2, X2b, X3 y X3c1 son haplotipos frecuentes y comunes y se encuentran más o menos homogéneamente distribuidos por toda Eurasia.


Figura 2. Origen de líneas mitocondriales del caballo moderno. Solo se muestran líneas mitocondriales que estuvieron/están presentes en el caballo doméstico. Los haplotipos en cursiva/subrayado hasta el momento solo se encontraron en restos domésticos tempranos. La zona rayada indica el periodo postulado de la domesticación del caballo.
La presencia de haplotipos antiguos en el caballo moderno
Treinta y nueve de los 87 haplotipos antiguos también se encontraron en el caballo moderno (tabla S5). Hoy en día, X2 es el haplotipo antiguo más común en el caballo moderno. Se encontró X2 en 326 ocasiones de las 1754 secuencias de caballos modernos. El segundo haplotipo más común, D3, se encontró 133 veces, seguido por X2b (103), X3cl (98), I (85), F (80), B1 (79) y A (75). Las siguientes 48 líneas se extinguieron: B1a, B1b, B2, B3, C, C1, D1, D2a, D2b, D2c, D2f, D3a, E1, G, G2, Gx4a, H1b, I2a, J, K2b2, K3a1, X1, X2d, X2c, X3a, X3b, X3c1a, X3c2, X3d, X4, X5a, X6, X6a, X6b, X6c, X7, X7a2, X8, X8a, X9–12, X13, X14–15, X16, X17; los haplotipos en cursiva estuvieron presentes en las muestras de caballo doméstico temprano, pero están extintos en los actuales caballos modernos.
Variabilidad genética
La diversidad de nucleótidos variaba entre 0,034 (Europa 1000 a. C.-600 d. C.) y 0,005 (Iberia 5500-3000 a. C.), mientras que la diversidad de haplotipos variaba entre 1.00 (oeste de Siberia 3000-1000 a. C.; Europa 1000 a. C-600 d. C) y 0,60 (Iberia 5500-3000 a. C).
En general, los conjuntos ibéricos mostraban los valores más bajos de diversidad, tanto de nucleótidos como de haplotipos (tabla 2). La media en diversidad de nucleótidos del caballo salvaje (muestras de Pleistoceno superior y predomésticos) era un 25% inferior a la media del caballo doméstico (no se encontraba incluida la península ibérica; para detalles, vea la tabla 2). Una subdivisión en las tres siguientes subpoblaciones predomésticas (tabla S8, tabla S9) se apoyaba en sus valores Fst con un rango entre 0,4 y 0,1: caballos de Alaska, caballos ibéricos y caballos de las estepas euroasiáticas. Aun así, algunos haplotipos eran compartidos, lo cual señala un ancestro común de una población panmíctica del Pleistoceno superior o, al menos, un movimiento de genes sustancial entre las regiones. Por otra parte, los valores Fst y la composición de haplotipos no apoyaba una diferenciación entre los caballos desde el Pleistoceno superior y la Edad de Cobre en Europa, como se ha descrito recientemente en base a cambios en el color de su capa(20), aunque, debido a una escasez de muestras, no se pudo profundizar en esta cuestión. Sin embargo, algunas líneas (p. ej. E, E1) aparecieron posteriormente, durante la Edad de Bronce y la Edad de Hierro; otras aumentaron en frecuencia (p. ej. X2, X3, D3) y otras se extinguieron al poco de las glaciaciones (p. ej. C, J, X8)(figura 5).

Figura 3. Distribución de haplogrupos de las razas primitivas euroasiáticas (n=601 animales; tabla S13). 1: asturcón (n = 12), cartujano (n = 8), garrano (n = 5), losino (n = 10), lusitano (n = 10), marismeño (n = 12), merens (n = 10), pottoka (n = 13), sorraia (n = 27); 2: duelmener (n= 10), exmoor (n = 17), gotland (n = 3), islandés (n = 6), fjord noruego (n = 11), shetland (n = 18), welsh (n = 1); 3: árabe (n = 99), bereber (n = 37), fulani (n = 9), egipcio (n = 7); 4: hucul (n = 11), koonik (n = 5); 5: anatolio (n = 17), giara (n = 2), mallorquín (n = 2), pindos (n = 7), sanfrantellano (n = 10), siciliano oriental (n = 1), siciliano ind. (n = 13), skyros (n = 5); 6: akhal teke (n = 37), caspio (n = 13), vyatskaya (n = 18); 7: tuva (n = 10); 8: mongol (n = 20), przewalski (n = 2); 9: debao (n = 24), montañas guan (n = 10), guanzhong (n = 2), wenshan (n = 2), xinehe (n = 1), dali (n = 6), yunnan (n = 1), tibetano (n = 16); 10: cheju (n = 25), taishu (n = 2); 11: yakut (n = 15).
Discusión
Un estudio reciente situó la domesticación del caballo en el norte de Kazajistán alrededor de 3500 a. C.(21) Según demuestran nuestros datos, una gran parte de la diversidad genética ya se encontraba presente en caballos predomésticos previos a esta época. Bajo circunstancias normales, el cuello de botella causado por la domesticación debería haber reducido la variación genética de forma significativa. Según indican nuestros datos y otros estudios previos(12,13,20), esto solo ha ocurrido parcialmente en el caballo. En total, se encontraron 87 haplotipos en los restos arqueológicos (Pleistoceno a tiempos medievales). Un 32% (esto es, 9 de 28 haplotipos) de las líneas predomésticas (Pleistoceno a Edad de Cobre) ha sobrevivido en la reserva genética del caballo doméstico hasta nuestros días. Siete de estas líneas predomésticas, también se encontraron en el caballo doméstico de la Edad de Bronce y de la Edad de Hierro y los otros dos se registraron en muestras de la Edad Media. Considerando el total de los 87 haplotipos antiguos, 29 haplotipos se encontraron en muestras de la Edad de Bronce, 47 haplotpipos en restos de la Edad de Hierro y 21 haplotipos en huesos medievales. Nuestros datos son probatorios de múltiples introgresiones o, alternativamente, de una segunda ola de domesticación durante la Edad de Hierro, dado que se descubrieron 22 haplotipos nuevos en la reserva genética de los caballos domésticos de este periodo. Además, diez haplotipos hacen aparición durante la época medieval. En este contexto queremos expresar nuestra cautela respecto al hecho de que, dada la enorme variedad de mtDNA en los caballos, se necesitan más muestras antiguas para determinar la primera aparición de los haplotipos en el espacio y en el tiempo. Como es el caso de todos los estudios sobre DNA antiguo, tenemos un sesgo de muestra que favorece las secuencias modernas. Las bases de datos públicas contienen 274 haplotipos archivados de caballos modernos (19 de julio de 2010). Hasta ahora, parece que solo el 45% de la variación de mtDNA encontrada en nuestro estudio ha sobrevivido en el caballo doméstico moderno (esto es, 39 de los 87 haplotipos), y en términos de muestras domésticas entre la Edad de Bronce y hoy, el 30% (17 de 56) de las líneas maternas se ha perdido durante los 5.500 años de cría caballar. Esta sigue siendo una gran variación genética para un animal doméstico. Los motivos de la presencia de tan gran variación genética en el caballo doméstico moderno pueden incluir uno o una combinación de los siguientes:
a) orígenes múltiples; b) un número extremadamente alto de progenitores femeninos; c) introgresión a gran escala de líneas locales en las cabezas domésticas.
En nuestra opinión, es probable que las tres razones contribuyeran equitativamente en la situación actual. Resumiendo, uno de los principales resultados de este estudio es que la enorme diversidad del mtDNA del caballo no es consecuencia de la cría caballar, sino una faceta que ya se encontraba presente en las poblaciones de caballos salvajes.
Nuestro catálogo de datos presenta un sesgo de muestras predomésticas de Asia. Por ello, recomendamos cautela a la hora de proponer centros posibles de domesticación. A pesar de ello, nuestros resultados, que postulan por la introgresión local de yeguas salvajes y los episodios múltiples de domesticación en Europa y Asia Oriental, no son especulativos. Ambas regiones contribuyeron de forma significativa en la determinación del catálogo genético de las razas modernas durante las Edades de Bronce y de Hierro. Asimismo, la distribución entre pares de frecuencias (mismatch distribution) de los caballos domésticos tempranos europeos y siberianos, demostraron un cuello de botella 1500 años después del origen postulado del caballo doméstico en el norte de Kazajistán alrededor de 3500 a. C(21). Además, nuestros datos sobre los caballos de la Edad de Bronce y la Edad de Hierro señalan la domesticación local y/o introgresión de haplotipos de Asia Oriental. La evolución de estos haplitipos particulares del este asiático fue intensificada por el aislamiento de los caballos salvajes mongoles y chinos debido al Macizo de Altai y los desiertos de Taklamakán y Gobi. Estas barreras geográficas consumaron su segregación de sus primos de la estepa euroasiática.
Nuestros datos han demostrado la existencia de una población panmíctica de caballos desde las llanuras siberianas hasta los Pirineos durante el Pleistoceno superior. La amplia distribución de los haplogrupos B1 (Europa, nordeste de Siberia y Alaska), X8 (noreste de Siberia y Alaska) y X3 (noreste de Siberia e Irlanda) así como la del haplotipo A (Alemania, Ukrania y noreste de Siberia) lleva a apoyar la idea de un movimiento genético amplio a través de Eurasia. Más tarde, en el Holoceno temprano y durante la Edad de Cobre, encontramos pruebas de una subdivisión genética de los caballos ibéricos y de las estepas euroasiáticas.
En Europa encontramos tres líneas predomésticas (de las 8 líneas identificadas) que han sobrevivido en el caballo moderno (tabla S6). En cuanto a dos de ellas, B1 se presenta con frecuencia en las razas modernas europeas, mientras que G1 actualmente es rara. En contraste, el haplotipo E y el haplogrupo K3 tuvieron sus raíces en Asia Oriental y ambos son comunes en las razas primitivas de Asia Oriental hoy en día. Separados del resto de Europa por los Pirineos, la historia de los caballos ibéricos se debe considerar de forma independiente. Los Pirineos de hecho cortaron la península ibérica del resto de Eurasia y la convirtieron en un refugio glacial. De acuerdo a nuestros datos, los caballos ibéricos predomésticos y de la Edad de Cobre se encontraban aislados geográficamente. Resulta interesante observar que los haplotipos del grupo H1, que dominaban las líneas ibéricas antiguas durante los tiempos predomésticos y domésticos tempranos, aún se presentan ocasionalmente en las razas ibéricas (p. ej. marismeño, lusitano, caballo de corro) y también en las razas sudamericanas (criollo argentino, paso fino de Puerto Rico) hoy en día(18). También es notable que el haplotipo B, ibérico antiguo y singular, se encuentre hoy día en el caballo percherón (Francia), el árabe y el wielkopolski (Polonia). Esta presencia en el caballo percherón podría indicar un comercio entre las gentes ibéricas y francesas en tiempos antiguos, mientras que la presencia en la raza árabe puede ser una reliquia de la ocupación islámica del sur ibérico. El caballo wielkopolski es una raza que también contiene genes árabes. Por tanto, coincidimos con estudios anteriores(18,20) sobre la falta de pruebas sobre un proceso de domesticación independiente en Iberia, al menos no a una escala significativa, y en vez de ello aportamos pruebas de peso sobre una introgresión de yeguas locales. Hoy en día, todas las razas ibéricas están dominadas por haplotipos de los haplogrupos X3 y X2.
En consideración de nuestros datos sobre los caballos de la Edad de Bronce, parece que los caballos domésticos se extendieron pronto tras su domesticación inicial. La monta del caballo fue probablemente el catalizador de una extensión tan rápida, dando lugar a un proceso sin precedentes de movimiento genético, hace 5500 años. Tras 5500 años de cría caballar, el mundo se encuentra poblado por 58 millones de caballos domésticos (División de Estadística de la FAO 2010 para 2008; http:// faostat.fao.org). Es imposible de determinar el número preciso de razas de caballo, pero se encuentra entre 600 y 1000 razas. Algunas de estas son razas primitivas conocidas desde la antigüedad (p. ej. akhal teké, árabe o bereber); algunas fueron iniciadas hace unas décadas (p. ej. lewitzer, nederlands mini paarden, pony de las Américas, caballo de las Montañas Rocosas). De todos modos, muchas de las llamadas «razas modernas» tienen sus raíces al final del siglo dieciocho o posteriormente(22). Aunque a veces se utiliza la endogamia en la cría animal para mejorar la raza, la formación de las razas a menudo es un proceso abierto. Se ha informado sobre los cruces entre razas diferentes o la introgresión de especies foráneas, así como la introgresión de caballos salvajes. Por este motivo, la diversidad en las líneas mitocondriales ha cambiado a través del tiempo por cría o hibridación e introgresión. Por lo tanto, una raza no tiene por qué seguir una historia clara y es raro que se encuentre aislada genéticamente del resto de la población. Todos estos procesos dejan su huella en el pedigrí genético del caballo doméstico. De hecho, ningún otro animal doméstico hoy en día se encuentra menos estructurado filogenéticamente y filogeográficamente hablando, o muestra una cantidad equivalente de variación de mtDNA.

Figura 4. Distribución entre pares de frecuencias (Mismatch distribution) de haplotipos mitocondriales que indican la expansión de la población (domesticación) en todas las regiones, excepto por Iberia, de 3000 a. C. a 600 d. C.

Muestras
Nuestras muestras alcanzan desde Alaska/norte de Siberia hata la península ibérica y cubren una ventana temporal desde el Pleistoceno superior hasta el Medievo (tabla S1: datos C14 enumerados en la tabla S10). Analizamos con éxito 85 muestras antiguas euroasiáticas (de un total de 157). El conjunto de datos de secuencias obtenidas de estas muestras de DNA antiguo fue complementado con 122 secuencias de DNA antiguo archivadas en GenBank (tabla S2). Además, se incorporaron 1754 secuencias GenBank de caballos modernos, incluido el caballo Przewalski (tabla S11). Dividimos nuestro conjunto de datos en base al origen geográfico en a) norte y este de Siberia; b) Asia Oriental (p. ej. China, Mongolia y Corea); c) oeste y sur de Siberia (Llanura de Siberia Occidental y Kazajistán); d) Europa y Asia Menor (al oeste de los Montes Urales y del Mar Caspio, hasta los Pirineos y Armenia); y e) la península ibérica (al sur de los Pirineos). Además, hemos considerado los siguientes periodos culturales: a) Pleistoceno superior/Holoceno temprano; b) Edad de Cobre; c) Edad de Bronce; d) Edad de Hierro; e) Edad Media. Conviene resaltar que el rango en años de los periodos cronoculturales en ocasiones difiere entre las diferentes regiones geográficas.
Extacción de DNA antiguo, amplificación y secuenciación
Se extrajo DNA de muestras de 250-400 mg, dentales u óseas. Se eliminó la superficie de estos tejidos mediante abrasión para minimizar la contaminación. Las muestras se pulverizaron con molino criogénico y se incubaron en 0,45 M EDTA (pH 8.0) y 0,25 mg/ml de proteinasa K durante la noche, bajo rotación, a temperatura ambiente. Después, se recogieron los sedimentos mediante centrifugado durante 5 min. a 4.000 rpm en una centrifugadora Universal 320 (Hettich). Se purificó el DNA del sobrenadante mediante un método previamente descrito(24-25), basado en sílice.
Se designaron dos juegos diferentes parcialmente superpuestos de cebadores (tabla S12). Al usar estos cebadores, 722 pb (15.468-16.190 np; juego cebador 1) o 713 pb (15,468-16,181 np juego cebador 2) fueron amplificados respectivamente en un PCR múltiple en dos pasos(26-27). Los productos PCR de sobreposición, incluidos los cebadores, variaron en longitud entre 178 pb y 108 pb. Usamos 4 µl de extracto en cada PCR múltiple. La PCR inicial se realizó en un volumen de reacción de 20 µl que contenía AmpliTaq Gold PCR buffer II (ABI), 4 mM MgCl2, 1 mg/ml albúmina sérica bovina (BSA), 250 µM cada uno de dATP, dCTP y dGTP, 500 µM de dUTP, 150 nM de cada cebador y 2 U de AmpliTaq Gold (ABI). Se llevó a cabo la PCR mediante la adición de 1 U de uracil DNA glicosilasa (USB) inestable por calor y un paso inicial de incubación de 15 min. a 37 ºC para evitar una contaminación por arrastre. Usamos 5 µl de productos de PCR diluidos (1/30) para el siguiente paso (volumen total de la reacción de 20 µl). Las PCR simples contenían 16 AmpliTaq Gold PCR Buffer II, 4 mM MgCl2, 1 mg/ml de albúmina sérica bovina (BSA), 250 µM cada uno de dATP, dCTP y dGTP, 500 µM de dUTP, 1,5 µM de cada cebador y 0,5 U de AmpliTaq Gold DNA polimerasa. En ambos casos, la PCR tuvo lugar bajo las siguientes condiciones: desnaturalización y activación Taq a 94 ºC durante 9 minutos, seguido por 30 a 35 ciclos consistentes en desnaturalización a 95 ºC durante 20 segundos; temperatura de anillamiento depende del juego de cebadores (juego I: 58 ºC; juego II: 47 ºC) durante 30 segundos, extensión a 72 ºC durante 30 segundos y extensión final a 72 ºC durante 4 minutos. Se realizaron controles negativos de extracción y controles negativos PCR para cada PCR. Los productos de la amplificación se visualizaron en gel de agarosa. Se secuenciaron los fragmentos sobre un secuenciador capilar ABI PRISM 3730 mediante el método de secuenciación cíclica BigDye Terminator v3.1 (Applied Biosystems).
Autentificación
El muestreo, la extracción y la preparación previa a la PCR se llevaron a cabo en laboratorios dedicados al DNA antiguo, siguiendo los procedimientos normalizados para evitar la contaminación. Se realizó la secuenciación directa al menos tres veces para cada fragmento en base a dos extracciones independientes para detectar errores de PCR y errores de codificación por lesiones en el DNA antiguo, y distinguirlos de las secuencias auténticas(28). Se llevaron a cabo replicaciones independientes en diferentes laboratorios para 21 muestras de hueso (Universidad Humboldt en Berlin e Instituto Max Planck en Leipzig).
Reconstrucciones filogénicas
Se truncaron las secuencias en las posiciones de nucleótidos 15.494-15.740 (parte del HVR I mitocondrial) para acomodar las secuencias cortas publicadas. Las secuencias antiguas de la región de control se alinearon mediante BioEdit 7.0.9 (http://www.mbio.ncsu. edu/BioEdit/bioedit.html) en base a una secuencia de referencia(29). Se determinaron los haplotipos sobre la base de sustituciones informativas bajo la exclusión de los puntos calientes de mutación(13) que fueron detectados mediante un análisis de conexiones de red que incluía 1754 caballos modernos y 207 muestras antiguas. Se usó NETWORK 4.5.1.0 (http:// www.fluxus-engineering.com) para el cálculo en el análisis de conexiones de red. Los cálculos se realizaron en las siguientes condiciones: doble peso de las supresiones o inserciones; se eligió el valor predeterminado de Epsilon (0); tasa de transición/transversión (TI/TV=6,5). A los lugares variables se les asignó mayor o menor peso dependiendo del número máximo de mutaciones en cada posición (tabla S3). Además de los tres puntos calientes de mutación identificados en estudios anteriores(13,18), excluimos un cuarto punto caliente de mutación. Así, definimos nuevos haplotipos y los denominamos mediante una nueva nomenclatura. Los haplotipos antiguos se denominan con la letra de su haplogrupo complementado por un número o por un número y una letra, dependiendo de la distancia a la que se encuentran del nodo basal (por ejemplo: el haplotipo D3 se separa de D por 1 mutación, y el haplotipo D3a, por 2 mutaciones). La X indica haplogrupos cuestionables (X1-X8) y haplotipos cuestionables (X9-X17). La posición filogenética de estos haplotipos depende en gran medida de los valores predeterminados de la reconstrucción de red.

Figura 5. Esta figura ilustra la cronología de la distribución geográfica de los haplogrupos. El tamaño de los círculos representa la frecuencia del haplogrupo.
Diversidad de mtDNA y estructura de la población
La diversidad genética entre las secuencias antiguas fue cuantificada tanto como diversidad en nucleótidos como por su diversidad en haplotipos. Además, el promedio de diferencias entre pares en las poblaciones y entre las poblaciones, y los valores Fst entre pares de poblaciones (basado en la distancia Tamura & Nei; 10.000 permutaciones) se procesaron mediante Arlequin (http://cmpg. unibe.ch/software/arlequin3/). Las expansiones demográficas (distribución discrepante) para determinados puntos temporales y épocas culturales se estimaron mediante Arlequin (expansión demográfica) y se calcularon mediante un script en R integrado en Arlequin (http://www.r- project.org/). Los cálculos de la diversidad de nucleótidos y de mismatch distribution se realizaron en el siguiente entorno: gamma http://cmpg/ parámetro de forma (a = 0.57) estimado en PAUP 4.0 (Sinauer Associates) usando máxima verosimilitud.
Anexos
Tabla S1 Muestras analizadas para este estudio. Las muestras señalizadas con una Y (tipificado) entregaron un genotipo completo. La extracción y amplificación de las muestras (Ext/Amp) y la reproducción (Rep) se llevó a cabo en dos institutos, la Universidad Humboldt en Berlín, por Melanie Pruvost (MP) y Michael Cieslak (MC) y el Instituto Max Planck en Leipzig, por Sebastian Lippold (SL) y Melanie Pruvost (MP). EBA = Edad de Bronce temprana (Early Bronze Age); MED = época medieval. (DOC)
Tabla S2 Muestras analizadas para este estudio.y muestras de GenBank. Las muestras resaltadas en gris son las muestras extendidas del GenBank. La tabla incluye el nombre de la muestra, número de acceso, ubicación, fecha y también un nombre de haplogrupo/haplotipo asignado. (DOC)
Tabla S3 Región de control del DNA mitocondrial (HVRI; posición: 15.494-15.740) y los datos de características de nucleótidos del conjunto de muestras de tabla S2, con 207 muestras antiguas adicionales (tabla S11). (DOC)
Tabla S4 Posiciones variables de las secuencias del bucle de desplazamiento en los haplotipos antiguos. Muestra np inferior a 15000. D2e corresponde a la referencia mtDNA X79547(23). Los puntos calientes de mutación (15585, 15597, 15604 and 15650) no están incluidos, porque estas posiciones fueron excluidas en las reconstrucciones filogénicas. Los espacios se señalizaron con ‘‘-‘‘. La nomenclatura previa(13-14) aparece entre corchetes. (DOC)
Tabla S5 Incidencia de haplotipos antiguos en razas primitivas. (DOC)
Tabla S6 Incidencia de haplotipos antiguos en caballos modernos, en base a sus entradas del GenBank. (DOC)
Tabla S7 Suma de las desviaciones al cuadrado e índice de irregularidad (mismatch sistribution). (DOC)
Tabla S8 Valores Fst entre pares de poblaciones. Sobre la diagonal: Matriz de valores P para Fst significativos (p=0,05). Bajo la diagonal: Valores Fst entre pares de poblaciones. (DOC)
Tabla S9 Media de diferencias entre pares entra las poblaciones y dentro de las poblaciones. Sobre la diagonal: Media de diferencias entre pares entre poblaciones (PiXY); (gris=significativo; p=0,05). Elementos diagonales: Media de diferencias ente pares dentro de las poblaciones (PiX). Bajo la diagonal: Diferencia media entre pares corregida (PiXY2(PiX+PiY)/2). (DOC)
Tabla S10 Datos C14 de muestras analizadas en este estudio. Para los detalles de las muestras, vea la tabla 1. Las muestras del Pleistoceno no están directamente fechadas, pero por estimación del contexto deberían tener unos 20.000 años. El resto de datos están calibrados por carbono o se derivan del contexto arequeológico. (DOC)
Tabla S11 Número de acceso de GenBank de caballos modernos (los caballos Przewalsi en cursiva).(DOC)
Tabla S12 Secuencias de cebadores. (DOC)
Tabla S13 Razas de caballo primitivas y el caballo Przewalski. (DOC)
Agradecimientos
Nuestro agradecimiento a todos los arqueólogos y conservadores que han aportado el material y la información para este estudio. En particular, agradecemos a Kurt Alt, Soner Aksu, Nikola Hensel, Christine Weber y Sebastian Lippold su apoyo previo y durante el transcurso de los análisis del DNA antiguo. Nuestro especial agradecimiento a Dietmar Lieckfeldt por su ayuda técnica. Este estudio deriva del proyecto de domesticación del caballo iniciado originalmente por AL y NB en 2004 y es parte de la tesis de MC.
Contribución de los autores
Concibió y diseñó los experimentos: MP, NB, MR, MH y AL. Realizó los experimentos: MC y MP. Analizó los datos: MC, MP y AL. Aportó reactivos/materiales/herramientas analíticas: NB, AM y MH. Redactó el artículo: AL, MH y MP. Responsable del trabajo de laboratorio: MC y MP. Aportó muestras y conocimientos de arqueología: AM y NB. Responsable del diseño de investigación y estadísticas: AL, MP, MH y NB. Diseñó las figuras: MC.
Bibliografía
- Anthony DW, Bogucki P, Coms¸a E, Gimbutas M, Jovanovic´ B, et al. (1986) The ‘‘Kurgan Culture,’’ Indo-European origins, and the domestication of the horse: A reconsideration. Current Anthropology 27(4): 291–313. Disponible en: http:// www.jstor.org/pss/2743045.
- Levine M (1999) The origins of horse husbandry on the Eurasian steppe. En: Levine M, Rassamakin Y, Kislenko AM y Tatarintseva NS, eds. Late Prehistoric Exploitation of the Eurasian Steppe. Cambridge McDonald Institute. pp 5–58.
- Vilà C, Savolainen P, Maldonado JE, Amorim IR, Rice JE, et al. (1997) Multiple and ancient origins of the domestic dog. Science 276: 1687-9. Disponible en: http:// www.sciencemag.org/cgi/content/abstract/276/5319/1687.
- Savolainen P, Zhang Y, Luo J, Lundeberg J, Leitner T, et al. (2002) Genetic evidence for an East Asian origin of domestic dogs. Science 298: 1610 Disponible en: http://www.sciencemag.org/cgi/content/abstract/298/5598/1610.
- Levine MA (2005) Domestication and early history of the horse. En: Mills DS y McDonnell SM, eds. The Domestication of horse: the origins, development and management of its behaviour. Cambridge: Cambridge University Press. 5-22.
- Mashkour M (2006) Equids in Time and Space. Oxford, Reino Unido: Oxbow Books.
- Lau AN, Peng L, Goto H, Chemnick L, Ryder OA, et al. (2009) Horse domestication and conservation genetics of Przewalski’s horse inferred from sex chromosomal and autosomal sequences. Mol Biol Evol 26: 199-208. Disponible en: http://mbe.oxfordjournals.org/cgi/content/abstract/msn239.
- Giuffra E, Kijas JMH, Amarger V, Carlborg O, Jeon J-T, et al. (2000) The origin of the domestic pig: Independent domestication and subsequent introgression. Genetics 154: 1785-1791. Disponible en: http://www.genetics.org/ cgi/content/short/154/4/1785.
- Edwards CJ, Bollongino R, Scheu A, Chamberlain A, Tresset A, et al. (2007) Mitochondrial DNA analysis shows a Near Eastern Neolithic origin for domestic cattle and no indication of domestication of European aurochs. Proceedings Royal Society 274: 1377-1385. Disponible en: http://rspb.royalsocietypublishing. org/content/274/1616/1377.full.pdf+html.
- Tapio M, Marzanov N, Ozerov M, Cinkulov M, Gonzarenko G, et al. (2006) Sheep mitochondrial DNA variation in European, Caucasian and Central Asian areas. Mol Biol Evol 23: 1776-1783. DOI 10.1093/molbev/msl043. Disponible en: http://mbe.oxfordjournals.org/cgi/content/short/msl043v1.
- Naderi S, Rezaei H-R, Taberlet P, Zundel S, Rafat S-A, et al. (2007) Large-scale mitochondrial DNA analysis of the domestic goat reveals six haplogroups with high diversity. PLoS ONE 2(10): e1012. doi:10.1371/journal.pone.0001012 Disponible en: http://www.plosone.org/article/info:doi%2F10.1371%2Fjournal. pone.0001012.
- Vilà C, Leonard JA, Gotherstrom A, Marklund S, Sandberg K, et al. (2001) Widespread origins of domestic horse lineages. Science 291: 474-477. Disponible en: http://www.sciencemag.org/cgi/content/abstract/291/5503/474.
- Jansen T, Forster P, Levine MA, Oelke H, Hurles M, et al. (2002) Mitochondrial DNA and the origins of the domestic horse. Proceedings of the National Academy of Sciences of the United States of America 99: 10905-10910. Disponible en: http://www.pnas.org/content/99/16/10905.
- McGahern AM, Bower MA, Edwards CJ, Brophy PO, Sulimova G, et al. (2006) Evidence for biogeographic patterning of mitochondrial DNA sequences in Eastern horse populations. Animal Genetics 37: 494-497. Disponible en: http:// www3.interscience.wiley.com/journal/118596251/abstract.
- Lei CZ, Su R, Bower MA, Edwards CJ, Wang XB, et al. (2009) Multiple maternal origins of native modern and ancient horse populations in China. Animal Genetics. pp 933–944. Disponible en: http://www3.interscience.wiley.com/ journal/122594301/abstract.
- Ling Y, Ma Y, Guan W, Cheng Y, Wang Y, et al. (2010) Identification of Y chromosome genetic variations in Chinese indigenous horse breeds. Journal of Heredity 101: 639-643. Disponible en: http://jhered.oxfordjournals.org/cgi/ content/abstract/esq047.
- Wallner B, Piumi F, Brem G, Muller M y Achmann R (2004) Isolation of Y chromosome-specific microsatellites in the horse and cross-species amplification in the genus Equus. Journal of Heredity 95: 158-164. Disponible en: http://jhered. oxfordjournals.org/cgi/content/short/95/2/158.
- Lira J, Linderholm A, Olaria C, Brandstro¨m Durling M, Gilbert MTP, et al. (2010) Ancient DNA reveals traces of Iberian Neolithic and Bronze Age lineages in modern Iberian horses. Molecular Ecology 19: 64-78. Disponible en: http:// www3.interscience.wiley.com/journal/123191525/abstract.
- Achilli A, Bonfiglio S, Olivieri A, Malusà A, Ajmone-Marsan P, et al. (2009) The multifaceted origin of taurine cattle reflected by the mitochondrial genome. PLoS ONE 4: e5753. Disponible en: http://www.plosone.org/article/info. doi%2F10.1371%2Fjournal.pone.0005753.
- Ludwig A, Pruvost M, Reissmann M, Benecke N, Brockmann GA, et al. (2009) Coat color variation at the beginning of horse domestication. Science 324: 485 Disponible en: http://www.sciencemag.org/cgi/content/short/324/5926/485.
- Outram AK, Stear NA, Bendrey R, Olsen S, Kasparov A, et al. (2009) The earliest horse harnessing and milking. Science 323: 1332-1335. Disponible en: http://www.sciencemag.org/cgi/content/abstract/323/5919/1332.
- Sambraus HH (1986) Endangered domestic animal species in German speaking countries. I: General aspects. Tierarztliche Praxis 14: 297-307. Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/3764877.
- Waring GH (2002) Horse behaviour: The behavioural traits and adaptations of domestic and wild horses, including ponies. Park Ridge, NJ: Noyes Publishing.
- Rohland N y Hofreiter M (2007a) Ancient DNA extraction from bones and teeth. Nature Protocols 2(7): 1756-62. Disponible en: http://www.natureprotocols.com/ 2007/07/12/ancient_dna_extraction_from_bo.php.
- Rohland N y Hofreiter M (2007b) Comparison and optimization of ancient DNA extraction. Biotechniques 42: 343-352. Disponible en: http://www.biotechniques. com/BiotechniquesJournal/2007/March/Comparison-and-optimization-of- ancient-DNA-extraction/biotechniques-41414.html.
- Krause J, Dear PH, Pollack JL, Slatkin M, Barnes I, et al. (2006) Multiplex amplification of the mammoth mitochondrial genome and the evolution of Elephantidae. Nature 439: 724-727. Disponible en: http://www.nature.com/ nature/journal/v439/n7077/abs/nature04432.html.
- Römpler H, Dear PH, Krause J, Meyer M, Rohland N, et al. (2006) Multiplex amplification of ancient DNA. Nature Protocols 2(1): 720-728.
- Pruvost M, Schwarz R, Correia VB, Champlot S, Grange T, et al. (2008) DNA diagenesis and palaeogenetic analysis: Critical assessment and methodological progress. Paleogeography, Paleoclimatology and Paleoecology 266: 211-219.
- Xu X, Arnason U (1994) The complete mitochondrial DNA sequence of the horse, Equus caballus: Extensive heteroplasmy of the control region. Gene 148: 657-662. Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/7958969.