practica 2

Author

sebastian laverde

TAREA 1: GANADO

FIGURA 1 GANADO UPGMA (Dendrograma). Este método de agrupamiento que calcula la distancia entre grupos utilizando el promedio aritmético de todos los valores de distancia entre grupos, fusionando objetos en nuevos grupos según los pares más cercanos hasta que todos los objetos se combinen en un solo grupo. Ya explicando la grafica obtuvimos que en el análisis de componentes principales (PCA) hace la proyección de los individuos en un plano bidimensional, donde se obtiene el resultado de tres grandes agrupaciones de los individuos analizados. La primera agrupa a las razas Brahman y Gyr, razas que se sitúan muy cerca la una de la otra en el PCA, ambas razas son razas del grupo Bos indicus. La segunda agrupa a las razas Braunvieh y Simmental, reconocibles ambas como razas del grupo Bos taurus, aunque el PCA muestra una amplia dispersión de la raza Braunvieh respecto a la raza Simmental. La última agrupación plasmada por el PCA es la del PCC (AFB), la que se encuentra muy distante del resto de las otras agrupaciones y que representa el carácter de raza diferenciado que tienen. El dendrograma UPGMA es una representación jerárquica de las similitudes mutuas, el cual confirma los resultados del PCA, ya que se observa claramente la división entre Bos indicus y Bos taurus, junto a la individualidad de la Belga de la Quesería (PCC).

Figura 2. PCA con elipses por raza. La representación del PCA con elipses de agrupación manifiesta con mayor claridad la estructura genética del rebaño Peruano, en donde se reconocen tres(3) clústeres: Brahman y Gyr que muestran una alta similitud genética; Braunvieh y Simmental que contienen una agrupación consistente y diferenciada de los clústeres previos; y PCC (AFB), separado de los otros clústeres, confirmando la singularidad genética del mismo. La distancia hallada entre los grupos indica diversidad genética; además, en los eigenvalues la representación gráfica muestra que los PC1 y PC2 concentran gran parte de la varianza, confirmando su uso en la representación.

TAREA 2: ARBOLES

Reconstrucción de un cuello de botella poblacional de hayas mediante información demográfica de archivo y análisis bayesiano de datos genéticos. Para este estudio, se muestrearon un total de 1932 individuos en 51 parcelas de estudio en tres regiones del Mont Ventoux (Fig. 1, Tabla S1, Información complementaria; véase ISSVEN-TOUX: http://www.evoltree.eu/index.php/iss). Se muestrearon (i) 1228 árboles adultos en 25 parcelas de la región oeste, que presenta una mezcla de bosques antiguos y recientes bajo gestión tradicional; (ii) 575 árboles en 21 parcelas de la región este, incluida en una Reserva de la Biosfera y sin gestión; y (iii) 129 hayas en 5 parcelas de la región sur, que se cree que han sido recolonizadas recientemente por hayas europeas. En 48 de las 51 parcelas, se muestrearon un máximo de 30 hayas adultas para el análisis de ADN. En tres de las parcelas del oeste (Oeste-N2, 384 y 257-2), se muestrearon todos los individuos. En todas las parcelas, si un árbol tenía varios tallos, solo se muestreó el más grande. Se recolectaron muestras de hojas en 2008 y 2009, las cuales se almacenaron en el INRA de Aviñón a 20 °C.

INFORMACION DE LOS DATOS

 1,906 individuals; 13 loci; 175 alleles; size: 1.4 Mb

 // Basic content
   @tab:  1906 x 175 matrix of allele counts
   @loc.n.all: number of alleles per locus (range: 5-23)
   @loc.fac: locus factor for the 175 columns of @tab
   @all.names: list of allele names for each locus
   @ploidy: ploidy of each individual  (range: 2-2)
   @type:  codom
   @call: adegenet::df2genind(X = tab[, mic], sep = "/", ind.names = row.names(tab), 
    loc.names = mic, pop = factor(tab$Region), NA.char = "0")

 // Optional content
   @pop: population of each individual (group size range: 129-1201)

Number of individuals: 1906
// Group sizes: 576 129 1201
// Number of alleles per locus: 23 5 11 14 21 11 16 14 12 13 11 11 13
// Number of alleles per group: 145 121 160
// Percentage of missing data: 0.62 %
// Observed heterozygosity: 0.81 0.5 0.76 0.67 0.66 0.63 0.81 0.53 0.56 0.75 0.77 0.83 0.66
// Expected heterozygosity: 0.87 0.49 0.79 0.75 0.77 0.8 0.81 0.54 0.55 0.74 0.75 0.85 0.67


NOTA EXPLICATIVA: La población estudiada (n = 1906) muestra una gran diversidad genética, pudiendo incluso alcanzar 23 alelos por locus y una heterocigosidad esperada alta Hs ≈ 0.49-0.87 significa un acervo genético extenso y dinámico; este patrón es característico de poblaciones extensas y con conexiones evolutivas, en las que el flujo génico frena la diferenciación poblacional pero fomenta la preservación de la variabilidad.

East 
| South 
| West 
| Total 
    Pop    N  MLG eMLG    SE    H    G lambda   E.5  Hexp     Ia   rbarD  File
1  East  576  576  129 0.000 6.36  576  0.998 1.000 0.706 0.1446 0.01207 tabAA
2 South  129  129  129 0.000 4.86  129  0.992 1.000 0.704 0.0304 0.00255 tabAA
3  West 1201 1179  129 0.706 7.06 1119  0.999 0.963 0.724 0.0969 0.00809 tabAA
4 Total 1906 1884  129 0.450 7.53 1822  0.999 0.976 0.722 0.1028 0.00858 tabAA


NOTA EXPLICATIVA: Los resultados muestran que las tres poblaciones (East, South y West) mantienen una alta diversidad genética (Hexp ≈ 0.70–0.72) y valores elevados de riqueza genotípica (G y λ ≈ 0.99), lo que indica ausencia de clonación dominante y un acervo genético amplio. La baja diferenciación entre grupos y la elevada variabilidad total sugieren que el flujo génico ha jugado un papel clave en mantener la homogeneidad genética, al mismo tiempo que garantiza la persistencia evolutiva mediante una base genética diversa y resiliente

adegenet::Hs(tabAA)
     East     South      West 
0.7057329 0.7019985 0.7247612

# #Fst
>  pegas::Fst(pegAA)
                    Fit          Fst          Fis
FS1_15      0.064041028 0.0032363415  0.061002111
FS3_04     -0.015670486 0.0123714408 -0.028393192
Sfc0007_2   0.039690871 0.0009269777  0.038799860
Sfc00018    0.101208944 0.0027642201  0.098717601
Sfc00036    0.184421831 0.0940374695  0.099766114
Sfc01063    0.216415306 0.0057911093  0.211851050
Sfc01143   -0.002040813 0.0008635635 -0.002906886
csolfag_25  0.021854410 0.0036436630  0.018277344
csolfag_29 -0.003813562 0.0008751417 -0.004692811
csolfag_31 -0.006093681 0.0045962837 -0.010739325
csolfag_05 -0.019724954 0.0006911670 -0.020430242
csolfag_06  0.023228422 0.0029441737  0.020344145
mfc7        0.031440834 0.0166722322  0.015019002


NOTA EXPLICATIVA: El índice de Fst expuesto en la tabla evidencia que para la mayoría de los loci hay una diferenciación genética muy baja, lo que es congruente con la nivelación de diferencia genética como consecuencia de un alto flujo génico, ya que muestra que sólo Sfc00036 (Fst = 0.094) podría ser una señal de la selección localizada en un contexto de homogeneidad.

pegas::H(pegAA)

FS1_15 0.8672216

FS3_04 0.4931506

Sfc0007_2 0.7888504

Sfc00018 0.7469400

Sfc00036 0.7685543

Sfc01063 0.8022377

Sfc01143 0.8129259

csolfag_25 0.5442334

csolfag_29 0.5532650

csolfag_31 0.7424619

csolfag_05 0.7527517

csolfag_06 0.8470417

mfc7 0.6723696

NOTA EXPLICATIVA: Los índices de heterocigosidad esperada (Hs) indicaron que la mayoría de los loci analizados presentaban alta diversidad genética (ej. FS1_15 = 0.86, Sfc01063 = 0.80, Sfc01143 = 0.81) reflejando un adecuado acervo génico; los marcadores con menor diversidad como FS3_04 (0.49) o csolfag_25 (0.54) señalaban baja variabilidad local pero, en su conjunto, el patrón mostrado por los loci en las poblaciones objeto de estudio sugieren la conservación de un armario genético fuerte, a modo de ser el soporte en la adaptación y la victoria evolutiva.

PCA APLICADO A 3 POBLACIONES DE ARBOLES:

La marcada diversidad genética registrada en las tres poblaciones (East, South y West, junto a los bajos valores de diferenciación (Fst < 0.02 en la mayoría de loci), da cuenta de un fuerte flujo génico y de la inexistencia de barreras reproductivas notables. De forma análoga, el PCA ratifica esta idea al ser capaz de representar a los alelos inmersos dentro de una nube compacta sin clústeres claramente definidos, sugiriendo que la variación está ampliamente compartida entre regiones. Este patrón se percibe frecuentemente en las especies que tienen grandes tamaños poblacionales y una eficiente dispersión de los sucesos de genes con un efecto reducido de la deriva genética, y donde la homogeneidad genética es mantenida por una migración continua (Slatkin, 1987).

Sin embargo, loci como Sfc00036 y Sfc01063 son claramente diferenciadores y se separan en el PCA; además, presentan valores de Fst relativamente más altos, lo que apoya la idea de que podrían estar bajo una selección local o estar emparejados a adaptaciones locales. De hecho, los genes diferenciadores adquieren importancia en un contexto evolutivo donde podrían haber desarrollado una incipiente estructuración genética sobre un fondo genético de alta conectividad. La coexistencia de homogeneidad genética global y diferenciación puntual es muy bien explicada por modelos de evolución en metapoblaciones, donde existe el flujo génico heterogéneo y la selección localizada (Nosil, 2012).

DAPC APLICADO A TRES POBLACIONES DE ARBOLES

Esta gráfica se refiere a un DAPC (Análisis Discriminante de Componentes Principales) de las poblaciones East, South y West. La concentración central de los individuos, junto con la marcada superposición genética y, por ende, una baja diferenciación poblacional, se halla en concordancia con los valores bajos de Fst para la mayoría de los loci (<0.02) y la alta heterocigosidad esperada de todos los grupos (Hs ≈ 0.70–0.72). Estos indicios revelan una base genética relativamente extensa y compartida que es mantenida por un flujo génico constante entre las regiones.

Por el contrario, la dispersión radial de determinados individuos que muestran variaciones puntuales en loci concretos que aportan en grado desproporcionado a la diferenciación, como Sfc00036 (Fst = 0.094) y Sfc01063 (Fst = 0.0058) que quedan más alejados del centro y que podrían estar reflejando procesos de selección localizada. Desde un punto de vista evolutivo, este patrón es propio de aquellas especies con alta población eficaz y conectividad genética, con una homogeneidad global pero donde ciertos marcadores concretos apuntan a las primeras señales de divergencia adaptativa en un marco de fuerte flujo génico (Slatkin, 1987).