Análisis de datos sobre gobernanza restauración bosques (GRB) en Am.Latina (AL).
Se observan en el dataset 101 filas y 18 columnas.
Hay cuatro variables que no se pueden gráficar, se verá luego como procesarlas.
Po su parte bioma tiene 21 categorías, si bien se grafica, hay que pensar una manera de reducirla para relacionarla con el resto.
Respecto de las variables start y end, no resultan de mucha utilidad existiendo la variable derivada duration. Aquí se crea a partir de la variable start otra variable adicional: antiquity años desde comienzo de la iniciativa.
Habida cuenta de la existencia de la variable antiquity, a partir de end se general la variable permanent, un indicador de si la iniciativa es permanente o no.
Respecto del resto de las variables, se exploran primero las categóricas:
Y luego las numéricas:
Correlaciones entre estas variables. Para poder estimar las correlaciones se transforman las variables categóricas en dummies.
Hay valores perdidos en la variable area, se los imputa con un modelo de random forest.
##
## Missing value imputation by random forests
##
## Variables to impute: area
## Variables used to impute: num_countries, scale_G
## iter 1: .
Cuáles son las correlaciones más fuertes?, en este caso las correlaciones azules son positivas (R de Pearson)
Visualizar eigenvalues (scree plot):
Se observa que las primeras 2 o 3 dimensiones no alcanzan a explicar el 50% de la varianza del dataset.
Para mejorar la interpretación del gráfico:
Idem anterior pero el color indica cuales son las variables más relevantes para la solución hallada (aparecen en color rojo). El algortimo no encuentra patrones fuertes.
Interpretación pendiente, pero por ejemplo el cuadrante inferior derecho indica que las variables k, g, t y h están positivamente relacionadas entre sí, formando un cluster de variables.
Por otro lado, mirando el gráfico vemos que la variables c y m ,por ejemplo, están negativamente asociadas, ya que están en sectores opuestos del plano.
Análisis de las instituciones de support de las iniciativas.