#install.packages("GGally")
library(GGally)
## Cargando paquete requerido: ggplot2
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
library(paqueteMETODOS)
## Cargando paquete requerido: dplyr
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data(biomasa) # data contenida en paqueteMET
head(biomasa) # primeros 6 registros de la data
## # A tibble: 6 × 8
## finca mg bio_aerea bio_sub bio_total area_foliar diametro altura
## <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 FINCA_1 GENOTIPO_1 12.8 0.93 13.7 44.5 4.7 5
## 2 FINCA_1 GENOTIPO_1 13.9 0.69 14.6 39.7 5.3 5.6
## 3 FINCA_1 GENOTIPO_1 15.1 0.78 15.9 45.6 4.8 5.8
## 4 FINCA_1 GENOTIPO_1 8.08 0.91 8.99 29.5 3.2 4.3
## 5 FINCA_1 GENOTIPO_1 5.58 1.41 6.99 22.5 2.2 3.3
## 6 FINCA_1 GENOTIPO_2 18.5 0.84 19.3 34.2 6.3 7.9
cor(biomasa[,3:8]) %>% # matriz de correlaciones
round(.,3 )
## bio_aerea bio_sub bio_total area_foliar diametro altura
## bio_aerea 1.000 -0.561 0.999 0.865 0.914 0.861
## bio_sub -0.561 1.000 -0.534 -0.590 -0.652 -0.550
## bio_total 0.999 -0.534 1.000 0.860 0.908 0.858
## area_foliar 0.865 -0.590 0.860 1.000 0.736 0.572
## diametro 0.914 -0.652 0.908 0.736 1.000 0.936
## altura 0.861 -0.550 0.858 0.572 0.936 1.000
ggpairs(biomasa[,5:8], title="Biomasa")
En esta matriz gráfica ademas de los diagramas de puntos que permiten visualizar el tipo de relación lineal entre las variables, permite visualizar la distribución de cada variable, el valor de la correlación entre cada par de variables y su significancia sobre la prueba de hipótesis \(Ho:ρ=0\) frente a \(Ha:ρ≠0\). En este caso todos los valores obtenidos son significativamente diferentes de cero.
Para el caso de variables cualitativas podemos utilizar los coeficientes \(Phi\) o el de \(Cramer\), a través de una tabla de contingencia o de doble entrada, por ejemplo:
tabla = c(80,9,30,21) %>%
matrix(., nrow = 2)
colnames(tabla)=c("Africa", "America")
rownames(tabla)=c("si", "no")
mosaicplot(tabla, cex = 1.1, col = c("#8ECAE6","#023047"), main = "Proyectos aprobados sistema alimentario")
Tambien llamado coeficiente de Mathews, corresponde a un indicador de asociación entre dos variables binarias y está basado en el estadístico chi-cuadrado producto de una tabla cruzada o tabla de contingencia 2×2
#installed.packages("DescTools")
library(DescTools)
cat("Coeficiente Phi : ", Phi(tabla))
## Coeficiente Phi : 0.3643192
Mide la inensidad de la relación entre dos variables categóricas en terminos del tamaño de la chi-cuadrado de independencia.
Es debil para valores inferiores a 0.2 Moderado para valores entre 0.2 y 0.6 Es fuerte para valores superiores a 0.6
cat("Coeficiente V de Cramer :", CramerV(tabla))
## Coeficiente V de Cramer : 0.3643192