Se emplea en el análisis de frecuencias. Conlleva al calculo de un estadístico (X2), osea chi-cuadrado. El planteamiento de la hipotesis alternativa es que almenos una de las frecuencias se comporta de manera diferente.
En otras palabras la hipotesis alternativa plantea que existe una diferencia entre la frecuencia esperada y la observada, la hipotesis nula plantea lo contrario En caso de que al realizar la prueba de chi-cuadrado el valor de gL sea 1 se debe realizar la correción de Yates restando 0.5 del numerador en cada componente de la fórmula de chi-cuadrado.
A la Hora analizar mi prueba de chi-cuadrado debo calcular las frecuencias esperadas, si de estas alguna es menor a 5 se debe realizar en su lugar el fisher.test, luego para dar una respuesta a nuestra interrogante analizamos el valor obtenido del p-value.
Para calcular el valor críico tabular para cierto número de grados de libertad se utiliza el comando qchisq.
Nos sirve para estudiar si existe relación entre 2 variables aleatorias.
Conlleva el calculo del coeficiente de correlación y nos indica si los datos tienden a disponerse alineadamente y toma valores entre -1 y 1. Entre mas cercano este el número de -1 o 1 la correlación será mayor ya sea positiva o negativa
Para realizar esta prueba procedemos a comprobar primeramente la normalidad de los datos, en el caso de ser normales se utiliza el método de Pearson y en el caso de ser no-paramétricas se utiliza el método de spearman, luego reviso el valor de r para determinar si mi correlación es fuerte, debil o nula. Adicionalmente tenemos el cálculo del coeficiente de determinación el cual es el valor de r elevado al cuadrado y este nos dá una medida de la proporción de la variabilidad de una variable, osea me dice el porcentaje de los datos que está o no relacionado. Los grados de libertad se calculan de la forma n-2.
Se utiliza cuando se sabe de antemano que existe una relación entre 2 variables. Todos los valores en esta prueba son numéricos, para realizarla creamos la regresión deseada colocando lm(y~x) siendo “y” la variable independendiente que se quiere calcular y “x”" la variable independiente, posteriormente se analizan los valores obtenidos del summary de la regresión para armar la ecuaciión Y=mx+b, donde m es la pendiente y b el intercepto.
Una vez obtenida la ecuacion se puede proceder a realizar calculos para cualquier valor deseado de Y a partir de un valor X.
Se debe realizar de igual manera la prueba de los supuestos de normalidad y homocedasticidad usando para ello el shapiro.test de los residuos para determinar la normalidad y el ncvTest para determinar la homocedasticidad, en caso de no ser normales indica que la regresión no es apropiada y de no ser homocedasticos se puede realizar la transformación de los datos poniendo log() antes de cada variable
Se utiliza para realizar pruebas de hipotesis de grupos múltiples. En este caso mi hipotesis alternativa indica que existen diferencias significativas entre las varianzas y mi hipotesis nula indica que estas no poseen diferencias significativas.
Para crear mi anova utilizo el comando aov(num~trat) donde num son los valores numericos y trat los tratamientos utilizados.
En el caso de pruebas de analisis de varianza existen varias pruebas para realizar el analisis de los supuestos, para ello los dibidiremos en dos grupos: pruebas Paramétricas y No-paramétricas.
Paramétricas: Si realizamos la prueba de normalidad a los residuos mediante el shapiro.test y los valores resultan ser normales debe proceder a realizar la prueba de balanceo la cual me indica si mis datos tienen la misma cantidad de variables, en el caso de que asi lo sean se procede a realizar la prueba de homocedasticidad de barlett.test de caso contrario se realiza la prueba de levene.test.
No-paramétricos: En el caso de que nuestros residuos no tengan una distribución normal pero nuestros datos si sean balanceados se utiliza la prueba de homocedasticidad de fligner.test, en caso de ser no balanceados se utiliza el cochran.test.
Ahora, es importante recalcar que en ciertos casos se debe hacer un cambio en el anova, si nuestras pruebas indican que el anova cumple con la normalidad pero no es balanceado se procede a cambiar el anova por un oneway.test y si los datos son no-paramétricos se cambia por un kruskal.test de los cuales obtengo el nuevo valor del estadístico.
Pruebas Post-hoc: El anova me indica si existe una diferencia significativa entre las varianzas pero no me dice entre cuales tratamientos, para ello utilizamos las pruebas a posteriori las cuales me indican cuales son exactamente estas diferencias. En el caso de pruebas que son parametricas, balanceadas y homocedasticas se utiliza el test de tukey, para aquellas que son paramétricas y no-balanceadas se utiliza el pairwise.t.test(p.adjust=“none”), para aquellas que son no-paramétricas se utiliza la prueba pairwise.wilcox con el detalle que aquellas que son balanceadas utilizan el p.adjust=“b” que proviene de “bonferroni”
Al realizar estas pruebas puedo ver entre cuales grupos existen diferencias significativas, simplemente observando el p.value, si este menor a 0,05 significa que si existe una diferencia.