La estadística paramétrica es un conjunto de pruebas estadísticas que asumen que los datos siguen una distribución específica, generalmente normal. Utilizan parámetros como la media y la desviación estándar.
En cambio, la estadística no paramétrica no requiere asumir normalidad ni distribuciones específicas. Se basa en rangos u ordenamientos y es útil cuando los datos no cumplen supuestos paramétricos o cuando la muestra es pequeña.
| Tipo | Finalidad |
|---|---|
| Paramétrica | Comparar medias, varianzas o relaciones en datos con distribución normal |
| No paramétrica | Evaluar diferencias o asociaciones sin necesidad de normalidad |
| Característica | Paramétrica | No Paramétrica |
|---|---|---|
| Uso de parámetros | Sí (media, varianza) | No (rangos, frecuencias) |
| Supuesto de normalidad | Requerido | No requerido |
| Escala de medición | Intervalo / razón | Ordinal / nominal / no normal |
| Potencia estadística | Alta (cuando se cumplen supuestos) | Menor |
| Ejemplos | t de Student, ANOVA, Pearson | U Mann-Whitney, Kruskal-Wallis, Spearman |
# Datos
a=c(28,26,31,21,21,32,24,26,28,30,26,23,20,28,33,28,33,23,27,31,28,29,34,32,33)
b=c(22,29,24,24,23,23,25,23,33,28,31,23,28,28,26,30,30,28,22,19,29,18,31,28,27)
c=c(23,26,29,28,25,19,22,27,33,22,22,22,15,19,24,25,20,25,34,21,23,18,26,26,23)
d=c(28,28,25,25,25,30,27,28,29,28,25,28,27,28,30,25,28,28,28,30,27,25,25,28,30)
e=c(28,27,28,25,27,28,25,27,29,27,25,25,29,29,29,28,28,25,27,28,28,25,29,25,27)
f=c(25,28,27,29,27,25,25,25,25,27,27,28,28,25,27,27,25,25,27,28,25,28,29,25,27)
vars=list(a=a,b=b,c=c,d=d,e=e,f=f)
library(ggplot2)
# Gráfico y prueba Shapiro-Wilk
for(name in names(vars)){
cat("\n\n### Variable:", name, "\n")
x <- vars[[name]]
# Histograma
hist(x, main=paste("Histograma", name), xlab=name)
# QQPlot
qqnorm(x, main=paste("QQPlot", name))
qqline(x)
# Prueba de Shapiro-Wilk
print(shapiro.test(x))
}
##
##
## ### Variable: a
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.94766, p-value = 0.2219
##
##
##
## ### Variable: b
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.96162, p-value = 0.4477
##
##
##
## ### Variable: c
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.97045, p-value = 0.6566
##
##
##
## ### Variable: d
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.85145, p-value = 0.001877
##
##
##
## ### Variable: e
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.8403, p-value = 0.001159
##
##
##
## ### Variable: f
##
## Shapiro-Wilk normality test
##
## data: x
## W = 0.82721, p-value = 0.0006703
# Ejercicio 3:Realice el análisis de varianza de los siguientes datos y exprese sus resultados según corresponda. No olvide hacer el gráfico
A=c(21,26,31,23,21,30,26,24,22,19)
B=c(32,30,18,27,25,28,27,27,28,22)
C=c(26,20,24,27,21,28,24,27,32,32)
D=c(18,30,24,27,24,21,22,22,28,29)
grupo=factor(rep(c("A","B","C","D"),each=10))
valores=c(A,B,C,D)
datos=data.frame(grupo,valores)
# ANOVA
modelo=aov(valores ~ grupo, data=datos)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## grupo 3 34.9 11.62 0.74 0.535
## Residuals 36 565.9 15.72
# Gráfico
boxplot(valores ~ grupo, col="lightblue", main="Comparación entre grupos")
##Interpretación:Dado que p > 0.05, no existe evidencia estadísticamente significativa para rechazar la hipótesis nula. Por lo tanto, no hay diferencias significativas entre las medias de los grupos A, B, C y D.
#Ejercicio 4:El consejo de la ciudad de Tamazula considera aumentar el número de policías en un esfuerzo para reducir los delitos. Antes de tomar una decisión final, el ayuntamiento pide al jefe de policía realizar una encuesta en otras ciudades de tamaño similar para determinar la relación entre el número de policías y el número de delitos reportados. El jefe de policía reunió la siguiente información muestral
policias=c(4,1,3,6,6,8,3,2)
delitos=c(7,5,4,6,5,4,7,4)
cor(policias,delitos, method="pearson")
## [1] -0.05911884
# Gráfico
plot(policias, delitos, pch=19,
xlab="Número de policías",
ylab="Número de delitos",
main="Diagrama de dispersión policías vs delitos")
abline(lm(delitos ~ policias), lwd=2)