1. Estadística paramétrica y no paramétrica

La estadística paramétrica es un conjunto de pruebas estadísticas que asumen que los datos siguen una distribución específica, generalmente normal. Utilizan parámetros como la media y la desviación estándar.

En cambio, la estadística no paramétrica no requiere asumir normalidad ni distribuciones específicas. Se basa en rangos u ordenamientos y es útil cuando los datos no cumplen supuestos paramétricos o cuando la muestra es pequeña.

¿Para qué sirven?

Tipo Finalidad
Paramétrica Comparar medias, varianzas o relaciones en datos con distribución normal
No paramétrica Evaluar diferencias o asociaciones sin necesidad de normalidad

Cuadro Comparativo

Característica Paramétrica No Paramétrica
Uso de parámetros Sí (media, varianza) No (rangos, frecuencias)
Supuesto de normalidad Requerido No requerido
Escala de medición Intervalo / razón Ordinal / nominal / no normal
Potencia estadística Alta (cuando se cumplen supuestos) Menor
Ejemplos t de Student, ANOVA, Pearson U Mann-Whitney, Kruskal-Wallis, Spearman

Ejercicio 2: Realice las pruebas de normalidad a las variables que se detallan a continuación y exprese su decisión de cada una de ellas.Estas pruebas se realizarán utilizando el software R con análisis de tipo gráfico y formal.

# Datos
a=c(28,26,31,21,21,32,24,26,28,30,26,23,20,28,33,28,33,23,27,31,28,29,34,32,33)
b=c(22,29,24,24,23,23,25,23,33,28,31,23,28,28,26,30,30,28,22,19,29,18,31,28,27)
c=c(23,26,29,28,25,19,22,27,33,22,22,22,15,19,24,25,20,25,34,21,23,18,26,26,23)
d=c(28,28,25,25,25,30,27,28,29,28,25,28,27,28,30,25,28,28,28,30,27,25,25,28,30)
e=c(28,27,28,25,27,28,25,27,29,27,25,25,29,29,29,28,28,25,27,28,28,25,29,25,27)
f=c(25,28,27,29,27,25,25,25,25,27,27,28,28,25,27,27,25,25,27,28,25,28,29,25,27)

vars=list(a=a,b=b,c=c,d=d,e=e,f=f)

library(ggplot2)

# Gráfico y prueba Shapiro-Wilk
for(name in names(vars)){
  cat("\n\n### Variable:", name, "\n")

  x <- vars[[name]]

  # Histograma
  hist(x, main=paste("Histograma", name), xlab=name)

  # QQPlot
  qqnorm(x, main=paste("QQPlot", name))
  qqline(x)

  # Prueba de Shapiro-Wilk
  print(shapiro.test(x))
}
## 
## 
## ### Variable: a

## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.94766, p-value = 0.2219
## 
## 
## 
## ### Variable: b

## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.96162, p-value = 0.4477
## 
## 
## 
## ### Variable: c

## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.97045, p-value = 0.6566
## 
## 
## 
## ### Variable: d

## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.85145, p-value = 0.001877
## 
## 
## 
## ### Variable: e

## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.8403, p-value = 0.001159
## 
## 
## 
## ### Variable: f

## 
##  Shapiro-Wilk normality test
## 
## data:  x
## W = 0.82721, p-value = 0.0006703
# Ejercicio 3:Realice el análisis de varianza de los siguientes datos y exprese sus resultados según corresponda. No olvide hacer el gráfico

A=c(21,26,31,23,21,30,26,24,22,19)
B=c(32,30,18,27,25,28,27,27,28,22)
C=c(26,20,24,27,21,28,24,27,32,32)
D=c(18,30,24,27,24,21,22,22,28,29)

grupo=factor(rep(c("A","B","C","D"),each=10))
valores=c(A,B,C,D)

datos=data.frame(grupo,valores)

# ANOVA
modelo=aov(valores ~ grupo, data=datos)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)
## grupo        3   34.9   11.62    0.74  0.535
## Residuals   36  565.9   15.72
# Gráfico
boxplot(valores ~ grupo, col="lightblue", main="Comparación entre grupos")

##Interpretación:Dado que p > 0.05, no existe evidencia estadísticamente significativa para rechazar la hipótesis nula. Por lo tanto, no hay diferencias significativas entre las medias de los grupos A, B, C y D. 

  
  #Ejercicio 4:El consejo de la ciudad de Tamazula considera aumentar el número de policías en un esfuerzo para reducir los delitos. Antes de tomar una decisión final, el ayuntamiento pide al jefe de policía realizar una encuesta en otras ciudades de tamaño similar para determinar la relación entre el número de policías y el número de delitos reportados. El jefe de policía reunió la siguiente información muestral

policias=c(4,1,3,6,6,8,3,2)
delitos=c(7,5,4,6,5,4,7,4)

cor(policias,delitos, method="pearson")
## [1] -0.05911884
# Gráfico
plot(policias, delitos, pch=19,
     xlab="Número de policías",
     ylab="Número de delitos",
     main="Diagrama de dispersión policías vs delitos")
abline(lm(delitos ~ policias), lwd=2)