Prueba de hipótesis para un experimento
El virus de inmunodeficiencia humana (VIH) daña el sistema inmunitario dejando el cuerpo en riesgo de sufrir otras infecciones graves. El SIDA (Síndrome de inmnodeficiencia adquirida) es una enfermedad infecciosa causada por el VIH, ocurre cuando el sistema inmunitario está muy dañado. No todas las personas con VIH desarrollan SIDA. En méxico se estiman desde el año 1983 hasta el 2020 un total de 313 969 casos.
Se utilizarán datos de google trends para analizar si existe una relación entre las búsquedas de VIH y SIDA en México en los últimos 5 años.
Virus de Inmunodeficiencia humana
Fuente SSA/SUIVE/DGE/DVEET/Sistema Especial de Vigilancia Epidemiológica de VIH
Importar
bibliotecas y datos
library(readr)
library(DT)
library(prettydoc)
setwd("~/EAMJ1130")
datos <- read_csv("datos.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## VIH = col_double(),
## SIDA = col_double()
## )
Visualizar
Tabla
Tabla interactiva con todos los datos
datatable(datos)Gráficas
- Explorar la relación que existe entre las variables por medio de una matriz de diagramas de dispersión
pairs(datos) ## Modelar
Coeficiente de correlación Pearson
¿Existe alguna relación?
- Matriz de coeficientes de correlación
cor(datos)## VIH SIDA
## VIH 1.0000000 0.6516717
## SIDA 0.6516717 1.0000000
Con un índice de correlación pearson de 0.65 se determina que existe una correlación, más no necesariamente una casualidad.
Cálculo y representación de la recta de mínimos cuadrados
regresion = lm (SIDA ~ VIH, data=datos )
summary(regresion)##
## Call:
## lm(formula = SIDA ~ VIH, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.4277 -3.9612 -0.6764 3.1904 21.0449
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.18550 1.29614 4.001 8.25e-05 ***
## VIH 0.64242 0.04646 13.827 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.462 on 259 degrees of freedom
## Multiple R-squared: 0.4247, Adjusted R-squared: 0.4225
## F-statistic: 191.2 on 1 and 259 DF, p-value: < 2.2e-16
Ecuación de la recta de mínimos cuadrados
\[ y= 5.18550 + 0.64242x \] Con esta ecuación se pueden modelar y predecir valores