U1A3

Rosa Gonzalez

07/02/2021

Prueba de hipótesis para un experimento

El virus de inmunodeficiencia humana (VIH) daña el sistema inmunitario dejando el cuerpo en riesgo de sufrir otras infecciones graves. El SIDA (Síndrome de inmnodeficiencia adquirida) es una enfermedad infecciosa causada por el VIH, ocurre cuando el sistema inmunitario está muy dañado. No todas las personas con VIH desarrollan SIDA. En méxico se estiman desde el año 1983 hasta el 2020 un total de 313 969 casos.

Se utilizarán datos de google trends para analizar si existe una relación entre las búsquedas de VIH y SIDA en México en los últimos 5 años.

Virus de Inmunodeficiencia humana

Fuente SSA/SUIVE/DGE/DVEET/Sistema Especial de Vigilancia Epidemiológica de VIH

Importar

bibliotecas y datos

library(readr) 
library(DT) 
library(prettydoc) 
setwd("~/EAMJ1130")
datos <- read_csv("datos.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   VIH = col_double(),
##   SIDA = col_double()
## )

Visualizar

Tabla

Tabla interactiva con todos los datos

datatable(datos)

Gráficas

  • Explorar la relación que existe entre las variables por medio de una matriz de diagramas de dispersión
pairs(datos)

## Modelar

Coeficiente de correlación Pearson

¿Existe alguna relación?

  • Matriz de coeficientes de correlación
cor(datos)
##            VIH      SIDA
## VIH  1.0000000 0.6516717
## SIDA 0.6516717 1.0000000

Con un índice de correlación pearson de 0.65 se determina que existe una correlación, más no necesariamente una casualidad.

Cálculo y representación de la recta de mínimos cuadrados

regresion = lm (SIDA ~ VIH, data=datos )
summary(regresion)
## 
## Call:
## lm(formula = SIDA ~ VIH, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -18.4277  -3.9612  -0.6764   3.1904  21.0449 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  5.18550    1.29614   4.001 8.25e-05 ***
## VIH          0.64242    0.04646  13.827  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.462 on 259 degrees of freedom
## Multiple R-squared:  0.4247, Adjusted R-squared:  0.4225 
## F-statistic: 191.2 on 1 and 259 DF,  p-value: < 2.2e-16

Ecuación de la recta de mínimos cuadrados

\[ y= 5.18550 + 0.64242x \] Con esta ecuación se pueden modelar y predecir valores