Regresión lineal simple

Importar

Paquetes

library(pacman)
p_load("readr", "tidyverse", "DT")

Datos

  • Se tienen los datos de 60 cobayas a los cuales se les proporcionó Vitamina C en dos métodos distintos, ambos en mg por día y que les fueron recolectados los datos que expresan el crecimiento visto es sus dientes.
dientes <- read.csv("dientes.csv")
dientes
##    Cobayas Tamaño...mm Método Dosis
## 1        1         4.2     VC   0.5
## 2        2        11.5     VC   0.5
## 3        3         7.3     VC   0.5
## 4        4         5.8     VC   0.5
## 5        5         6.4     VC   0.5
## 6        6        10.0     VC   0.5
## 7        7        11.2     VC   0.5
## 8        8        11.2     VC   0.5
## 9        9         5.2     VC   0.5
## 10      10         7.0     VC   0.5
## 11      11        16.5     VC   1.0
## 12      12        16.5     VC   1.0
## 13      13        15.2     VC   1.0
## 14      14        17.3     VC   1.0
## 15      15        22.5     VC   1.0
## 16      16        17.3     VC   1.0
## 17      17        13.6     VC   1.0
## 18      18        14.5     VC   1.0
## 19      19        18.8     VC   1.0
## 20      20        15.5     VC   1.0
## 21      21        23.6     VC   2.0
## 22      22        18.5     VC   2.0
## 23      23        33.9     VC   2.0
## 24      24        25.5     VC   2.0
## 25      25        26.4     VC   2.0
## 26      26        32.5     VC   2.0
## 27      27        26.7     VC   2.0
## 28      28        21.5     VC   2.0
## 29      29        23.3     VC   2.0
## 30      30        29.5     VC   2.0
## 31      31        15.2     OJ   0.5
## 32      32        21.5     OJ   0.5
## 33      33        17.6     OJ   0.5
## 34      34         9.7     OJ   0.5
## 35      35        14.5     OJ   0.5
## 36      36        10.0     OJ   0.5
## 37      37         8.2     OJ   0.5
## 38      38         9.4     OJ   0.5
## 39      39        16.5     OJ   0.5
## 40      40         9.7     OJ   0.5
## 41      41        19.7     OJ   1.0
## 42      42        23.3     OJ   1.0
## 43      43        23.6     OJ   1.0
## 44      44        26.4     OJ   1.0
## 45      45        20.0     OJ   1.0
## 46      46        25.2     OJ   1.0
## 47      47        25.8     OJ   1.0
## 48      48        21.2     OJ   1.0
## 49      49        14.5     OJ   1.0
## 50      50        27.3     OJ   1.0
## 51      51        25.5     OJ   2.0
## 52      52        26.4     OJ   2.0
## 53      53        22.4     OJ   2.0
## 54      54        24.5     OJ   2.0
## 55      55        24.8     OJ   2.0
## 56      56        30.9     OJ   2.0
## 57      57        26.4     OJ   2.0
## 58      58        27.3     OJ   2.0
## 59      59        29.4     OJ   2.0
## 60      60        23.0     OJ   2.0
#VC: Vitamin C
#OJ: Orange Juice

Transformar

  • En este caso se extraen los datos que pueden resultar más importantes para saber si existe correlación entre el tamaño de la dósis proporcionada y el tamaño de los dientes de las cobayas.
tamaño <- as.numeric(dientes$Tamaño...mm)
dosis <- as.numeric(dientes$Dosis)
crecimiento <- data.frame(dosis, tamaño)
  • Gráfico de correlación, gráfico de pares
head(crecimiento)
##   dosis tamaño
## 1   0.5    4.2
## 2   0.5   11.5
## 3   0.5    7.3
## 4   0.5    5.8
## 5   0.5    6.4
## 6   0.5   10.0
pairs(crecimiento)

Modelar

Grado de correlación lineal

  • Matriz de coeficientes de correlación:
cor(crecimiento)
##            dosis    tamaño
## dosis  1.0000000 0.8026913
## tamaño 0.8026913 1.0000000

Cálculo y representación de la recta de mínimos cuadrados

  • La sintaxis requerida para este código, consiste en insertar la variable que está en función de otra (y ~ x), mientras que data = nombreVariable es la parte donde se le indica a R de que variabla de datos está sacando la información.
#Se construye un modelo con los datos proporcionados.
regresion <- lm(tamaño ~ dosis, data=crecimiento)
summary (regresion)
## 
## Call:
## lm(formula = tamaño ~ dosis, data = crecimiento)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.4496 -2.7406 -0.7452  2.8344 10.1139 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   7.4225     1.2601    5.89 2.06e-07 ***
## dosis         9.7636     0.9525   10.25 1.23e-14 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.601 on 58 degrees of freedom
## Multiple R-squared:  0.6443, Adjusted R-squared:  0.6382 
## F-statistic: 105.1 on 1 and 58 DF,  p-value: 1.233e-14
  • Entonces, la recta de mínimos cuadrados, sería la siguiente:

\[ y = 7.4225 + 9.7636 x \] ### Representación gráfica de la recta

#Se realiza la gráfica que permite observar el como la recta del modelo construido se ajusta 
#los datos proporcionados.
plot(crecimiento$dosis, crecimiento$tamaño,xlab = "Dósis", ylab = "Tamaño")
abline(regresion)

### Modelación de valores

#Se utiliza el modelo construido para predecir los valores que se tienen en el intervalo dado.
nuevas_dosis <- data.frame(dosis = seq (0.2, 0.4, by = 0.01))
predict(regresion, nuevas_dosis)
##         1         2         3         4         5         6         7         8 
##  9.375214  9.472850  9.570486  9.668121  9.765757  9.863393  9.961029 10.058664 
##         9        10        11        12        13        14        15        16 
## 10.156300 10.253936 10.351571 10.449207 10.546843 10.644479 10.742114 10.839750 
##        17        18        19        20        21 
## 10.937386 11.035021 11.132657 11.230293 11.327929

Redacción personal

La importancia de la vitamina C en el desarrollo de los seres vivos no es una sorpresa en absoluto, sin embargo, que tanto lo es para cada uno es algo más incierto. En el caso de las cobayas, según el estudio realizado, se puede notar que tiene un gran efecto sobre el desarrollo de sus dientes, pues en los 60 sujetos de prueba, mientras más grande era la dósis diaria, (medida en mg), mayor era la longitud en milímitros de estos, lo cuál también se puede notar gracias a la correlación que existe entre los datos y el como el modelo desarrollado se asemeja bastante a la realidad. Pero pese a que el estudio en el cuál se basa el análisis tiene al menos 60 años de antigüedad, es de saberse que trataba de un buen camino, ya que según información actual, la vitamina C debe constituir una parte importante en la dieta de esos animalitos, variando mucho en la cantidad que se les proporcionaba en la época del estudio, siendo 10 veces más grande hoy en día. Está dicho también que de no satisfacerse esa necesidad, las cobayas pueden presentar problemas de salud que van desde la caída de los dientes hasta hemorragias musculares o inmovilidad.

Referencias