Importa uno de los conjuntos de datos usados en las actividades previas (Iris, Auto o Heart Disease UCI).

Se trabajará nuevamente con los datos de iris.

x<-"C:/Users/aacad/OneDrive/Documents/ADRIANA/FCPYS/R COMO INSTRUMENTO DE INVESTIGACION/a4_iris.csv"
y<-read.csv(x,as.is = TRUE)
str(y)
## 'data.frame':    150 obs. of  5 variables:
##  $ sepal.length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
##  $ sepal.width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
##  $ petal.length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
##  $ petal.width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
##  $ variety     : chr  "Setosa" "Setosa" "Setosa" "Setosa" ...
summary(y)
##   sepal.length    sepal.width     petal.length    petal.width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
##    variety         
##  Length:150        
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

#Formula una pregunta predictiva derivada de un patrón identificado en tu EDA o tu análisis inferencial previo.

Con base al estudio previo de la base, utilizaremos esta pregunta de investigación:

¿Se puede predecir el ancho del pétalo a partir de su longitud?

Elige el tipo de modelo. Se empleará un modelo lineal, porque la variable respuesta es numérica.

A continuación, se ajusta el modelo.

modelo<-lm(y$petal.width~y$petal.length)
summary(modelo)
## 
## Call:
## lm(formula = y$petal.width ~ y$petal.length)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.56515 -0.12358 -0.01898  0.13288  0.64272 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    -0.363076   0.039762  -9.131  4.7e-16 ***
## y$petal.length  0.415755   0.009582  43.387  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2065 on 148 degrees of freedom
## Multiple R-squared:  0.9271, Adjusted R-squared:  0.9266 
## F-statistic:  1882 on 1 and 148 DF,  p-value: < 2.2e-16

El modelo lineal permite explicar la relación entre las variables involucradas, asimismo el modelo explica el 93% de la variación y la pendiente nos indica que por cada unidad que incrementa el largo del pétalo su ancho incrementa en 0.42 unidades.

#Este modelo permite entender y predecir la relación entre las variables involucradas y el ancho del pétalo.