library(haven)
library(readr)
library(ggplot2)
library(readxl)
Contiene los datos del número de horas a la semana dedicadas al estudio de la asignatura de econometría {x} reportadas por 100 estudiantes y su respectiva nota final {y}.
file.choose()
base<- read_excel("C:\\Users\\Lenovo\\Documents\\base de datos 1.xlsx")
View(base)
data_y <- base$y
data_X <- base$X
mod1 <- lm(data_y ~ data_X
summary(mod1)
En este modelo el R cuadrado dió apróx. 0.959, nos muestra que explica el 95.9 % de la variabilidad que hay en y. El R cuadrado ajustado es 0.9585 que dice el 95.85% de la variabilidad en Y ajustado por la cantidad de variables X. El valor-p obtenido fue de < 0.00000000000000022, lo que indica que el modelo es significativo, ya que es un número muy bajo.
x11() plot(data_X, data_y, xlab = "Horas de estudio", ylab = "Nota final", main = "Relación entre horas de estudio y notas finales", col = c("#C625B7","#3AE7F9","#B214F2"))
abline(mod1, col = "red")
La gráfica muestra que hay un gran relación entre las notas que saca un estudiante y las horas de estudio empleadas. Los errores no estan tan alejados de la media, o sea, de la línea de regresión simple.