## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Warning: package 'lmtest' was built under R version 4.1.1
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.1.1
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

SELECCIÓN DEL TEMA Y ANÁLISIS EXPLORATORIO DE LOS DATOS

Selección del tema

El uso de las tecnologías de la comunicación se venía incrementando y debido a la pandemia que trajo el SARS CoV-2 se aceleró exponencialmente, en un estudio de la Universidad de la Costa CUC publicado en el 2017, se señala que hay un incremento en el consumo de telefonía celular entre los jóvenes al igual que las diversas aplicaciones como medio de distracción o entretenimiento, lo que habría iniciado con una nueva configuración de cultura juvenil, en las que obviamente se incluye los nuevos movimientos tecnológicos y formas móviles de expresión, si esto ya era un tema e investigación en aquel año, habrá que pensar por un momento lo que se revolucionó en este último año y cuál será el futuro de los medios de comunicación entre los adolescentes y niños. (Herrera, Acuña, & Gil, 2017)

El tema del proyecto se centra en observar el uso del teléfono móvil en los estudiantes de 5to semestre de la carrera de Economía Industrial de la ENES, León, para esto se pretende hacer un análisis de distintas variables como la edad, las horas en las que pasa el alumno en su casa y las redes sociales que utiliza en las redes sociales.

Justificación

Hoy en día es difícil concebir un mundo sin telefonía móvil, tal como se menciona en un estudio de la Universidad de Málaga, titulado “Una semana sin smartphone: usos, abuso y dependencia del teléfono móvil en jóvenes” en el que se afirma que: “Los jóvenes apenas utilizan su dispositivo para realizar llamadas o comunicarse por mensajes de texto, un uso que ha sido relegado a favor de la mensajería instantánea y de las redes sociales. También es frecuente el uso del dispositivo para la reproducción de música en streaming a través de plataformas como Spotify; para estar informado de la actualidad; o, en definitiva, para realizar cualquiera de las actividades o tareas de su rutina diaria…” Esto lleva a tener una sociedad cada vez más móvil entre los jóvenes y la empresa Telefónica en 2019 le denomino generación “mute”, caracterizada por hablar poco y utilizar como canal de comunicación las diversas herramientas de las redes sociales. Citado en (González, Córdiba, & Gómez, 2020, pág. 2) En este mismo estudio se realizó una encuesta entre los jóvenes, la pregunta era ¿Crees que podrías vivir sin tu teléfono móvil?, a la cual se obtuvieron estos resultados:

Según Felices, M. (2013), afirma que los usuarios adoptan consciente o inconscientemente las nuevas tecnologías a sus vidas, pero qué pasa si una vez que los jóvenes se han adaptado al uso de repente ya no tuvieran acceso a ello, cuáles serían los riesgos asociados por la falta de su medio favorito de comunicación para ellos, se ha de resaltar lo que se encontró en el estudio referido en supra líneas, una vez que se experimentó con grupos de jóvenes quienes se sometieron a una semana sin conexión y éstas fueron algunas de sus expresiones:

  • Una gestión más productiva del tiempo, que se distribuye en actividades antes relegadas: hacer deporte, leer, centrarse en las tareas académicas o una mayor interacción directa con el entorno, entre las principales.
  • He tenido más tiempo libre para realizar mis obligaciones como alumno, para hacer ejercicio e interaccionar en persona.
  • Más relajada y tranquila, más concentrada y con más tiempo. Las horas cunden más, por lo que se hacen más productivas. Cuando estás con la gente de tu entorno estás más presente.
  • El móvil me ayuda a organizarme y a no fallar en ninguna entrega. Lo utilizo de agenda y me sirve para recordar todo lo que tengo que hacer.
  • Aburrimiento, incomodidad, soledad, aislamiento, exclusión social, dependencia, etc.
  • Desinformación, exclusión social, incomodidad, ansiedad y dependencia de otros dispositivos para hacer cualquier actividad que con el móvil es más rápida.
  • Me sentía incomunicada, dependía de mis compañeros para las tareas de la universidad y me dio la sensación de resultar pesada.
  • Yo pensaba que iba a ser como la droga, que iba a estar con ansiedad por no usar el teléfono y realmente ha sido como una liberación. Había veces que incluso lo dejaba en el coche y me olvidaba de él completamente.

Décadas atrás se abordaba este tema, y no hay duda de que las posturas siguen siendo muy parecidas: “las nuevas tecnologías de la comunicación e información han tenido un profundo impacto en la sociedad. (World Bank, 2008)” […] “tienen un gran efecto, especialmente entre los jóvenes, cambiando sus estilos de vida. (Tapscott, 1998; Chu, 1997)” […] “La Teoría de la Difusión de Innovaciones (TDI) ayuda a entender cómo es el proceso de adopción de innovaciones por parte de los individuos, sistematizando el comportamiento de las personas en cuatro etapas: conocimiento, formación de actitud, decisión, implementación y confirmación. (Rogers, 1995)”. Así que habrá que entender y atender las nuevas generaciones y su evolución ante el uso y abuso de la comunicación digital”. Citados en (Weezel & Benavides, 2009)

La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable dependiente o respuesta (Y) se determina a partir de un conjunto de variables independientes llamadas predictores (\(X_1, X_2, X_3, …, X_i\)). Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable dependiente o para evaluar la influencia que tienen los predictores sobre ella. Los modelos lineales múltiples siguen la siguiente ecuación: \(Yi=(β_0+β_1X_{1i}+β_2X_{2i}+⋯+β_nX_{ni})+u_i\)

\(β_0\): es la ordenada en el origen, el valor de la variable dependiente Y cuando todos los predictores son cero. \(β_i\): es el efecto promedio que tiene el incremento en una unidad de la variable predictora \(X_i\) sobre la variable dependiente Y, manteniéndose constantes el resto de variables. Se conocen como coeficientes parciales de regresión. eiemplo: es el residuo o error, la diferencia entre el valor observado y el estimado por el modelo.

Datos

Los datos se obtendrán mediante una encuesta realizada por Google Forms, la cual contiene 3 preguntas (nombre, edad, cuántas horas permanece en su casa) y adicionalmente una captura de pantalla donde se visualice el uso total de su teléfono móvil, así como también la red social más usada.

Datos obtenidos

tabla<-read.csv("Datos.csv")
tabla
##          Yi X1 X2 D1 D2 D3
## 1  4.566600 20 24  1  0  0
## 2  6.766600 21 24  1  0  0
## 3  3.833300 25 13  1  0  0
## 4  2.383300 20 24  0  0  1
## 5  4.550000 25 11  0  0  1
## 6  0.866600 20 11  0  0  1
## 7  3.583300 20 13  0  0  1
## 8  1.883300 22  9  0  0  1
## 9  8.616700 21 24  0  0  1
## 10 6.916700 22 13  0  0  1
## 11 2.766700 23 24  0  0  1
## 12 1.500000 21  5  1  0  0
## 13 5.633300 20 13  0  1  0
## 14 6.900000 26 13  0  1  0
## 15 5.550000 20 11  0  1  0
## 16 5.733330 20 13  0  1  0
## 17 7.116660 20 13  0  0  1
## 18 5.816660 20 24  0  0  1
## 19 8.583330 23 13  0  0  1
## 20 7.300000 23  9  0  0  1
## 21 1.966660 25 24  0  0  1
## 22 3.183330 23 24  0  0  1
## 23 2.333330 22 13  0  0  1
## 24 3.360000 20 24  0  0  1
## 25 9.800000 20  5  0  0  1
## 26 5.750000 21 24  0  0  1
## 27 5.280000 22  9  0  0  1
## 28 6.230000 20 11  0  0  1
## 29 3.730000 21 13  0  0  1
## 30 4.610000 20 11  0  1  0
## 31 4.750000 22 24  0  0  1
## 32 8.833333 22 13  1  0  0
## 33 3.250000 20 24  0  1  0
## 34 5.900000 21 11  0  0  1
## 35 9.966666 21  9  0  1  0
## 36 8.533333 21 11  0  0  1
## 37 4.466666 22 24  0  0  1
## 38 4.400000 23  5  0  0  1
## 39 7.750000 20 24  0  0  1
## 40 5.060000 20 24  0  0  1
## 41 5.760000 21 24  0  0  1
## 42 5.320000 21 24  1  0  0
## 43 8.630000 20  7  0  0  1
## 44 1.620000 22 13  1  0  0
## 45 8.130000 21  5  0  1  0

Variables

En el modelo se utilizaran 5 variables independientes, de las cuales 2 son cuantitativas y 3 son dicótomas, el modelo quedaría como:

\(Y_i=B_1 X_1 + B_2 X_2 + B_3 D_1 + B_4 D_2 + B_5 D_3 + u_i\)

\(Y_i\) : Número de horas de uso del dispositivo

\(X_1\) : Edad en años de los alumnos

\(X_2\) : Número de horas que permanece en su casa

\(D_1\) : Facebook

\(D_2\) : Instagram

\(D_3\) : WhatsApp

Pregunta de investigación

¿Cómo afecta el número de horas en casa al tiempo dedicado al uso del teléfono móvil y cuál es la red social (FB, IG y WA) que más utilizan en el tiempo total de uso?

Diagrama de dispersión

RELACIÓN ENTRE \(Y_i\) Y \(X_1\)

plot(data=tabla,Yi~X1)
modelo1<-lm(Yi~X1,data=tabla)
abline(modelo1)

En el diagrama de dispersión podemos ver que la mayor parte de los datos se instala en un uso de \(6\) horas, donde la mayoría de los alumnos se encuentra en un rango de \(20\) a \(21\) años, también del diagrama podemos tomar que conforme la edad va aumentando, el uso del teléfono se reduce.

RELACIÓN ENTRE \(Y_i\) Y \(X_2\)

plot(data=tabla,Yi~X2)
modelo1.2 <- lm(Yi~X2, data=tabla)
abline(modelo1.2)

En el diagrama se puede ver claramente como es que el uso del teléfono se ve reducido mientras menos tiempo pasen en casa, por ejemplo, si el alumno se encuentra más de \(20\) horas en casa, usan su teléfono entre \(4\) a \(6\) horas, cuando una persona que no esta en su casa, el uso del teléfono también se reduce en la mayor parte de los casos.

RELACIÓN ENTRE \(Y_i\) Y \(D_1\)

plot(data=tabla,Yi~D1)
modelo1.3 <- lm(Yi~D1, data=tabla)
abline(modelo1.3)

Las variables dicótomas que nos muestra el modelo podemos ver que el diagrama sale del modo que si estas en el \(1.0\) es porque Facebook era la red más utilizada.

RELACIÓN ENTRE \(Y_i\) Y \(D_2\)

plot(data=tabla,Yi~D2)
modelo1.3 <- lm(Yi~D2, data=tabla)
abline(modelo1.3)

Para este diagrama vemos que, si los alumnos usan más Instagram, el diagrama abarca esas pocas muestras en el \(1.0\).

RELACIÓN ENTRE \(Y_i\) Y \(D_3\)

plot(data=tabla,Yi~D3)
modelo1.4 <- lm(Yi~D3, data=tabla)
abline(modelo1.4)

En esta variable dicotómica, tenemos la mayor parte de los datos en \(1.0\) porque la mayoría de los alumnos usan más WhatsApp como la Red social más utilizada.

Supuestos del modelo de regresión lineal

  1. El modelo de regresión es lineal en los parámetros.
  2. Valores fijos de \(X\) o independientes del termino de error \(Cov( X_{2i}, u_i) = Cov( X_{3i}, u_i)= . . . = Cov( X_{ki}, u_i) = 0\)
  3. Valor medio de la perturbación es igual a cero \(E(u_i, X_{2i}, X_{3i}...X_{ki})=0\)
  4. Homoscedasticidad -> \(VAR (M_i) = σ²\)
  5. No autocorrelación entre las perturbaciones. \(Cov( ui, uj) =0\), \(u≠y\)
  6. El número de observaciones debe ser mayor a \(k\)
  7. Debemos tener variación en los valores de \(X\).
  8. No debe haber colinealidad exacta entre las variables \(X\). No podemos tener algún \(X_{ji}= C₂X_₂i + C_3 X_{3i} + ... + C_kX_{ki}\)
  9. No hay sesgo de especificación. (ES dificil de comprobar ya en la práctica).

ESTIMACIÓN DE PARÁMETROS, INFERENCIA Y ESPECIFICACIÓN DEL MODELO

Desarrolla un modelo de regresión lineal múltiple que estime una variable numérica, a través de variables explicativas.

\(Y_i = β_1X_{1i} + β_2X_{2i} + β_3D_{1i} + β_4D_{2i}+ β_5D_{3i}+u_i\)

modelo<-lm(Yi~0+X1+X2+D1+D2+D3,data=tabla)
summary(modelo)
## 
## Call:
## lm(formula = Yi ~ 0 + X1 + X2 + D1 + D2 + D3, data = tabla)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.9701 -1.7052  0.0448  1.5686  4.0251 
## 
## Coefficients:
##    Estimate Std. Error t value Pr(>|t|)  
## X1 -0.18109    0.22885  -0.791   0.4334  
## X2 -0.06319    0.05309  -1.190   0.2409  
## D1  9.61365    5.20840   1.846   0.0723 .
## D2 10.80652    4.98492   2.168   0.0362 *
## D3 10.15358    5.08177   1.998   0.0525 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.376 on 40 degrees of freedom
## Multiple R-squared:  0.8516, Adjusted R-squared:  0.833 
## F-statistic: 45.89 on 5 and 40 DF,  p-value: 1.582e-15

Calcula los siguientes parámetros: \(β_1, β_2, β_3, β_4, β_5\). Calcula sus intervalos de confianza.

\(β_1 = -0.18109\)

\(β_2 = -0.06319\)

\(β_3 = 9.61365\)

\(β_4 = 10.80652\)

\(β_5 = 10.15358\)

betaX1 <- -0.18109

t2 <- qt(0.975, df=40)

bX1_li <- (betaX1-t2*0.22885)
bX1_li
## [1] -0.6436131
bX1_ld <- (betaX1+t2*0.22885)
bX1_ld
## [1] 0.2814331

El intervalo de confianza de \(β_1\) es \((-0.6436131, 0.2814331)\). Como el 0 queda dentro del intervalo, se dice que el modelo no es significativo.

betaX2 <- -0.06319

t2 <- qt(0.975, df=40)

bX2_li <- (betaX2-t2*0.05309)
bX2_li
## [1] -0.1704889
bX2_ld <- (betaX2+t2*0.05309)
bX2_ld
## [1] 0.04410889

El intervalo de confianza de \(β_2\) es \((-0.1704889, 0.04410889)\). Como el 0 queda dentro del intervalo, se dice que el modelo no es significativo.

betaD1 <- 9.61365 

t2 <- qt(0.975, df=40)

bD1_li <- (betaD1-t2*5.20840)
bD1_li
## [1] -0.9129191
bD1_ld <- (betaD1+t2*5.20840)
bD1_ld
## [1] 20.14022

El intervalo de confianza de \(β_3\) es \((-0.9129191, 20.14022)\). Como el 0 queda dentro del intervalo, se dice que el modelo no es significativo.

betaD2 <- 10.80652  

t2 <- qt(0.975, df=40)

bD2_li <- (betaD2-t2*4.98492)
bD2_li
## [1] 0.7316209
bD2_ld <- (betaD2+t2*4.98492)
bD2_ld
## [1] 20.88142

El intervalo de confianza de \(β_4\) es \((0.7316209, 20.88142)\). Como el 0 queda fuera del intervalo, se dice que el modelo es significativo.

betaD3 <- 10.15358  

t2 <- qt(0.975, df=40)

bD3_li <- (betaD3-t2*5.08177)
bD3_li
## [1] -0.1170603
bD3_ld <- (betaD3+t2*5.08177)
bD3_ld
## [1] 20.42422

El intervalo de confianza de \(β_5\) es \((-0.1170603, 20.42422)\). Como el 0 queda dentro del intervalo, se dice que el modelo no es significativo.

Grafica \(u_i\). Observa si los puntos de la gráfica son aleatorios o si existe un sesgo.

predict(modelo)
##        1        2        3        4        5        6        7        8 
## 4.475268 4.294180 4.264946 5.015196 4.931258 5.836699 5.710314 5.600908 
##        9       10       11       12       13       14       15       16 
## 4.834108 5.348138 4.471932 5.494839 6.363255 5.276726 6.489640 6.363255 
##       17       18       19       20       21       22       23       24 
## 5.710314 5.015196 5.167050 5.419820 4.109755 4.471932 5.348138 5.015196 
##       25       26       27       28       29       30       31       32 
## 6.215854 4.834108 5.600908 5.836699 5.529226 6.489640 4.653020 4.808210 
##       33       34       35       36       37       38       39       40 
## 5.668137 5.655611 6.434937 5.655611 4.653020 5.672590 5.015196 5.015196 
##       41       42       43       44       45 
## 4.834108 4.294180 6.089469 4.808210 6.687707
tabla1<-read.csv("DatosU.csv")
tabla2<- mutate(tabla1,u=Yi-Ye)
tabla2
##          Yi       Ye         u
## 1  4.566600 4.475268  0.091332
## 2  6.766600 4.294180  2.472420
## 3  3.833300 4.264946 -0.431646
## 4  2.383300 5.015196 -2.631896
## 5  4.550000 4.931258 -0.381258
## 6  0.866600 5.836699 -4.970099
## 7  3.583300 5.710314 -2.127014
## 8  1.883300 5.600908 -3.717608
## 9  8.616700 4.834108  3.782592
## 10 6.916700 5.348138  1.568562
## 11 2.766700 4.471932 -1.705232
## 12 1.500000 5.494839 -3.994839
## 13 5.633300 6.363255 -0.729955
## 14 6.900000 5.276726  1.623274
## 15 5.550000 6.489640 -0.939640
## 16 5.733330 6.363255 -0.629925
## 17 7.116660 5.710314  1.406346
## 18 5.816660 5.015196  0.801464
## 19 8.583330 5.167050  3.416280
## 20 7.300000 5.419820  1.880180
## 21 1.966660 4.109755 -2.143095
## 22 3.183330 4.471932 -1.288602
## 23 2.333330 5.348138 -3.014808
## 24 3.360000 5.015196 -1.655196
## 25 9.800000 6.215854  3.584146
## 26 5.750000 4.834108  0.915892
## 27 5.280000 5.600908 -0.320908
## 28 6.230000 5.836699  0.393301
## 29 3.730000 5.529226 -1.799226
## 30 4.610000 6.489640 -1.879640
## 31 4.750000 4.653020  0.096980
## 32 8.833333 4.808210  4.025123
## 33 3.250000 5.668137 -2.418137
## 34 5.900000 5.655611  0.244389
## 35 9.966666 6.434937  3.531729
## 36 8.533333 5.655611  2.877722
## 37 4.466666 4.653020 -0.186354
## 38 4.400000 5.672590 -1.272590
## 39 7.750000 5.015196  2.734804
## 40 5.060000 5.015196  0.044804
## 41 5.760000 4.834108  0.925892
## 42 5.320000 4.294180  1.025820
## 43 8.630000 6.089469  2.540531
## 44 1.620000 4.808210 -3.188210
## 45 8.130000 6.687707  1.442293
plot(tabla2$u)

Como se observa en la gráfica las perturbaciones son aleatorias y rondan entorno al 0, evidenciando que no existe un sesgo en los datos.

Calcula \[\sum_{i=1}^{n}û_i\] Interpreta el significado de tu resultado.

sum(tabla2$u)
## [1] -2e-06

Como se observa el resultado la sumatoria de las perturbaciones es un número cercano a \(0\), y como se sabe, una de las propiedades de los MCO es que sea 0, esto nos ayuda a ver que el modelo está bien y además nos indica que se minimizaron los residuos con los estimadores obtenidos.

Calcula el estadístico de Durbin Watson. Interpreta este

dwtest(modelo)
## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 1.7848, p-value = 0.2106
## alternative hypothesis: true autocorrelation is greater than 0

De acuerdo a las tablas de Durbin Watson, los valores aproximados son \(d_L=1.287\) y \(d_U=1.776\) ya que se habla de 45 observaciones y 5 parámetros.

El estadístico de Dubin Watson es aproximadamente \(1.7848\). Valor que está entre el \(1.7761\) y \(2\). Por lo que se puede decir que estamos en una zona de aceptación de la hipótesis nula, y por lo tanto hay ausencia de correlación serial.

Realiza una prueba de hipótesis para la significancia general del modelo.

\(H_0:β_1=β_2=β_3=β_4=β_5=0\)

\(H_1:β_1, β_2, β_3, β_4\) ó \(β_5≠0\)

R<-0.8516
n<-45
k<-5

qf(.95, k-1, n-k)
## [1] 2.605975
F<-(R/(1-R))*((n-k)/(k-1))
F
## [1] 57.38544

El valor crítico en el modelo es \(2.605975\) y \(F=57.38544\), por lo tanto, existe suficiente evidencia estadística para rechazar la hipótesis nula con una significancia del \(0.05\), pues el valor de \(F\) no se encuentra dentro de la región de aceptación. Asimismo, los valores obtenidos nos indican que nuestro modelo tiene una significancia general.

Realiza una prueba de hipótesis para la significancia de cada coeficiente \(β_i\).

\(H_0:β_i=0\)

\(H_1:β_i≠0\)

n<-45
k<-5
B1<-(-0.18109)
B2<-(-0.06319)
B3<-9.61365
B4<-10.80652 
B5<-10.15358
eeB1<-0.22885  
eeB2<-0.05309  
eeB3<-5.20840
eeB4<-4.98492
eeB5<-5.08177

qt(.975,40)
## [1] 2.021075
t1<-((B1-0)/eeB1)
t1
## [1] -0.7913043
qt(.975,40)
## [1] 2.021075
t2<-((B2-0)/eeB2)
t2
## [1] -1.190243
qt(.975,40)
## [1] 2.021075
t3<-((B3-0)/eeB3)
t3
## [1] 1.845797
qt(.975,40)
## [1] 2.021075
t4<-((B4-0)/eeB4)
t4
## [1] 2.167842
qt(.975,40)
## [1] 2.021075
t5<-((B5-0)/eeB5)
t5
## [1] 1.99804
pf<-pf(t1, k-1, n-k)
p1<-1-pf
p1
## [1] 1
pf<-pf(t2, k-1, n-k)
p2<-1-pf
p2
## [1] 1
pf<-pf(t3, k-1, n-k)
p3<-1-pf
p3
## [1] 0.1390686
pf<-pf(t4, k-1, n-k)
p4<-1-pf
p4
## [1] 0.09015735
pf<-pf(t5, k-1, n-k)
p5<-1-pf
p5
## [1] 0.1133295

Prueba de hipótesis para \(β_1\): La región de aceptación se encuentra entre -2.021075 y 2.021075. Ahora bien, el valor de t es -0.7913043, el cual se encuentra en la región de aceptación. Asimismo \(p>0.05\), por lo tanto, tenemos suficiente evidencia estadística para aceptar la hipótesis nula con una significancia de 0.05.

Prueba de hipótesis para \(β_2\): La región de aceptación se encuentra entre -2.021075 y 2.021075. Ahora bien, el valor de t es -1.190243, el cual se encuentra en la región de aceptación. Asimismo \(p>0.05\), por lo tanto, tenemos suficiente evidencia estadística para aceptar la hipótesis nula con una significancia de 0.05.

Prueba de hipótesis para \(β_3\): La región de aceptación se encuentra entre -2.021075 y 2.021075. Ahora bien, el valor de t es 1.845797, el cual se encuentra en la región de aceptación. Asimismo \(p>0.05\), por lo tanto, tenemos suficiente evidencia estadística para aceptar la hipótesis nula con una significancia de 0.05.

Prueba de hipótesis para \(β_4\): La región de aceptación se encuentra entre -2.021075 y 2.021075. Ahora bien, el valor de t es de 2.167842, el cual se encuentra fuera de la región de aceptación. Asimismo \(p>0.05\), por lo tanto, tenemos suficiente evidencia estadística para rechazar la hipótesis nula con una significancia de 0.05.

Prueba de hipótesis para \(β_5\): La región de aceptación se encuentra entre -2.021075 y 2.021075. Ahora bien, el valor de t es 1.99804, el cual se encuentra en la región de aceptación. Asimismo \(p>0.05\), por lo tanto, tenemos suficiente evidencia estadística para aceptar la hipótesis nula con una significancia de 0.05.

Con lo anterior, podemos identificar que los cinco coeficientes (\(β_1, β_2, β_3, β_4, β_5\)) no son significativos, es decir, no impactan al modelo, pues todos pueden tomar el valor de cero.

Calcula el coeficiente \(R^2_{adj}\) del modelo.

El \(R^2_{adj}\) es $ 0.833$, de acuerdo al summary del modelo, esto nos indica que el modelo explica aproximadamente el 83% de los datos.

Elimina algunas variables y observa si hay cambios en la \(R^2_{adj}\) del modelo.

modelo.reduccion<-lm(Yi~0+X2+D1+D2+D3,data=tabla)
summary(modelo.reduccion)
## 
## Call:
## lm(formula = Yi ~ 0 + X2 + D1 + D2 + D3, data = tabla)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.6888 -1.6929 -0.0372  1.4795  3.9880 
## 
## Coefficients:
##    Estimate Std. Error t value Pr(>|t|)    
## X2 -0.05909    0.05259  -1.124    0.268    
## D1  5.61354    1.24837   4.497 5.57e-05 ***
## D2  6.95295    1.05952   6.562 6.86e-08 ***
## D3  6.20546    0.95982   6.465 9.43e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.365 on 41 degrees of freedom
## Multiple R-squared:  0.8492, Adjusted R-squared:  0.8345 
## F-statistic: 57.74 on 4 and 41 DF,  p-value: 2.632e-16

Se puede observar que existe un aumento considerable en el \(R²adj\), ya que el primer modelo nos muestra un \(R²adj\) de \(0.833\) mientras que aplicando la eliminación de datos, obteniendo en el modelo reducido un \(R²adj\) de \(0.8345\). Entonces con esto podemos concluir que el modelo reducido tiene mejor ecuación de regresión ya que implica que la variable independiente elegida para determinar la variable dependiente puede explicar la variación en la variable dependiente.

INTERPRETACIÓN Y CONCLUSIONES

Da una interpretación de cada uno de los coeficientes numéricos que encontraste en la segunda parte.

Debido a que que nuestro modelo lineal y las betas son:

\(Y_i=B_1 X_1 + B_2 X_2 + B_3 D_1 + B_4 D_2 + B_5 D_3 + u_i\)

\(β_1 = -0.18109\)

\(β_2 = -0.06319\)

\(β_3 = 9.61365\)

\(β_4 = 10.80652\)

\(β_5 = 10.15358\)

Podemos definir que a medida que los alumnos cumplen un año más (\(X_1\)), el número de horas del uso del dispositivo disminuirá en \(0.18109\). Luego, se puede decir que por una hora más que se permanezca en la casa (X2), el uso del dispositivo disminuirá en \(0.06319\), aunque esto en realiadad no sucede así ya que el permanecer más tiempo en casa produce un aumento en el uso del celular, no obstante diversas situaciones puden provocar una disminución en el tiempo, tal y como lo muestra el modelo.

Ahora bien, con respecto a las variables dicótomas, dependiendo de la red social que más utilicen es como se obtiene el promedio de horas que ocupan el teléfono móvil. En el caso de Facebook el promedio de horas de uso es de \(9.61365\); mientras que un usuario de Instagram tiende a utilizar su teléfono en promedio \(10.80652\) horas y finalmente en los usuarios en los cuales predomina el uso de WhatsApp el promedio de horas es de \(10.15358\).

En este caso, se puede decir también, que las tres variabales dicotómicas pueden ser no solo un factor aditivo, sino multiplicativo si es que se juntan dos o más aplicaciones en uso.

Realiza una predicción para un valor de \(X_1\), \(X_2\), …, \(X_k\) que no esté en tu muestra (pero que esté cerca de los valores) para predecir el valor de \(\hat Y_i\).

Para la predicción tenemos un estudiante de 22 años, que pasa 20 horas en su hogar y la aplicación más utilizada que tiene es WhatsApp, con esos datos se puede predecir el valor de \(Y_i\):

\(Y_i=B_1(22) + B_2(20) + B_3(0) + B_4(0) + B_5(1)\)

Por lo que el resultado sería.

\(Y_i=(-0.18109)(22) + (-0.06319)(20) + (10.15358)(1)\)

Yi <- (-0.18109)*(22) + (-0.06319)*(20) + (10.15358)*(1)
Yi
## [1] 4.9058

Donde podemos observar que, con la predicción tenemos que este alumno usaría \(4.9058\) horas en el dispositivo móvil.

Redacta un breve resumen de lo que encontraste, evita ser repetitivo.

Este proyecto expone el uso del teléfono celular en los alumnos de economía, considerando el tiempo que pasan en el hogar y la aplicación más utilizada tomando en cuenta Facebook, Instagram y Whatsapp. Con base en estas variables se obtuvo un diagrama de dispersión en relación con el número de horas de uso del dispositivo y la edad en años de los alumnos, donde la mayoría de los alumnos se encuentra en un rango de 20 a 21 años, de igual forma, se puede interpretar que conforme la edad va aumentando el uso del teléfono se reduce. Asimismo, se obtuvo un diagrama de dispersión con relación al número de horas de uso del dispositivo y número de horas que permanecen en su casa, se puede ver claramente como es que el uso del teléfono se ve reducido mientras menos tiempo pasen en casa, sin embargo, esto no siempre sucede así, ya que el estar en el hogar implica la realización de actividades que detienen al estudiante en el uso del celular, así que esto no es en su totalidad cierto. De igual modo, se hizo el computo de los intervalos de confianza, de acuerdo con el cálculo de dichos intervalos se puede deducir que el modelo no es significativo, debido a que el 0 queda dentro de cada uno de los intervalos. Por otra parte, se calculó el estadístico de Durbin Watson, con los resultados correspondientes se determinó que este modelo se encuentra en una zona de aceptación de la hipótesis nula, y por lo tanto hay ausencia de correlación serial.

Comenta sobre la relación entre los datos, los parámetros del modelo y tu pregunta de investigación.

Como se observa, el modelo está compuesto por 5 parámetros independientes, de los cuales 2 son cuantitativos, ya que muestran el número de horas de uso del móvil y la edad de los alumnos respectivamente. Los otros 3 son parámetros dicotómicos y cualitativos, ya que cada uno corresponde a las redes sociales más utilizadas: Facebook, Instagram y WhatsApp. Considerando nuestra pregunta de investigación “¿Cómo afecta el número de horas en casa al tiempo dedicado al uso del móvil y cuál es la red social más utilizada?”, se observa que existe una estrecha relación entre las variables cuantitativas, ya que si se aumenta una hora en el total del tiempo en casa, se reduce en 0.063 el tiempo de uso del teléfono móvil. Por su parte, se observa que la red social más utilizada por los alumnos es WhatsApp, seguida de Instagram y después Facebook. Con ello, se puede concluir que la mensajería instantánea, al igual que el tiempo en casa, influye significativamente en el uso del móvil.

Discute las áreas de oportunidad de tu estudio, ya sea debido a la recolección de datos o a la metodología.

El estudio que realizamos puede ampliarse a otras disciplinas como una herramienta de apoyo, por ejemplo en las ciencias de la salud o la psicología, tal y como se menciona al inicio del proyecto, el objetivo es analizar el comportamiento de este grupo de estudiantes en relación a las horas que pasan en su casa así como también el uso de su telefono móvil y la aplicación que mayor influencia tiene en sus vidas. Una gran parte de los estudiantes denotaban cierto nivel de desconfianza al pensar en la posibilidad de ser juzgados al ver en qué invertían el tiempo de uso de su teléfono móvil, es así como desde la recolección de datos se puede extraer más información de la que nos proporcionan. Con esto también podemos inferir en cuestiones más subjetivas sobre este fenómeno y contrastarlo con otras universidades o grupos de personas, teniendo así un estudio más completo.

Escribe algunas sugerencias para futuros trabajos.

A raíz del presente trabajo, existen líneas de investigación que se pueden tomar para futuros trabajos. Por ejemplo, ¿cuál es la relacion entre el rendimiento escolar y el porcentaje de uso diario de dispositivos móviles?; ¿cuál es la relación entre salud visual y el porcentaje de uso diario de dispositivos móviles?; ¿cuál es el porcentaje de uso diario de dispositivos móviles de acuerdo al rango de edad? y ¿qué estereotipos se fortalecen de acuerdo a las redes sociales en las que se invierte más tiempo?

FUENTES BIBLIOGRAFÍA