library(readxl)
library(dplyr)
library(DataExplorer) 
Datos_Clase <- read_excel("Datos_Clase.xlsx",
    col_types = c("numeric", "numeric", "numeric", 
        "numeric", "numeric", "numeric", 
        "numeric"))


View(Datos_Clase)
attach(Datos_Clase)

Solución al taller

Solucion punto 1

Describa el modelo de probabilidad para cada una de las variables ### Variable Acceso a TIC

tabla<-table(AccTIC)
tabla 
## AccTIC
##    0    1 
##  857 1673
sum(tabla)
## [1] 2530
par(mfrow=c(1,2))
barplot(tabla/sum(tabla), col="orange", main="Diagrama de barras Acceso a Tic")
mean(AccTIC)
## [1] 0.6612648
x<-0:1
plot(dbinom(x,1,0.66),type="h", col="blue",xaxt="n",lwd=5)

boxplot(T.Internet, col="red",horizontal = TRUE)

Base<-filter(Datos_Clase,T.Internet>"0")
str(Base)
## tibble [2,312 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2312] 1 2 3 5 6 7 8 9 10 11 ...
##  $ T.Internet   : num [1:2312] 6.19 3.7 7.63 2.15 3.36 7.43 5.3 2.56 1.14 2.51 ...
##  $ Integrantes.F: num [1:2312] 4 8 4 2 1 3 3 2 2 1 ...
##  $ Antiguedad   : num [1:2312] 0.89 2.47 0.42 10.03 2.05 ...
##  $ T.estudio    : num [1:2312] 11.33 11.85 7.92 3.79 2.83 ...
##  $ N.Asigprac   : num [1:2312] 0.2 0.85 0.48 0.51 0.58 0.32 0.19 0.51 0.57 0.56 ...
##  $ AccTIC       : num [1:2312] 1 1 1 0 0 1 0 1 0 1 ...
attach(Base)
hist(T.Internet,prob=TRUE,col="green")
mean(T.Internet)
## [1] 4.563689
var(T.Internet)
## [1] 6.508271
alpha<-(mean(T.Internet))^2/var(T.Internet)
alpha
## [1] 3.200122
beta<-var(T.Internet)/mean(T.Internet)
beta
## [1] 1.426099
curve(dgamma(x, alpha, scale = beta), from = 0, to = 14, col = "red", add = TRUE, lwd = 5)

Base<-filter(Datos_Clase,Integrantes.F>"0")
str(Base)
## tibble [2,408 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2408] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2408] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2408] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2408] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2408] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2408] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2408] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
boxplot(Integrantes.F,col = "purple", horizontal = TRUE)

tabla2<-table(Integrantes.F)
tabla2
## Integrantes.F
##   1   2   3   4   5   6   7   8   9  10 
## 366 574 564 427 275 117  59  18   4   4
sum(tabla2)
## [1] 2408
par(mfrow=c(1,2))
barplot(tabla2/sum(tabla2), col="yellow", main="Diagrama de barras Integrantes F")
lamda<-mean(Integrantes.F)
lamda
## [1] 3.166113
x<-0:10
plot(dpois(x,lamda),type="h", col="blue",lwd=5,xaxt="n")

boxplot(Antiguedad, col="gray",horizontal = TRUE)

Base<-filter(Datos_Clase,Antiguedad>"0")
str(Base)
## tibble [2,530 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2530] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2530] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2530] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2530] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2530] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2530] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2530] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
hist(Antiguedad,prob=TRUE,col="green")
mean(Antiguedad)
## [1] 2.467846
var(Antiguedad)
## [1] 6.318945
media<-mean(Antiguedad)
media
## [1] 2.467846
lamda<-1/media
lamda
## [1] 0.4052117
curve(dexp(x,lamda), from = 0, to = 20, col = "red", add = TRUE, lwd = 5)

boxplot(N.Asigprac, col="gray",horizontal = TRUE)

Base<-filter(Datos_Clase,N.Asigprac>"0")
str(Base)
## tibble [2,530 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2530] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2530] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2530] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2530] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2530] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2530] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2530] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
hist(N.Asigprac,prob=TRUE,col="green")
mean(N.Asigprac)
## [1] 0.4061146
var(N.Asigprac)
## [1] 0.03931827
alpha<-mean(N.Asigprac) * ((mean(N.Asigprac) * (1 - mean(N.Asigprac))) / var(N.Asigprac) - 1)
alpha
## [1] 2.085068
beta<-(1 - mean(N.Asigprac)) * ((mean(N.Asigprac) * (1 - mean(N.Asigprac))) / var(N.Asigprac) - 1)
beta
## [1] 3.049117
curve(dbeta(x,alpha,beta), from = 0, to = 20, col = "red", add = TRUE, lwd = 5)

boxplot(T.estudio, col="gray",horizontal = TRUE)

Base<-filter(Datos_Clase,T.estudio>"0")
str(Base)
## tibble [2,530 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2530] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2530] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2530] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2530] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2530] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2530] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2530] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
hist(T.estudio,prob=TRUE,col="green")
mean(T.estudio)
## [1] 7.990324
var(T.estudio)
## [1] 32.19217
media <- mean(T.estudio)
media
## [1] 7.990324
desviacion <- sd(T.estudio)
desviacion
## [1] 5.673814
curve(dnorm(x,media,desviacion), from = 0, to = 40, col = "red", add = TRUE, lwd = 5)

##Solucion punto 2

  1. Resolver las siguientes inquietudes respecto al problema de estudio (comentar las respuestas)
  1. Probabilidad de que un estudiante gaste entre 6 y 8 horas diarias en internet.
Base<-filter(Datos_Clase,T.Internet>"0")
str(Base)
## tibble [2,312 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2312] 1 2 3 5 6 7 8 9 10 11 ...
##  $ T.Internet   : num [1:2312] 6.19 3.7 7.63 2.15 3.36 7.43 5.3 2.56 1.14 2.51 ...
##  $ Integrantes.F: num [1:2312] 4 8 4 2 1 3 3 2 2 1 ...
##  $ Antiguedad   : num [1:2312] 0.89 2.47 0.42 10.03 2.05 ...
##  $ T.estudio    : num [1:2312] 11.33 11.85 7.92 3.79 2.83 ...
##  $ N.Asigprac   : num [1:2312] 0.2 0.85 0.48 0.51 0.58 0.32 0.19 0.51 0.57 0.56 ...
##  $ AccTIC       : num [1:2312] 1 1 1 0 0 1 0 1 0 1 ...
attach(Base)
alpha<-(mean(T.Internet))^2/var(T.Internet)
alpha
## [1] 3.200122
beta<-var(T.Internet)/mean(T.Internet)
beta
## [1] 1.426099
prob<-pgamma(8,alpha,scale=beta) - pgamma(6,alpha,scale=beta)
prob
## [1] 0.1439214

La probabilidad de que un estudiante gaste entre 6 y 8 horas diarias en internet es del 14.39%

b.Probabilidad de que si se encuestan 10 estudiantes al menos 6 cuenten con algún medio tecnológico.

View(Datos_Clase)
attach(Datos_Clase)
mean(AccTIC)
## [1] 0.6612648
dbinom(6,10,0.66)
## [1] 0.2319522
dbinom(7,10,0.66)
## [1] 0.2572916
dbinom(8,10,0.66)
## [1] 0.1872931
dbinom(9,10,0.66)
## [1] 0.08079311
dbinom(10,10,0.66)
## [1] 0.01568337
sum(dbinom(6:10,10,0.66))
## [1] 0.7730134
1-pbinom(5,10,0.66)
## [1] 0.7730134

La probabilidad de que se encuesten 10 estudiantes y almenos 6 cuenten con algun medio tecnologico es del 77.3%

  1. Probabilidad de que el porcentaje de asignaturas prácticas que cursa actualmente sea inferior al 30%
Base<-filter(Datos_Clase,N.Asigprac>"0")
str(Base)
## tibble [2,530 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2530] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2530] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2530] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2530] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2530] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2530] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2530] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
alpha<-mean(N.Asigprac) * ((mean(N.Asigprac) * (1 - mean(N.Asigprac))) / var(N.Asigprac) - 1)
alpha
## [1] 2.085068
beta<-(1 - mean(N.Asigprac)) * ((mean(N.Asigprac) * (1 - mean(N.Asigprac))) / var(N.Asigprac) - 1)
beta
## [1] 3.049117
prob <- pbeta(0.3,alpha,beta)
prob
## [1] 0.3340612

La probabilidad de que el porcentaje de asignaturas practicas que cursa acualmente sea inferior al 30% es del 33.4%

  1. Valor esperado y la varianza del tiempo que un estudiante dispone para estudiar diariamente.
Base<-filter(Datos_Clase,T.estudio>"0")
str(Base)
## tibble [2,530 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2530] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2530] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2530] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2530] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2530] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2530] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2530] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
media <- mean(T.estudio)
media
## [1] 7.990324
varianza <- var(T.estudio)
varianza
## [1] 32.19217

Valor esperado del tiempo que un estudiante dispone para estudiar diariamente: 7.990324 Varianza del tiempo que un estudiante dispone para estudiar diariamente: 32.19217

e.Probabilidad de que un estudiante tenga un computador con menos de tres años de uso.

Base<-filter(Datos_Clase,Antiguedad>"0")
str(Base)
## tibble [2,530 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2530] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2530] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2530] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2530] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2530] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2530] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2530] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
mean(Antiguedad)
## [1] 2.467846
var(Antiguedad)
## [1] 6.318945
media<-mean(Antiguedad)
media
## [1] 2.467846
lamda<-1/media
lamda
## [1] 0.4052117
prob<-pexp(3,lamda)
prob
## [1] 0.7034784

La probabilidad de que un estudiante tenga un computador con menos de tres años de uso es de el 70.34%

  1. Probabilidad de que en una familia cuente con tres integrantes que estudian actualmente.
Base<-filter(Datos_Clase,Integrantes.F>"0")
str(Base)
## tibble [2,408 × 7] (S3: tbl_df/tbl/data.frame)
##  $ ID           : num [1:2408] 1 2 3 4 5 6 7 8 9 10 ...
##  $ T.Internet   : num [1:2408] 6.19 3.7 7.63 -0.36 2.15 3.36 7.43 5.3 2.56 1.14 ...
##  $ Integrantes.F: num [1:2408] 4 8 4 1 2 1 3 3 2 2 ...
##  $ Antiguedad   : num [1:2408] 0.89 2.47 0.42 6.17 10.03 ...
##  $ T.estudio    : num [1:2408] 11.33 11.85 7.92 8.15 3.79 ...
##  $ N.Asigprac   : num [1:2408] 0.2 0.85 0.48 0.17 0.51 0.58 0.32 0.19 0.51 0.57 ...
##  $ AccTIC       : num [1:2408] 1 1 1 0 0 0 1 0 1 0 ...
attach(Base)
lamda<-mean(Integrantes.F)
lamda
## [1] 3.166113
prob<-dpois(3,lamda)
prob
## [1] 0.2230502

La probabilidad de que en una familia cuente con tres integrantes que estudian actualmente es del 22.3%