Determinar promedio de alumnos que cursan segundo semestre en adelante
# Cargar la librería previamente instalada
library (readr)
## Warning: package 'readr' was built under R version 3.6.2
# C:\Users\Usuario\Documents\Mis clases ITD\Semestre Enero Junio 2020\Analisis Inteligente de Datos\datos
ruta <- "C:/Users/Usuario/Documents/Mis clases ITD/Semestre Enero Junio 2020/Analisis Inteligente de Datos/datos"
setwd(ruta)
promedios <- read.csv("promedios.csv")
head(promedios)
## No..Control Semestre Cr..Apr. Carga Promedio
## 1 10040001 8 154 23 83.24
## 2 10040002 8 193 32 88.19
## 3 10040003 1 NA 27 0.00
## 4 10040004 2 22 28 82.40
## 5 10040005 5 77 28 81.59
## 6 10040006 1 NA 27 0.00
tail(promedios)
## No..Control Semestre Cr..Apr. Carga Promedio
## 467 10040467 3 55 27 87.92
## 468 10040468 7 175 34 90.03
## 469 10040469 11 202 29 82.43
## 470 10040470 2 22 23 83.20
## 471 10040471 3 50 27 86.00
## 472 10040472 4 73 28 82.44
str(promedios)
## 'data.frame': 472 obs. of 5 variables:
## $ No..Control: int 10040001 10040002 10040003 10040004 10040005 10040006 10040007 10040008 10040009 10040010 ...
## $ Semestre : int 8 8 1 2 5 1 2 1 3 1 ...
## $ Cr..Apr. : int 154 193 NA 22 77 NA 17 NA 50 NA ...
## $ Carga : int 23 32 27 28 28 27 28 27 27 27 ...
## $ Promedio : num 83.2 88.2 0 82.4 81.6 ...
summary(promedios)
## No..Control Semestre Cr..Apr. Carga
## Min. :10040001 Min. : 1.000 Min. : 0.0 Min. : 4.00
## 1st Qu.:10040119 1st Qu.: 2.000 1st Qu.: 54.0 1st Qu.:26.00
## Median :10040236 Median : 5.000 Median :105.0 Median :27.00
## Mean :10040236 Mean : 5.047 Mean :110.5 Mean :25.99
## 3rd Qu.:10040354 3rd Qu.: 7.000 3rd Qu.:166.0 3rd Qu.:28.00
## Max. :10040472 Max. :14.000 Max. :250.0 Max. :35.00
## NA's :79
## Promedio
## Min. : 0.00
## 1st Qu.:78.99
## Median :82.45
## Mean :69.94
## 3rd Qu.:86.22
## Max. :96.79
##
sum(promedios$Promedio) # Suma de variable Promedio
## [1] 33011.62
nrow(promedios) # N registros de promedios
## [1] 472
promedios$No..Control <- as.factor(promedios$No..Control)
promedios$Semestre <- as.factor(promedios$Semestre)
str(promedios)
## 'data.frame': 472 obs. of 5 variables:
## $ No..Control: Factor w/ 472 levels "10040001","10040002",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ Semestre : Factor w/ 14 levels "1","2","3","4",..: 8 8 1 2 5 1 2 1 3 1 ...
## $ Cr..Apr. : int 154 193 NA 22 77 NA 17 NA 50 NA ...
## $ Carga : int 23 32 27 28 28 27 28 27 27 27 ...
## $ Promedio : num 83.2 88.2 0 82.4 81.6 ...
summary(promedios)
## No..Control Semestre Cr..Apr. Carga Promedio
## 10040001: 1 1 : 77 Min. : 0.0 Min. : 4.00 Min. : 0.00
## 10040002: 1 2 : 67 1st Qu.: 54.0 1st Qu.:26.00 1st Qu.:78.99
## 10040003: 1 7 : 60 Median :105.0 Median :27.00 Median :82.45
## 10040004: 1 5 : 56 Mean :110.5 Mean :25.99 Mean :69.94
## 10040005: 1 3 : 47 3rd Qu.:166.0 3rd Qu.:28.00 3rd Qu.:86.22
## 10040006: 1 8 : 32 Max. :250.0 Max. :35.00 Max. :96.79
## (Other) :466 (Other):133 NA's :79
#promediosA2adela <- subset(promedios, Semestre > 1)
promediosA2adela <- subset(promedios, Semestre != '1')
promedioreal <- mean(promediosA2adela$Promedio)
print(round(promedioreal, 2))
## [1] 83.57