PASO 4
Identificar medidas de tendencia central con histograma y líneas de sus media y mediana de cada carrera en función de los promedios (14 gráficas)
1. ADMINISTRACIÓN
administracion = filter (datos, Promedio > 0 & Carrera == "ADMINISTRACION")
mean(administracion$Promedio)
## [1] 89.44312
median(administracion$Promedio)
## [1] 89.605
ggplot(administracion, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Administración",subtitle = paste("Media = ", round(mean(administracion$Promedio),2), ", Mediana = ", round(median(administracion$Promedio),2)))

2. ARQUITECTURA
arqui = filter (datos, Promedio > 0 & Carrera == "ARQUITECTURA")
mean(arqui$Promedio)
## [1] 86.46481
median(arqui$Promedio)
## [1] 86.58
ggplot(arqui, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Arquitectura",subtitle = paste("Media = ", round(mean(arqui$Promedio),2), ", Mediana = ", round(median(arqui$Promedio),2)))

3. BIOQUIMICA
bio = filter (datos, Promedio > 0 & Carrera == "BIOQUIMICA")
mean(bio$Promedio)
## [1] 84.68143
median(bio$Promedio)
## [1] 84.06
ggplot(bio, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Bioquímica",subtitle = paste("Media = ", round(mean(bio$Promedio),2), ", Mediana = ", round(median(bio$Promedio),2)))

4. CIVIL
civil = filter (datos, Promedio > 0 & Carrera == "CIVIL")
mean(civil$Promedio)
## [1] 84.281
median(civil$Promedio)
## [1] 83.915
ggplot(civil, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Civil",subtitle = paste("Media = ", round(mean(civil$Promedio),2), ", Mediana = ", round(median(civil$Promedio),2)))

5. ELECTRICA
electri = filter (datos, Promedio > 0 & Carrera == "ELECTRICA")
mean(electri$Promedio)
## [1] 83.77305
median(electri$Promedio)
## [1] 83.24
ggplot(electri, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Eléctrica",subtitle = paste("Media = ", round(mean(electri$Promedio),2), ", Mediana = ", round(median(electri$Promedio),2)))

6. ELECTRONICA
electron = filter (datos, Promedio > 0 & Carrera == "ELECTRONICA")
mean(electron$Promedio)
## [1] 86.6572
median(electron$Promedio)
## [1] 86.67
ggplot(electron, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Electrónica",subtitle = paste("Media = ", round(mean(electron$Promedio),2), ", Mediana = ", round(median(electron$Promedio),2)))

7. GESTION EMPRESARIAL
gesti = filter (datos, Promedio > 0 & Carrera == "GESTION EMPRESARIAL")
mean(gesti$Promedio)
## [1] 87.66966
median(gesti$Promedio)
## [1] 87.59
ggplot(gesti, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Gestión Empresarial",subtitle = paste("Media = ", round(mean(gesti$Promedio),2), ", Mediana = ", round(median(gesti$Promedio),2)))

8. INDUSTRIAL
indus = filter (datos, Promedio > 0 & Carrera == "INDUSTRIAL")
mean(indus$Promedio)
## [1] 85.01737
median(indus$Promedio)
## [1] 84.64
ggplot(indus, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Industrial",subtitle = paste("Media = ", round(mean(indus$Promedio),2), ", Mediana = ", round(median(indus$Promedio),2)))

10. MECANICA
meca= filter (datos, Promedio > 0 & Carrera == "MECANICA")
mean(meca$Promedio)
## [1] 82.58467
median(meca$Promedio)
## [1] 82.02
ggplot(meca, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Mecánica",subtitle = paste("Media = ", round(mean(meca$Promedio),2), ", Mediana = ", round(median(meca$Promedio),2)))

11. MECATRONICA
mecatron = filter (datos, Promedio > 0 & Carrera == "MECATRONICA")
mean(mecatron$Promedio)
## [1] 84.45948
median(mecatron$Promedio)
## [1] 84.085
ggplot(mecatron, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Mecatrónica",subtitle = paste("Media = ", round(mean(mecatron$Promedio),2), ", Mediana = ", round(median(mecatron$Promedio),2)))

12. QUIMICA
quim = filter (datos, Promedio > 0 & Carrera == "QUIMICA")
mean(quim$Promedio)
## [1] 86.05215
median(quim$Promedio)
## [1] 85.67
ggplot(quim, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Química",subtitle = paste("Media = ", round(mean(quim$Promedio),2), ", Mediana = ", round(median(quim$Promedio),2)))

13. SISTEMAS
sis = filter (datos, Promedio > 0 & Carrera == "SISTEMAS")
mean(sis$Promedio)
## [1] 85.90464
median(sis$Promedio)
## [1] 85.34
ggplot(sis, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de Sistemas",subtitle = paste("Media = ", round(mean(sis$Promedio),2), ", Mediana = ", round(median(sis$Promedio),2)))

14. TICS
tics = filter (datos, Promedio > 0 & Carrera == "TIC")
mean(tics$Promedio)
## [1] 84.31719
median(tics$Promedio)
## [1] 83.24
ggplot(tics, aes(Promedio)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = median(Promedio),
color = "mediana"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = mean(Promedio),
color = "media"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Promedio de TICs",subtitle = paste("Media = ", round(mean(tics$Promedio),2), ", Mediana = ", round(median(tics$Promedio),2)))

PASO 5. Identificar varianza y desviación estándar en una gráfica de dispersión de los promedios de cada carrera (14 gráficas)
1. ADMINISTRACION
n = nrow(administracion)
ggplot(administracion, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Administración", subtitle = paste("Varianza = ", round(var(administracion$Promedio),2), ", DesvStd = ", round(sd(administracion$Promedio),2), ", C.V. = ", round(sd(administracion$Promedio) / mean(administracion$Promedio) * 100, 2 )))

2. ARQUITECTURA
n = nrow(arqui)
ggplot(arqui, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Arquitectura", subtitle = paste("Varianza = ", round(var(arqui$Promedio),2), ", DesvStd = ", round(sd(arqui$Promedio),2), ", C.V. = ", round(sd(arqui$Promedio) / mean(arqui$Promedio) * 100, 2 )))

3. BIOQUIMICA
n = nrow(bio)
ggplot(bio, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Bioquímica", subtitle = paste("Varianza = ", round(var(bio$Promedio),2), ", DesvStd = ", round(sd(bio$Promedio),2), ", C.V. = ", round(sd(bio$Promedio) / mean(bio$Promedio) * 100, 2 )))

4. CIVIL
n = nrow(civil)
ggplot(civil, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Civil", subtitle = paste("Varianza = ", round(var(civil$Promedio),2), ", DesvStd = ", round(sd(civil$Promedio),2), ", C.V. = ", round(sd(civil$Promedio) / mean(civil$Promedio) * 100, 2 )))

5. ELECTRICA
n = nrow(electri)
ggplot(electri, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Electrica", subtitle = paste("Varianza = ", round(var(electri$Promedio),2), ", DesvStd = ", round(sd(electri$Promedio),2), ", C.V. = ", round(sd(electri$Promedio) / mean(electri$Promedio) * 100, 2 )))

6. ELECTRÓNICA
n = nrow(electron)
ggplot(electron, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Electróncia", subtitle = paste("Varianza = ", round(var(electron$Promedio),2), ", DesvStd = ", round(sd(electron$Promedio),2), ", C.V. = ", round(sd(electron$Promedio) / mean(electron$Promedio) * 100, 2 )))

7. GESTIÓN EMPRESARIAL
n = nrow(gesti)
ggplot(gesti, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Gestión", subtitle = paste("Varianza = ", round(var(gesti$Promedio),2), ", DesvStd = ", round(sd(gesti$Promedio),2), ", C.V. = ", round(sd(gesti$Promedio) / mean(gesti$Promedio) * 100, 2 )))

8. INDUTRIAL
n = nrow(indus)
ggplot(indus, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Industrial", subtitle = paste("Varianza = ", round(var(indus$Promedio),2), ", DesvStd = ", round(sd(indus$Promedio),2), ", C.V. = ", round(sd(indus$Promedio) / mean(indus$Promedio) * 100, 2 )))

10. MECÁNICA
n = nrow(meca)
ggplot(meca, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Mecánica", subtitle = paste("Varianza = ", round(var(meca$Promedio),2), ", DesvStd = ", round(sd(meca$Promedio),2), ", C.V. = ", round(sd(meca$Promedio) / mean(meca$Promedio) * 100, 2 )))

11. MECATRÓNICA
n = nrow(mecatron)
ggplot(mecatron, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Mecatrónica", subtitle = paste("Varianza = ", round(var(mecatron$Promedio),2), ", DesvStd = ", round(sd(mecatron$Promedio),2), ", C.V. = ", round(sd(mecatron$Promedio) / mean(mecatron$Promedio) * 100, 2 )))

12. QUÍMICA
n = nrow(quim)
ggplot(quim, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Química", subtitle = paste("Varianza = ", round(var(quim$Promedio),2), ", DesvStd = ", round(sd(quim$Promedio),2), ", C.V. = ", round(sd(quim$Promedio) / mean(quim$Promedio) * 100, 2 )))

13. SISTEMAS
n = nrow(sis)
ggplot(sis, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de Sistemas", subtitle = paste("Varianza = ", round(var(sis$Promedio),2), ", DesvStd = ", round(sd(sis$Promedio),2), ", C.V. = ", round(sd(sis$Promedio) / mean(sis$Promedio) * 100, 2 )))

14. TICs
n = nrow(tics)
ggplot(tics, aes(x = 1:n, y = Promedio)) +
geom_point() +
labs(title = "Dispersión de Promedio de TICs", subtitle = paste("Varianza = ", round(var(tics$Promedio),2), ", DesvStd = ", round(sd(tics$Promedio),2), ", C.V. = ", round(sd(tics$Promedio) / mean(tics$Promedio) * 100, 2 )))

PASO 7. Interpretación del Caso 5
• De acuerdo con nuestra gráfica de cajas del paso 3, la carrera que tiene (en promedio) mejores calificaciones es Administración, con un promedio general de 89.44.
• En la cara opuesta de la moneda, es decir, la carrera que (en promedio) tiene las calificaciones más bajas del Tecnológico es Mecánica, con un promedio general de 82.58
• En la gráfica de cajas podemos observar gráficamente y con mucha claridad que la persona con el promedio más bajo del Tecnológico se encuentra en la carrera de Arquitecura.
• Por otro lado, la persona con el promedio más alto de todo el Tecnológico se encuentra en la carrera de Industrial, y varias de las personas con los promedios más altos están también en Industrial.
• De acuerdo con las medidas de tendencia central que calculamos en el paso 4, el promedio general de toda la carrera de Ingenería en Sistemas es 95.904
• El histograma de la carrera de química nos indica que la media de Química es 86.05, y su mediana es 85.67.
• En la tabla del paso 6 contamos con 7 datos, de los cuales uno es la carrera que estamos evaluando, y los otros 6 son la información que conseguimos de ellos. Calculamos:
1. Número de alumnos en la carrera
2. Media de la carrera
3. Mediana de la carrera
4. Varianza de la carrera
5. Desviación estándar de la carrera
6. Coeficiente de variación de la carrera.
• Con la tabla del paso 6 podemos ver claramente que la carrera de administración, además de ser la que tiene más alumnos, es la que tiene la media más alta y la mediana más alta.
• Informática es la carrera que tiene la media más baja de todas las carreras, con un resultado de 60.6, seguida muy de cerca por eléctrica, que tiene una media de 60.7.