Se realizó una encuesta con los estudiantes del curso de seminario de construcción, para conocer las características e información personal de los encuestados. La encuesta se aplicó en el salón de clase.
S<-read.csv("Matriz1.csv", sep = ";")
Las preguntas que se realizaron corresponden a:
names(M)
[1] "NOMBRE" "EDAD"
[3] "ESTATURA" "PESO"
[5] "NIVEL.EDUCATIVO" "SEXO"
[7] "HERMANOS" "HIJOS"
[9] "ESTRATO" "MATRICULADO"
[11] "NACIONALIDAD.REGIONAL" "ESTADO.CIVIL"
Tamaño de la muestra:
length.POSIXlt(S)
[1] 25
Con los datos obtenidos de la muestra, se realizó histogramas de las variables cuantitativas:
library(ggplot2)
ggplot(S, aes(x = EDAD)) + geom_histogram(breaks = seq(20, 40, by = 5), col = "black", fill = "green") + ggtitle("EDADES") + ylab("ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(breaks = seq(0, 14, by = 2), limits = c(0,14)) + xlab("EDADES [Años]") + annotate("text", x = c(22.5, 27.5, 32.5, 37.5), y = c(13.5, 6.5, 1.5, 2.5), label = c("52%", "24%", "4%", "8%"))

ggplot(S, aes(x = ESTATURA)) + geom_histogram(breaks = seq(1.5, 1.9, by = 0.1), col = "black", fill = "red") + ggtitle("ESTATURA") + ylab("ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(breaks = seq(0, 10, by = 2), limits = c(0,10)) + xlab("ESTATURAS [m]") + annotate("text", x = c(1.55, 1.65, 1.75, 1.85), y = c(9.5, 7.5, 6.5, 3.5), label = c("36%", "28%", "24%", "12%"))

ggplot(S, aes(x = PESO)) + geom_histogram(breaks = seq(50, 80, by = 6), col = "black", fill = "yellow") + ggtitle("PESO") + ylab("ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(breaks = seq(0, 7, by = 1), limits = c(0,7)) + xlab("PESOS [Kg]") + scale_x_continuous(breaks = seq(50, 80, by = 6), limits = c(50,80)) + annotate("text", x = c(53, 59, 65, 71, 77), y = c(4.5, 6.5, 2.5, 5.5, 6.5), label = c("16%", "24%", "8%", "20%", "24%"))

Análisis:
Variable EDAD: Se observa que el 76% de los encuestados están en un rango de edad entre los 20 y 30 años, lo que nos indica que más de la mitad de los estudiantes está por debajo de los 30 años. Nota:
Variable ESTATURA: El 64% de los encuestados se encuentran en un rango de estatura entre los 1.5 y 1.7 metros, que corresponden a estaturas promedios en Colombia.
Variable PESO: Los rangos donde se encuentra la mayor cantidad de encuestados es entre 50-62 kg y 68-80 kg. No hay una tendencia marcada en la gráfica.
Con las variables cualitativas se realizaron diagramas de barra:
tab.NE<-as.data.frame(prop.table(table(S$NIVEL.EDUCATIVO))*100)
colnames(tab.NE)<-c("NE", "PORCENTAJE")
l<-c("Estudiantes de pregrado", "Estudiantes de postgrado", "Estudiantes de doctarado")
n<-c("1", "2", "3")
library(ggplot2)
ggplot(tab.NE, aes(x = NE, y = PORCENTAJE)) + geom_bar(stat = "identity", width = 0.8, fill = c("violet", "darkgreen", "darkblue")) + scale_fill_discrete(name = "", breaks = n, labels = l) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey")) + ggtitle("NIVEL EDUCATIVO") + xlab("") + ylab("% ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=-0.5, hjust=0.5 ,col="black") + scale_x_discrete(breaks = n, labels = c("Estudiante de Pregrado", "Estudiante de Postgrado", "Estudiante de Doctorado")) + scale_y_continuous(breaks = seq(0, 60, by = 5), limits = c(0,60))

tab.sexo<-as.data.frame(prop.table(table(S$SEXO))*100)
colnames(tab.sexo)<-c("Sexo", "PORCENTAJE")
l<-c("Hombres", "Mujeres")
n<-c("1", "2")
library(ggplot2)
ggplot(tab.sexo, aes(x = Sexo, y = PORCENTAJE)) + geom_bar(stat = "identity", width = 0.8, fill =c("blue", "pink")) + scale_fill_discrete(name = "", breaks = n, labels = l) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey")) + ggtitle("GÉNERO") + xlab("") + ylab("% ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=-0.5, hjust=0.5 ,col="black") + scale_x_discrete(breaks = n, labels = c("Hombres", "Mujeres")) + scale_y_continuous(breaks = seq(0, 60, by = 5), limits = c(0,60))

tab.H<-as.data.frame(prop.table(table(S$HERMANOS))*100)
colnames(tab.H)<-c("Hermanos", "PORCENTAJE")
library(ggplot2)
ggplot(tab.H, aes(x = Hermanos, y = PORCENTAJE)) + geom_bar(stat = "identity", width = 0.8, fill = c("red", "orange","blue", "green", "yellow", "violet", "dark red")) + scale_fill_discrete(name = "", breaks = n, labels = l) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey")) + ggtitle("NÚMERO DE HERMANOS") + xlab("NÚMERO DE HERMANOS") + ylab("% ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=-0.5, hjust=0.5 ,col="black") + scale_y_continuous(breaks = seq(0, 30, by = 5), limits = c(0,30))

tab.Hi<-as.data.frame(prop.table(table(S$HIJOS))*100)
colnames(tab.Hi)<-c("Hijos", "PORCENTAJE")
library(ggplot2)
ggplot(tab.Hi, aes(x = Hijos, y = PORCENTAJE)) + geom_bar(stat = "identity", width = 0.8, fill = c("green", "yellow", "violet", "dark red")) + scale_fill_discrete(name = "", breaks = n, labels = l) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey")) + ggtitle("NÚMERO DE HIJOS") + xlab("NÚMERO DE HIJOS") + ylab("% ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(breaks = seq(0, 80, by = 5), limits = c(0,80)) + geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=0.5, hjust=-0.2 ,col="black") + coord_flip()

tab.Est<-as.data.frame(prop.table(table(S$ESTRATO))*100)
colnames(tab.Est)<-c("Estrato", "PORCENTAJE")
library(ggplot2)
ggplot(tab.Est, aes(x = Estrato, y = PORCENTAJE)) + geom_bar(stat = "identity", width = 0.8, fill = c("green", "yellow", "violet", "dark red", "dark blue")) + scale_fill_discrete(name = "", breaks = n, labels = l) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey")) + ggtitle("ESTRATOS") + xlab("") + ylab("% ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(breaks = seq(0, 60, by = 5), limits = c(0,60)) + geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=-0.5, hjust=0.5 ,col="black") + scale_x_discrete(breaks = c("1","2","3","4","5"), labels = c("Estrato 1", "Estrato 2", "Estrato 3", "Estrato 4", "Estrato 5"))

tab.M<-as.data.frame(prop.table(table(S$MATRICULADO))*100)
colnames(tab.M)<-c("Matriculado", "PORCENTAJE")
library(ggplot2)
ggplot(tab.M, aes(x = Matriculado, y = PORCENTAJE)) + geom_bar(stat = "identity", width = 0.5, fill = c("dark red", "dark blue")) + scale_fill_discrete(name = "", breaks = n, labels = l) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey")) + ggtitle("MATRICULADOS") + xlab("") + ylab("% ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(breaks = seq(0, 60, by = 5), limits = c(0,60)) + geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=-0.5, hjust=0.5 ,col="black") + scale_x_discrete(breaks = c("1","2"), labels = c("Si", "No"))

tab.Na<-as.data.frame(prop.table(table(S$NACIONALIDAD.REGIONAL))*100)
colnames(tab.Na)<-c("Na", "PORCENTAJE")
library(ggplot2)
ggplot(tab.Na, aes(x = Na, y = PORCENTAJE)) + geom_bar(stat = "identity", width = 0.8, fill = c("darkred", "dark green", "pink", "yellow", "orange")) + scale_fill_discrete(name = "", breaks = n, labels = l) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey")) + ggtitle("REGIÓN") + xlab("") + ylab("% ENCUESTADOS") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(breaks = seq(0, 90, by = 10), limits = c(0,90)) + geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=0.5, hjust=-0.2 ,col="black") + scale_x_discrete(breaks = c("1","2", "3","4","5"), labels = c("Valle del Cauca", "Cauca", "Quindio", "Nariño", "Cundinamarca")) + coord_flip()

tab.EC<-as.data.frame(prop.table(table(S$ESTADO.CIVIL))*100)
colnames(tab.EC)<-c("EC", "PORCENTAJE")
library(ggplot2)
ggplot(tab.EC, aes(x="", y = PORCENTAJE, fill = EC)) + geom_bar(stat = "identity", width = 1)+coord_polar("y", start=0)+scale_fill_brewer(palette = "Set1", labels=c("soltero","Casado"))+ labs(title = "ESTADO CIVIL", x = NULL, y = NULL, fill = "ESTADO CIVIL")+scale_x_discrete(labels=NULL,breaks = NULL)+scale_y_discrete(labels=NULL,breaks = NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 1), size=4, vjust=0, hjust=1.2 ,col="black")+ylim(0, 100)+ theme(plot.title = element_text(hjust = 0.5)) + theme(legend.position = "right", legend.background = element_rect(fill = "white", size = 0.5, linetype = "solid", colour = "darkgrey"))
Scale for 'y' is already present. Adding another scale for 'y', which
will replace the existing scale.

Análisis:
VARIABLE NIVEL EDUCATIVO: El 56% de la muestra son estudiantes de pregrado.
VARIABLE SEXO: El 56% de las personas encuestadas son mujeres. Con respecto al número de mujeres estudiando la carrera de Ingeniería Civil, se observa que ha habido un incremento en comparación a los últimos años a nivel de percepción, pero para conocer con exactitud el incremento, se deberá recolectar datos de las admisiones de los años anteriores de la carrera y realizar un análisis estadístico.
VARIABLE HERMANOS: El 28% de los encuestados tiene un hermano.
VARIBLE HIJOS: El 76% de los encuestados no tiene hijos. Con los datos obtenidos se puede inferir que la tendencia en un ambiente universitario con edades menores a los 30 años es a no tener hijos, al menos en ese rango de edad.
VARIABLE ESTRATO: La mayoría de la muestra (52%), se encuentra en un estrato socio-económico 3.
VARIABLE MATRICULADOS: El 56% de los estudiantes se encuentran matriculados en el curso de seminario de construcción. Para obtener la información de los estudiantes que aprueban el curso, se debe tener los datos de las calificaciones finales de los estudiantes, además se debe confirmar cuantos estudiantes realmente matricularon la materia, ya que eso cambiaría la muestra de estudio.
VARIABLE REGIÓN: La mayoría de los encuestados son originarios del Valle del Cauca (84%)
VARIABLE ESTADO CIVIL: El 88% de los encuestados es soltero.
Para las variables de Edad, Peso y Estatura se obtuvieron las medidas de tendencia central y de dispersión.
summary(Edad)
Min. 1st Qu. Median Mean 3rd Qu. Max.
21.00 23.00 25.00 28.56 30.00 49.00
var(Edad)
[1] 74.92333
sd (Edad)
[1] 8.655827
range(Edad)
[1] 21 49
table(Edad)
Edad
21 22 23 24 25 26 27 28 30 31 37 40 47 48 49
2 3 4 2 2 2 2 1 1 1 1 1 1 1 1
summary(Peso)
Min. 1st Qu. Median Mean 3rd Qu. Max.
50.00 57.00 70.00 67.64 75.00 98.00
var(Peso)
[1] 156.1567
sd (Peso)
[1] 12.49627
range(Peso)
[1] 50 98
table(Peso)
Peso
50 51 54 57 59 60 65 70 71 72 74 75 76 78 80 90 98
2 1 1 4 1 1 2 1 1 2 1 2 1 2 1 1 1
summary(Est)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.520 1.600 1.670 1.677 1.750 1.880
var(Est)
[1] 0.01096433
sd (Est)
[1] 0.1047107
range(Est)
[1] 1.52 1.88
table(Est)
Est
1.52 1.53 1.54 1.57 1.58 1.6 1.62 1.65 1.67 1.68 1.7 1.72 1.75 1.78
1 1 1 2 1 3 1 2 1 1 2 1 2 1
1.79 1.8 1.83 1.84 1.88
1 1 1 1 1
Análisis:
La edad que más se repite es 22 años y la edad promedio de los encuestados es de 28.56 ~ 29 años. Con una mediana de 25 años. Posee una varianza alta, esto se puede atribuir a que existen edades entre los 37 a los 49 años que hace que aumente la dispersión de los datos.
El peso que más se repite es de 57 kg y el peso promedio de los encuestados es de 67.64 ~ 68 kg. Con una mediana de 70 kg. La varianza es alta debido a valores atípicos de 90 y 98 kg.
La estatura que más se repite es de 1.6 m y la estatura promedio de los encuestados es de 1.677 ~ 1.7 m. Con una mediana de 1.67 m. La varianza es pequeña debido a que los datos no se encuentran tan dispersos.
