Se realizó una encuesta a los estudiantes del curso de seminario de estadística, la cual consta de 12 variables. Esta encuesta se realizo con el fin de realizar algunas operaciones estadisticas y para el uso del programa R-studio en su anÔlisis.

DATOS<-read.csv("ESTADISTICA-MATRIZ.csv", stringsAsFactors = F, header= TRUE)

Las variables de la encuesta realizada son las que se enumeran enseguida:

names(DATOS)
 [1] "NOMBRE"       "EDAD"         "ESTATURA"     "PESO"         "CARRERA"     
 [6] "HIJOS"        "HERMANOS"     "ESTRATO"      "REGION"       "ESTADO.CIVIL"
[11] "MATRICULADO"  "SEXO"        

La cantidad de personas a las cuales se le hizo la encuenta fueron:

length(DATOS[,4])
[1] 22

A continuación se mostraran los respectivos histogramas de las variables estudiadas.

ggplot(DATOS,aes(x=DATOS[,2]))+geom_histogram(breaks=seq(20,50, by=7),binwidth =8,color="black", fill = "blue")+scale_x_continuous(name = "Rango de edad [AƱos]",breaks = seq(20,50, by=7),limits=c(20,50)) +
        scale_y_continuous(name = "Cantidad de personas encuestadas",limits=c(0,17),breaks = seq(0,16, by=1)) +
        ggtitle("Histograma de edades") +annotate("text", x=c(23.5,30.5,37.5,44.5),y=c(16.5,3.5,1.5,2.5),label=c("72.72%","16.64%","4.54%","9.1%"))

del anterior grafico se puede observar que 3 de las 22 personas encuestadas se encuentran en un rango de edad de 27-34 AƱos

ggplot(DATOS,aes(x=DATOS[,3]))+geom_histogram(breaks=seq(1.52,1.88, by=0.09),binwidth =8,color="black", fill = "red")+scale_x_continuous(name = "Rango de estatura",breaks = seq(1.52,1.88, by=0.09),limits=c(1.52,1.88)) +
        scale_y_continuous(name = "Cantidad de personas encuestadas",limits=c(0,10),breaks = seq(0,9, by=1)) +
        ggtitle("Histograma de estaturas")+annotate("text", x=c(1.565,1.655,1.745,1.835),y=c(9.5,6.5,3.5,4.5),label=c("40.9%","27.27%","13.64%","18.18%"))

del grafico anterior se puede observar que de las 22 personas encuestadas la mayor parte tienen una estatura de 1.52m a 1.61m.

ggplot(DATOS,aes(x=DATOS[,4]))+geom_histogram(breaks=seq(50,98, by=9.6),binwidth =8,color="black", fill = "green")+scale_x_continuous(name = "Rango de pesos en [Kg]",breaks = seq(50,98, by=9.6),limits=c(50,98)) +
        scale_y_continuous(name = "Cantidad de personas encuestadas",limits=c(0,11),breaks = seq(0,10, by=1)) +
        ggtitle("Histograma de peso")+annotate("text", x=c(54.8,64.4,74,83.6,93.2),y=c(10.5,3.5,6.5,1.5,2.5),label=c("45.45%","13.64%","27.27%","4.54%","9.1%"))

En el anterior grafico se puede observar que la mayor parte de los encuestados tienen un peso de 50Kg a 59,6Kg y representa el 45.45% de los encuestados, y solo una persona pesa entre 78,8Kg y 88.4Kg que representan el 4.54%

C<-as.data.frame(prop.table(table(DATOS[,5]))*100)
colnames(C)<-c("NUMERO", "PORCENTAJE")
ggplot(C, aes(x= NUMERO, y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 0.8) +scale_fill_brewer(palette = "Set1", labels=c("Ing. Civl","Arquitectura","Matematicas"))+ labs(title = "Histograma de profesión", x = NULL, y = "porcentaje personas encuestadas", fill = NULL)+scale_x_discrete(labels=NULL)+scale_y_discrete(labels=NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=3, vjust=-0.5, hjust=0.5 ,col="black")+ylim(0, 90)+coord_flip()
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

el 81,82% de los encuestados estudian o tienen como profesion la Ingenieria civil.

H<-as.data.frame(prop.table(table(DATOS[,6]))*100)
colnames(H)<-c("NUMERO", "PORCENTAJE")
ggplot(H, aes(x= NUMERO, y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 0.8) +scale_fill_brewer(palette = "Set1", labels=c("0 HIJOS","1 HIJO","2 HIJOS","3 HIJOS"))+ labs(title = "Histograma de cantidad de hijos", x = NULL, y = "porcentaje personas encuestadas", fill = NULL)+scale_x_discrete(labels=NULL)+scale_y_discrete(labels=NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=3, vjust=-0.5, hjust=0.5 ,col="black")+ylim(0, 90)+coord_flip()
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

el 81,82% de los encuestados no tienen hijos aĆŗn.

HE<-as.data.frame(prop.table(table(DATOS[,7]))*100)
colnames(HE)<-c("NUMERO", "PORCENTAJE")
ggplot(HE, aes(x= NUMERO, y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 0.8) +scale_fill_brewer(palette = "Set1", labels=c("0","1","2","3","4","5","6"))+ labs(title = "Histograma de cantidad de hermanos", x = NULL, y = "porcentaje de personas encuestadas", fill = "Cantidad de hermanos")+scale_x_discrete(labels=NULL)+scale_y_discrete(labels=NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=3, vjust=-0.5, hjust=0.5 ,col="black")+ylim(0, 30)+coord_flip()
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

la mayor parte de los encuestados tienen 1 hermano y corresponden al 27,27% del total

ES<-as.data.frame(prop.table(table(DATOS[,8]))*100)
colnames(ES)<-c("NUMERO", "PORCENTAJE")
ggplot(ES, aes(x= NUMERO, y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 0.8) +scale_fill_brewer(palette = "Set1", labels=c("2","3","4","5"))+ labs(title = "Histograma de Estratos", x = NULL, y = "porcentaje de personas encuestadas", fill = "Estrato")+scale_x_discrete(labels=NULL)+scale_y_discrete(labels=NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=3, vjust=-0.5, hjust=0.5 ,col="black")+ylim(0,55)+coord_flip()
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

el 50% de los encuestados son de estrato 3 y solo el 9,09% son de estrato 5

NAC<-as.data.frame(prop.table(table(DATOS[,9]))*100)
colnames(NAC)<-c("NUMERO", "PORCENTAJE")
ggplot(NAC, aes(x= NUMERO, y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 0.8) +scale_fill_brewer(palette = "Set1", labels=c("Valle","Cauca","Quindio","NariƱo","Cundinamarca"))+ labs(title = "Histograma", x = "Lugar de nacimiento", y = "Porcentaje de personas encuestadas", fill = "Departamento")+scale_x_discrete(labels=NULL)+scale_y_discrete(labels=NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=3, vjust=-0.5, hjust=0.5 ,col="black")+ylim(0, 75)+coord_flip()
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

CIVIL<-as.data.frame(prop.table(table(DATOS[,10]))*100)
colnames(CIVIL)<-c("NUMERO", "PORCENTAJE")
ggplot(CIVIL, aes(x= "", y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 1) + coord_polar("y", start=0)+scale_fill_brewer(palette = "Set1", labels=c("Soltero","Casado"))+ labs(title = "Histograma de estado civil", x = NULL, y = NULL, fill = "Estado civil")+scale_x_discrete(labels=NULL)+scale_y_discrete(labels=NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 1.5), size=4, vjust=c(-0.3,1), hjust=c(1.2,1.3) ,col="black")+ylim(0, 100)+ coord_polar("y", start=0)
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

el 86,36% de los encuestados son solteros.

MA<-as.data.frame(prop.table(table(DATOS[,11]))*100)
colnames(MA)<-c("NUMERO", "PORCENTAJE")
ggplot(MA, aes(x= "", y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 1) + coord_polar("y", start=0)+scale_fill_brewer(palette = "Set1", labels=c("Si","No"))+ labs(title = "Histograma", x = NULL, y = NULL, fill = "Matriculado")+scale_x_discrete(labels=NULL,breaks = NULL)+scale_y_discrete(labels=NULL,breaks = NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=c(-10,-3), hjust=c(0.1,1) ,col="black")+ylim(0, 100)+ coord_polar("y", start=0)
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

SEX<-as.data.frame(prop.table(table(DATOS[,12]))*100)
colnames(SEX)<-c("NUMERO", "PORCENTAJE")
ggplot(SEX, aes(x= "", y = PORCENTAJE, fill = NUMERO)) + geom_bar(stat = "identity", width = 1) + coord_polar("y", start=0)+scale_fill_brewer(palette = "Set1", labels=c("Maculino","Femenino"))+ labs(title = "Histograma", x = NULL, y = NULL, fill = "Sexo")+scale_x_discrete(labels=NULL,breaks = NULL)+scale_y_discrete(labels=NULL,breaks = NULL)+ geom_text(aes(y = PORCENTAJE, label = paste(round(PORCENTAJE, 2), "%")), position = position_dodge(width = 0.5), size=4, vjust=c(-10,-3), hjust=c(0.1,0.3) ,col="black")+ylim(0, 100)+ coord_polar("y", start=0)
Scale for 'y' is already present. Adding another scale for 'y', which will replace
the existing scale.

la mayor parte de los encuestados son de genero masculino y corresponden al 63,64% del total de encuestados.

Las medidas de tendencia central(Moda, media y mediana), para algunas de las variables son las siguientes:

para la variable estatura

summary(DATOS[,3])
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.520   1.585   1.660   1.671   1.750   1.880 

Para la variable edad

summary(DATOS[,2])
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  21.00   23.00   24.50   27.41   27.75   48.00 

Para la variable Peso

summary(DATOS[,4])
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  50.00   57.00   62.50   65.91   74.75   98.00 
