Supongamos que realizamos una encuesta para saber a que Universidad pertenecen los estudiantes de Licenciatura en Enología en la ciudad de Mendoza Obtenemos los siguientes resultados
Uncuyo, Maza, UTN,UTN,UTN, Don Bosco, Don Bosco, Don Bosco ,Don Bosco, UTN, Maza,Maza,Maza,Maza,Maza,Maza,Maza,UTN,UTN,Uncuyo,Uncuyo,Uncuyo,Uncuyo,Uncuyo,Don Bosco, Don Bosco ,Don Bosco, Maza, Maza, Maza, Maza, Maza
Lo primero que deseamos saber que cantidad de alumnos estudian en cada una de las Universidades. Primeramente crearemos un objeto (vector) donde guardaremos todos los datos
datos <- c("Uncuyo", "Maza", "UTN","UTN","UTN", "Don Bosco", "Don Bosco", "Don Bosco" ,"Don Bosco", "UTN", "Maza","Maza","Maza","Maza","Maza","Maza","Maza","UTN","UTN","Uncuyo","Uncuyo","Uncuyo","Uncuyo","Uncuyo","Don Bosco", "Don Bosco" ,"Don Bosco", "Maza", "Maza", "Maza", "Maza", "Maza")
Para conocer el contendio que hay en el objeto datos, simplemente escribo datos
datos
## [1] "Uncuyo" "Maza" "UTN" "UTN" "UTN"
## [6] "Don Bosco" "Don Bosco" "Don Bosco" "Don Bosco" "UTN"
## [11] "Maza" "Maza" "Maza" "Maza" "Maza"
## [16] "Maza" "Maza" "UTN" "UTN" "Uncuyo"
## [21] "Uncuyo" "Uncuyo" "Uncuyo" "Uncuyo" "Don Bosco"
## [26] "Don Bosco" "Don Bosco" "Maza" "Maza" "Maza"
## [31] "Maza" "Maza"
Para conocer la proporción de alumnos que estudian en cada Universidad (Frecuencia Absoluta) utilizo la función “table”"
Fre_abs<-table(datos)
Fre_abs
## datos
## Don Bosco Maza Uncuyo UTN
## 7 13 6 6
Si quisiera conocer el tamaño de la muesta (n) utilizo la funcion “length”
n<-length(datos)
El tamaño de la muestra es de 32 estudiantes
Para conocer la frecuencia relativa utilizo la función “prop.table”
Fre_rel<-prop.table(table(datos))
Fre_rel
## datos
## Don Bosco Maza Uncuyo UTN
## 0.21875 0.40625 0.18750 0.18750
Para conocer la frecuencia relativa porcentual simplemente multiplico por 100
Fre_por<-prop.table(table(datos))*100
Fre_por
## datos
## Don Bosco Maza Uncuyo UTN
## 21.875 40.625 18.750 18.750
tablafrecuencias<-cbind(Fre_abs, Fre_rel,Fre_por)
tablafrecuencias
## Fre_abs Fre_rel Fre_por
## Don Bosco 7 0.21875 21.875
## Maza 13 0.40625 40.625
## Uncuyo 6 0.18750 18.750
## UTN 6 0.18750 18.750
Si deseo conocer la moda utilizo la función “moda”
moda <- tablafrecuencias[which.max(Fre_abs),1]
moda
## [1] 13
La moda es la categoría que tiene la mayor frecuencia absoluta, por lo tanto la moda en este caso es la universidad Maza
La razón de variación es:
razon<-(n-moda)/n
razon
## [1] 0.59375
La razión de variación es la proporción de individuos que No pertenecen a la moda. En este caso casi el 60 % de los individuos no va a la Universidad Maza. Nos da una idea de la variación de los datos
Para visualizar los datos puedo utilizar un diagrama de torta o un diagrama de barras
Para realizar el diagrama de tortas sobre la frecuencias absolutas utilizo la función “pie”. Del mismo modo puedo hacer el gráfico de tortas para cada una de las frecuencias.
pie(Fre_abs)
Es importante poner los títulos en los gráficos
pie(Fre_abs,main = "Frecuencia absoluta")
Si quisiera cambiar el tamaño de las letra utilizo la función “cex”
pie(Fre_abs,main = "Frecuencia absoluta", cex=3)
Si quisiera cambiar los colores
pie(Fre_abs,main = "Frecuencia absoluta", col=c("green", "black","white", "yellow"))
También puedo construir un gráfico de barras y puedo modificar el gráfico al igual que con el gráfico de torta
barplot(Fre_por)
barplot(Fre_por, main="Porcentaje de alumnos que asisten a las distintas universidades", col=c("green", "blue","red","skyblue"))
barplot(Fre_por, main="Porcentaje de alumnos que asisten a las distintas universidades", col=c("green", "blue","red","skyblue"), horiz = TRUE)