Cargue de archivo plano
setwd("C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller/")
getwd()
## [1] "C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller"
df <- read.csv("Encuesta.csv", sep=",")

Punto 1.

Realizar una tabla de frecuencias absolutas y otra de frecuencias relativas para la variable Calificación. Almacena las tablas anteriores en dos variables y llámalas absolutas y relativas.

library(knitr)
library(kableExtra)
library("ggplot2")

absolutas <- table(df$Nota)
relativo <- 100*absolutas/nrow(df)

absolutas %>%
  kbl(caption  =  "Absolutas") %>%
  kable_minimal(full_width = F, position = "left");
Absolutas
Var1 Freq
1 6
2 4
3 10
4 5
5 5
relativo %>%
  kbl(caption  =  "Relativo") %>%
  kable_minimal(full_width = F, position = "left");
Relativo
Var1 Freq
1 20.00000
2 13.33333
3 33.33333
4 16.66667
5 16.66667

Punto 2.

Representar la variable ciudad mediante un diagrama de barras y un diagrama de sectores. Incluye un título adecuado para cada gráfico y colorea las barras y los sectores de colores diferentes.

barplot(table(df$Ciudad),col = heat.colors(4),main = "Grafico de barras por ciudades", ylab ="Frecuencia  absoluta", xlab="Ciudades")

Punto 3.

Para la variable Edad, realizar un histograma y un diagrama de caja y bigotes considerando la opción range = 1.5. Incluye un título apropiado para cada gráfico y colorea las barras del histograma de color amarillo.

¿Existe algún valor atípico en esta variable?

Respuesta: No se registran valores atípicos.

Reduce el valor del argumento range hasta 0.5. ¿Varían las conclusiones?

Respuesta: No varían.

hist(df$Edad,col = heat.colors(6), main =  "Histograma de edad")

boxplot(df$Edad, horizontal = T, notch = T, col = "bisque", range = 0.5)

Punto 4.

Realizar un resumen de la variable Puntuación mediante la orden summary. Comprueba que las medidas que proporciona summary coinciden con las medidas calculadas de forma individual usando su función específica.

summary(df) %>%
  kbl(caption  =  "Comando Summary") %>%
  kable_minimal(full_width = F, position = "left");
Comando Summary
Sexo Edad Estatura Nota Ciudad
Length:30 Min. :26.0 Min. :150.0 Min. :1.000 Length:30
Class :character 1st Qu.:33.0 1st Qu.:171.2 1st Qu.:2.000 Class :character
Mode :character Median :40.0 Median :185.0 Median :3.000 Mode :character
NA Mean :41.5 Mean :179.5 Mean :2.967 NA
NA 3rd Qu.:50.5 3rd Qu.:192.8 3rd Qu.:4.000 NA
NA Max. :60.0 Max. :199.0 Max. :5.000 NA
operation <- c("Min","1st Qu.","Median","Mean","3rd Qu.","Max")
result <- c(min(df$Nota),quantile(df$Nota,.25),median(df$Nota),mean(df$Nota),quantile(df$Nota,.75),max(df$Nota));

ind <- data.frame(operation,result)

ind %>%
  kbl(caption  =  "Funciones individuales para la variable Nota") %>%
  kable_minimal(full_width = F, position = "left");
Funciones individuales para la variable Nota
operation result
Min 1.000000
1st Qu. 2.000000
Median 3.000000
Mean 2.966667
3rd Qu. 4.000000
Max 5.000000

Punto 5.

Calcular la estatura media de los estudiantes y proporcionar al menos, dos medidas que indiquen la dispersión de esta variable.

operationII <- c("Variacion","Desviacion Estandar")
resultII <- c(var(df$Estatura),sd(df$Estatura));

indII <- data.frame(operationII,resultII)

indII %>%
  kbl(caption  =  "Funciones individuales para la variable Nota") %>%
  kable_minimal(full_width = F, position = "left");
Funciones individuales para la variable Nota
operationII resultII
Variacion 253.9816
Desviacion Estandar 15.9368

Conclusiones

En resumen con el análisis propuesto en el taller podemos deducir los siguientes descubrimientos

Gracias.