| Cargue de archivo plano |
setwd("C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller/")
getwd()
## [1] "C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller"
df <- read.csv("Encuesta.csv", sep=",")
Realizar una tabla de frecuencias absolutas y otra de frecuencias relativas para la variable Calificación. Almacena las tablas anteriores en dos variables y llámalas absolutas y relativas.
library(knitr)
library(kableExtra)
library("ggplot2")
absolutas <- table(df$Nota)
relativo <- 100*absolutas/nrow(df)
absolutas %>%
kbl(caption = "Absolutas") %>%
kable_minimal(full_width = F, position = "left");
| Var1 | Freq |
|---|---|
| 1 | 6 |
| 2 | 4 |
| 3 | 10 |
| 4 | 5 |
| 5 | 5 |
relativo %>%
kbl(caption = "Relativo") %>%
kable_minimal(full_width = F, position = "left");
| Var1 | Freq |
|---|---|
| 1 | 20.00000 |
| 2 | 13.33333 |
| 3 | 33.33333 |
| 4 | 16.66667 |
| 5 | 16.66667 |
Representar la variable ciudad mediante un diagrama de barras y un diagrama de sectores. Incluye un título adecuado para cada gráfico y colorea las barras y los sectores de colores diferentes.
barplot(table(df$Ciudad),col = heat.colors(4),main = "Grafico de barras por ciudades", ylab ="Frecuencia absoluta", xlab="Ciudades")
Para la variable Edad, realizar un histograma y un diagrama de caja y bigotes considerando la opción range = 1.5. Incluye un título apropiado para cada gráfico y colorea las barras del histograma de color amarillo.
¿Existe algún valor atípico en esta variable?
Respuesta: No se registran valores atípicos.
Reduce el valor del argumento range hasta 0.5. ¿Varían las conclusiones?
Respuesta: No varían.
hist(df$Edad,col = heat.colors(6), main = "Histograma de edad")
boxplot(df$Edad, horizontal = T, notch = T, col = "bisque", range = 0.5)
Realizar un resumen de la variable Puntuación mediante la orden summary. Comprueba que las medidas que proporciona summary coinciden con las medidas calculadas de forma individual usando su función específica.
summary(df) %>%
kbl(caption = "Comando Summary") %>%
kable_minimal(full_width = F, position = "left");
| Sexo | Edad | Estatura | Nota | Ciudad | |
|---|---|---|---|---|---|
| Length:30 | Min. :26.0 | Min. :150.0 | Min. :1.000 | Length:30 | |
| Class :character | 1st Qu.:33.0 | 1st Qu.:171.2 | 1st Qu.:2.000 | Class :character | |
| Mode :character | Median :40.0 | Median :185.0 | Median :3.000 | Mode :character | |
| NA | Mean :41.5 | Mean :179.5 | Mean :2.967 | NA | |
| NA | 3rd Qu.:50.5 | 3rd Qu.:192.8 | 3rd Qu.:4.000 | NA | |
| NA | Max. :60.0 | Max. :199.0 | Max. :5.000 | NA |
operation <- c("Min","1st Qu.","Median","Mean","3rd Qu.","Max")
result <- c(min(df$Nota),quantile(df$Nota,.25),median(df$Nota),mean(df$Nota),quantile(df$Nota,.75),max(df$Nota));
ind <- data.frame(operation,result)
ind %>%
kbl(caption = "Funciones individuales para la variable Nota") %>%
kable_minimal(full_width = F, position = "left");
| operation | result |
|---|---|
| Min | 1.000000 |
| 1st Qu. | 2.000000 |
| Median | 3.000000 |
| Mean | 2.966667 |
| 3rd Qu. | 4.000000 |
| Max | 5.000000 |
Calcular la estatura media de los estudiantes y proporcionar al menos, dos medidas que indiquen la dispersión de esta variable.
operationII <- c("Variacion","Desviacion Estandar")
resultII <- c(var(df$Estatura),sd(df$Estatura));
indII <- data.frame(operationII,resultII)
indII %>%
kbl(caption = "Funciones individuales para la variable Nota") %>%
kable_minimal(full_width = F, position = "left");
| operationII | resultII |
|---|---|
| Variacion | 253.9816 |
| Desviacion Estandar | 15.9368 |
En resumen con el análisis propuesto en el taller podemos deducir los siguientes descubrimientos
Gracias.