Actividad 5 Ciencia de datos en acción Programando en R

Cargue de archivo plano

setwd("C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller/")
getwd()

## [1] "C:/Users/Emerson Fierro S/OneDrive - misena.edu.co/Documentos/Emerson/Learning/ING Ciencia de Datos/Fundamentos Ciencias de Datos/Unidad II/Taller"

df <- read.csv("Encuesta.csv", sep=",")

Punto 1.

Realizar una tabla de frecuencias absolutas y otra de frecuencias relativas para la variable Calificación. Almacena las tablas anteriores en dos variables y llámalas absolutas y relativas.

library(knitr)
library(kableExtra)
library("ggplot2")

absolutas <- table(df$Nota)
relativo <- 100*absolutas/nrow(df)

absolutas %>%
  kbl(caption  =  "Absolutas") %>%
  kable_minimal(full_width = F, position = "left");

Absolutas
Var1	Freq
1	6
2	4
3	10
4	5
5	5

relativo %>%
  kbl(caption  =  "Relativo") %>%
  kable_minimal(full_width = F, position = "left");

Relativo
Var1	Freq
1	20.00000
2	13.33333
3	33.33333
4	16.66667
5	16.66667

Punto 2.

Representar la variable ciudad mediante un diagrama de barras y un diagrama de sectores. Incluye un título adecuado para cada gráfico y colorea las barras y los sectores de colores diferentes.

barplot(table(df$Ciudad),col = heat.colors(4),main = "Grafico de barras por ciudades", ylab ="Frecuencia  absoluta", xlab="Ciudades")

Punto 3.

Para la variable Edad, realizar un histograma y un diagrama de caja y bigotes considerando la opción range = 1.5. Incluye un título apropiado para cada gráfico y colorea las barras del histograma de color amarillo.

¿Existe algún valor atípico en esta variable?

Respuesta: No se registran valores atípicos.

Reduce el valor del argumento range hasta 0.5. ¿Varían las conclusiones?

Respuesta: No varían.

hist(df$Edad,col = heat.colors(6), main =  "Histograma de edad")

boxplot(df$Edad, horizontal = T, notch = T, col = "bisque", range = 0.5)

Punto 4.

Realizar un resumen de la variable Puntuación mediante la orden summary. Comprueba que las medidas que proporciona summary coinciden con las medidas calculadas de forma individual usando su función específica.

summary(df) %>%
  kbl(caption  =  "Comando Summary") %>%
  kable_minimal(full_width = F, position = "left");

Comando Summary
Sexo	Edad	Estatura	Nota	Ciudad
Length:30	Min. :26.0	Min. :150.0	Min. :1.000	Length:30
Class :character	1st Qu.:33.0	1st Qu.:171.2	1st Qu.:2.000	Class :character
Mode :character	Median :40.0	Median :185.0	Median :3.000	Mode :character
NA	Mean :41.5	Mean :179.5	Mean :2.967	NA
NA	3rd Qu.:50.5	3rd Qu.:192.8	3rd Qu.:4.000	NA
NA	Max. :60.0	Max. :199.0	Max. :5.000	NA

operation <- c("Min","1st Qu.","Median","Mean","3rd Qu.","Max")
result <- c(min(df$Nota),quantile(df$Nota,.25),median(df$Nota),mean(df$Nota),quantile(df$Nota,.75),max(df$Nota));

ind <- data.frame(operation,result)

ind %>%
  kbl(caption  =  "Funciones individuales para la variable Nota") %>%
  kable_minimal(full_width = F, position = "left");

Funciones individuales para la variable Nota
operation	result
Min	1.000000
1st Qu.	2.000000
Median	3.000000
Mean	2.966667
3rd Qu.	4.000000
Max	5.000000

Punto 5.

Calcular la estatura media de los estudiantes y proporcionar al menos, dos medidas que indiquen la dispersión de esta variable.

operationII <- c("Variacion","Desviacion Estandar")
resultII <- c(var(df$Estatura),sd(df$Estatura));

indII <- data.frame(operationII,resultII)

indII %>%
  kbl(caption  =  "Funciones individuales para la variable Nota") %>%
  kable_minimal(full_width = F, position = "left");

Funciones individuales para la variable Nota
operationII	resultII
Variacion	253.9816
Desviacion Estandar	15.9368

Conclusiones

En resumen con el análisis propuesto en el taller podemos deducir los siguientes descubrimientos

La mayoria de los integrantes su nota es inferior de 3.
La ciudad principal de la muestra es Medellín
El mayor grupo de edad de los integrantes es el grupo de 25 a 30 años.
En promedio los estudiantes obtienen un puntaje de 2.97

Gracias.

Actividad 5 Ciencia de datos en acción Programando en R - Ejercicio 1

Emerson Fierro

2022-10-08