library(dplyr)
library(descriptr)
library(knitr)
library(modeest)
library(fdth)
library(readxl)
library(readxl)
setwd("~/Desktop")
Estadistica_d<- read_excel("Base_Estadistica_Descriptiva.xlsx")
set.seed(49)
datos_E <- Estadistica_d
datos_e <- sample_n(Estadistica_d, size= 160, replace = FALSE)
Determine el porcentaje de hombres que tienen estudios universitarios y muestre cuál es la cantidad total de mujeres participantes.
tabla <- table(datos_e$Genero, datos_e$NivelEducativo)
por_h <- (tabla["Masculino","Universitario"] / sum(tabla["Masculino",])) * 100
total_m <- sum(tabla["Femenino",])
resultado <- data.frame(Indicador = c("Porcentaje hombres universitarios","Total mujeres"), Valor = c(paste0(round(por_h,2), "%"),
total_m))
kable(resultado)
Indicador | Valor |
---|---|
Porcentaje hombres universitarios | 22.45% |
Total mujeres | 47 |
Elabore un diagrama de caja y bigotes para la variable estatura en función del género y analice la gráfica
boxplot(datos_e$Estatura ~ datos_e$Genero,
col=c("darkseagreen", "darkseagreen2", "darkseagreen3"), main = "Correlación Estatura-Género", xlab = "Género", ylab = "Estatura")
Analisis: En el gráfico se observa que los tres grupos presentan una dispersión similar en sus datos, con rangos intercuartílicos muy parecidos, lo que sugiere que la varianza y la desviación estándar de la estatura son semejantes entre ellos. La mediana del grupo “Otro” es más alta que la de Femenino y Masculino, indicando una tendencia central ligeramente mayor, aunque los bigotes muestran una gran superposición, lo que implica que los valores individuales se mezclan bastante entre categorías. En conclusión, sí se puede afirmar que el grupo “Otro” tiende a tener una estatura mediana más elevada, pero que la variabilidad interna es prácticamente la misma en los tres grupos.
###Pregunta 3a
Elabore un diagrama de barras para la variable Hermanos y determine qué cantidad es la más frecuente
frec_hermanos <- table(datos_e$Hermanos)
barplot(frec_hermanos, col = rainbow(69),border= "black", ylab = "Frecuencia", main = "Hermanos", xlab = "C. Hermanos")
La cantidad más frecuente es 1 hermano
###Pregunta 3b
Elabore un diagrama de torta en 3D para la variable NivelEducativo
library(plotrix)
tabla_q <- table(datos_e$NivelEducativo)
pie3D(tabla_q,
labels = names(tabla_q), explode = 0.1, col = rainbow(length(tabla_q)), main = "Nivel Educativo",
labelcex = 0.9)
###Pregunta 3c
Elabore una tabla de frecuencias, el histograma y el polígono de frecuencias para la variable HorasDeTrabajo.
frec_horas <- table(datos_e$HorasDeTrabajo)
kable(frec_horas)
Var1 | Freq |
---|---|
13.3 | 1 |
19.4 | 1 |
21.4 | 1 |
22.4 | 1 |
22.8 | 2 |
24.5 | 1 |
24.8 | 1 |
25.1 | 1 |
25.5 | 1 |
25.9 | 1 |
26 | 1 |
26.7 | 1 |
27.5 | 1 |
28.1 | 1 |
28.2 | 2 |
28.3 | 1 |
28.5 | 1 |
28.6 | 1 |
28.9 | 1 |
29.1 | 1 |
29.2 | 1 |
29.8 | 1 |
30 | 1 |
30.5 | 1 |
31 | 1 |
31.1 | 1 |
31.2 | 1 |
31.5 | 1 |
31.6 | 1 |
31.9 | 1 |
32 | 3 |
32.6 | 2 |
33 | 1 |
33.2 | 2 |
33.8 | 2 |
34.6 | 1 |
34.7 | 1 |
34.8 | 1 |
34.9 | 2 |
35.2 | 1 |
35.3 | 1 |
35.5 | 2 |
35.6 | 1 |
35.7 | 1 |
36 | 1 |
36.2 | 1 |
36.4 | 2 |
36.8 | 1 |
37 | 1 |
37.3 | 1 |
37.7 | 1 |
37.9 | 1 |
38.1 | 1 |
38.2 | 3 |
38.4 | 2 |
38.5 | 1 |
38.7 | 1 |
38.9 | 1 |
39 | 1 |
39.4 | 3 |
39.5 | 2 |
39.9 | 1 |
40.2 | 1 |
40.4 | 1 |
40.5 | 1 |
40.7 | 1 |
40.8 | 1 |
41.2 | 1 |
41.3 | 1 |
41.5 | 2 |
41.6 | 1 |
41.8 | 1 |
41.9 | 2 |
42.1 | 1 |
42.9 | 3 |
43.4 | 1 |
43.5 | 1 |
43.6 | 1 |
43.7 | 1 |
44.1 | 1 |
44.2 | 2 |
44.3 | 1 |
44.4 | 2 |
44.7 | 2 |
44.8 | 1 |
44.9 | 1 |
45.2 | 1 |
45.3 | 2 |
45.6 | 1 |
45.7 | 1 |
46 | 3 |
46.3 | 2 |
46.4 | 1 |
46.7 | 1 |
46.9 | 1 |
47.2 | 1 |
47.5 | 1 |
47.6 | 2 |
47.8 | 1 |
47.9 | 1 |
48.4 | 1 |
48.5 | 1 |
48.8 | 1 |
49 | 1 |
49.1 | 1 |
49.3 | 2 |
49.4 | 2 |
49.7 | 1 |
49.8 | 2 |
50 | 1 |
50.3 | 1 |
50.5 | 1 |
50.9 | 1 |
51 | 1 |
51.3 | 1 |
51.7 | 1 |
53.7 | 1 |
53.8 | 1 |
54.4 | 1 |
54.6 | 1 |
54.8 | 1 |
55.5 | 1 |
55.9 | 1 |
56.1 | 1 |
56.3 | 1 |
56.6 | 2 |
60.4 | 1 |
62.5 | 1 |
frec_horas <- table(datos_e$HorasDeTrabajo)
histo_horas <- hist(frec_horas, main = "Frecuencia Horas", xlab = "Frecuencia", ylab = "Cantidad Horas", col = c("pink", "purple", "darkblue", "grey", "lightblue"))
###Pregunta 3d
Elabore un dataframe con las medidas de tendencia central, de variabilidad, Q1 ,Q3 y las medidas de forma para la variable IingresoMensual.
library(descriptr)
library(dplyr)
library(descriptr)
library(knitr)
library(modeest)
library(fdth)
library(readxl)
setwd("~/Desktop")
Estadistica_d<- read_excel("Base_Estadistica_Descriptiva.xlsx")
set.seed(49)
datos_E <- Estadistica_d
datos_e <- sample_n(Estadistica_d, size= 160, replace = FALSE)
resumen_deIM <- ds_tidy_stats(datos_e, IngresoMensual)
kable(resumen_deIM)
vars | min | max | mean | t_mean | median | mode | range | variance | stdev | skew | kurtosis | coeff_var | q1 | q3 | iqrange |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
IngresoMensual | -274.41 | 3707.4 | 2046.202 | 2056.678 | 2077.665 | -274.41 | 3981.81 | 567877.6 | 753.5766 | -0.1971345 | 0.0005996 | 36.82807 | 1522.467 | 2560.423 | 1037.955 |