library(dplyr)
library(ggplot2)
library(descriptr)
library(plotrix)
library(knitr)
library(fdth)
library(readxl)
library(moments)
library(readxl)
BASE_ESTADISTICA <- read_excel("BASE_ESTADISTICA.xlsx")
set.seed(69)
datos_ba <- (BASE_ESTADISTICA)
datos_ba <- sample_n(BASE_ESTADISTICA, size=160, replace = FALSE)
is.data.frame(datos_ba)
## [1] TRUE

Pregunta 1

Determine el porcentaje de hombres que tienen estudios universitarios y muestre cuál es la cantidad total de mujeres participantes.

p1 <- table(datos_ba$Genero, datos_ba$NivelEducativo);p1
##            
##             Primaria Secundaria Técnico Universitario
##   Femenino        17         13      11             6
##   Masculino        9         19      13            10
##   Otro            10         24      14            14
p1 <- round(prop.table(p1) * 100, 3);p1
##            
##             Primaria Secundaria Técnico Universitario
##   Femenino    10.625      8.125   6.875         3.750
##   Masculino    5.625     11.875   8.125         6.250
##   Otro         6.250     15.000   8.750         8.750
p1 <- addmargins(p1):p1
rm(p1)

Pregunta 2

Elabore un diagrama de caja y bigotes para la variable estatura en función del género y analice la gráfica.

boxplot(datos_ba$Estatura~datos_ba$Genero,
        col = c("skyblue", "lightgreen", "lightpink"),
        main = "Estatura según género",xlab = "Género",ylab = "Estatura")

Pregunta 3

resuelva los siguientes puntos.

###A.

Elabore un diagrama de barras para la variable Hermanos y determine qué cantidad es la más frecuente.

h <- table(datos_ba$Hermanos)
barplot(h,
        col = c("pink", "skyblue", "#EEE8CD", "#EEE0E5", "#FFE7BA", "#CDBE70", "#E0EEEE"))

###B.

Elabore un diagrama de torta en 3D para la variable NivelEducativo.

h <- table(datos_ba$NivelEducativo)
pie3D(h,
      col = c("pink", "skyblue", "#EEE8CD", "#EEE0E5"),
      main = "Nivel Educativo")

###C.

Elabore una tabla de frecuencias, el histograma y el polígono de fre-cuencias para la variable HorasDeTrabajo.

h <- fdt(datos_ba$HorasDeTrabajo, k=7)

plot(h,
     type = "fh",             
     col = "skyblue",         
     border = "darkblue",     
     main = "Horas de Trabajo", 
     xlab = "Horas", 
     ylab = "Frecuencia")

###D. Elabore un dataframe con las medidas de tendencia central, de varia-bilidad, Q1 ,Q3 y las medidas de forma para la variable IingresoMensual.

resumen_ingreso <- data.frame(
  media    = mean(datos_ba$IngresoMensual, na.rm = TRUE),
  mediana  = median(datos_ba$IngresoMensual, na.rm = TRUE),
  varianza = var(datos_ba$IngresoMensual, na.rm = TRUE),
  q1       = quantile(datos_ba$IngresoMensual, 0.25, na.rm = TRUE),
  q3       = quantile(datos_ba$IngresoMensual, 0.75, na.rm = TRUE)
)

resumen_ingreso
##        media  mediana varianza      q1      q3
## 25% 1991.486 2025.185 591146.6 1469.81 2529.54