library(dplyr)
library(ggplot2)
library(descriptr)
library(plotrix)
library(knitr)
library(fdth)
library(readxl)
library(moments)
library(readxl)
BASE_ESTADISTICA <- read_excel("BASE_ESTADISTICA.xlsx")
set.seed(69)
datos_ba <- (BASE_ESTADISTICA)
datos_ba <- sample_n(BASE_ESTADISTICA, size=160, replace = FALSE)
is.data.frame(datos_ba)
## [1] TRUE
Determine el porcentaje de hombres que tienen estudios universitarios y muestre cuál es la cantidad total de mujeres participantes.
p1 <- table(datos_ba$Genero, datos_ba$NivelEducativo);p1
##
## Primaria Secundaria Técnico Universitario
## Femenino 17 13 11 6
## Masculino 9 19 13 10
## Otro 10 24 14 14
p1 <- round(prop.table(p1) * 100, 3);p1
##
## Primaria Secundaria Técnico Universitario
## Femenino 10.625 8.125 6.875 3.750
## Masculino 5.625 11.875 8.125 6.250
## Otro 6.250 15.000 8.750 8.750
p1 <- addmargins(p1):p1
rm(p1)
Elabore un diagrama de caja y bigotes para la variable estatura en función del género y analice la gráfica.
boxplot(datos_ba$Estatura~datos_ba$Genero,
col = c("skyblue", "lightgreen", "lightpink"),
main = "Estatura según género",xlab = "Género",ylab = "Estatura")
resuelva los siguientes puntos.
###A.
Elabore un diagrama de barras para la variable Hermanos y determine qué cantidad es la más frecuente.
h <- table(datos_ba$Hermanos)
barplot(h,
col = c("pink", "skyblue", "#EEE8CD", "#EEE0E5", "#FFE7BA", "#CDBE70", "#E0EEEE"))
###B.
Elabore un diagrama de torta en 3D para la variable NivelEducativo.
h <- table(datos_ba$NivelEducativo)
pie3D(h,
col = c("pink", "skyblue", "#EEE8CD", "#EEE0E5"),
main = "Nivel Educativo")
###C.
Elabore una tabla de frecuencias, el histograma y el polÃgono de fre-cuencias para la variable HorasDeTrabajo.
h <- fdt(datos_ba$HorasDeTrabajo, k=7)
plot(h,
type = "fh",
col = "skyblue",
border = "darkblue",
main = "Horas de Trabajo",
xlab = "Horas",
ylab = "Frecuencia")
###D. Elabore un dataframe con las medidas de tendencia central, de varia-bilidad, Q1 ,Q3 y las medidas de forma para la variable IingresoMensual.
resumen_ingreso <- data.frame(
media = mean(datos_ba$IngresoMensual, na.rm = TRUE),
mediana = median(datos_ba$IngresoMensual, na.rm = TRUE),
varianza = var(datos_ba$IngresoMensual, na.rm = TRUE),
q1 = quantile(datos_ba$IngresoMensual, 0.25, na.rm = TRUE),
q3 = quantile(datos_ba$IngresoMensual, 0.75, na.rm = TRUE)
)
resumen_ingreso
## media mediana varianza q1 q3
## 25% 1991.486 2025.185 591146.6 1469.81 2529.54