##base de datos

Base.esta <- read_excel("C:/Users/Acer/Downloads/Base_Estadistica_Descriptiva.xlsx")
set.seed(6269)
datos.p<-sample_n(Base.esta, size=160,replace = FALSE)

##1 Determine el porcentaje de hombres que tienen estudios universitarios y muestre cuál es la cantidad total de mujeres participantes.

t1<-table(datos.p$NivelEducativo, datos.p$Genero)
addmargins(t1)
##                
##                 Femenino Masculino Otro Sum
##   Primaria             6        18   13  37
##   Secundaria          11        12   14  37
##   Técnico             14        12   13  39
##   Universitario       11        22   14  47
##   Sum                 42        64   54 160
kable(t1)
Femenino Masculino Otro
Primaria 6 18 13
Secundaria 11 12 14
Técnico 14 12 13
Universitario 11 22 14
t2<-table(datos.p$Genero);t2
## 
##  Femenino Masculino      Otro 
##        42        64        54
cat("hay 22 hombres con estudios universitarios y hay 42 mujeres en total")
## hay 22 hombres con estudios universitarios y hay 42 mujeres en total

2.

Elabore un diagrama de caja y bigotes para la variable estatura en función del género y analice la gráfica

boxplot(datos.p$Estatura~datos.p$Genero,xlab ="Genero", ylab = "Estatura",main="diagrama de caja estura y sexo",col=c("coral2","coral1","coral"))

cat("la varibilidad del genero masculino es mas grande desde 1.60 a cercano a 1.90,
    tanto Masculino y otro tienen una asimetria negativa sepuede decir que la mayori delos datos se encuentra cercano a 1.80 y el delas mujeres presenta una asimetria positiva la mayoria de sus participantes se encuentra en 1.75cm")
## la varibilidad del genero masculino es mas grande desde 1.60 a cercano a 1.90,
##     tanto Masculino y otro tienen una asimetria negativa sepuede decir que la mayori delos datos se encuentra cercano a 1.80 y el delas mujeres presenta una asimetria positiva la mayoria de sus participantes se encuentra en 1.75cm

3.(a) resuelva los siguientes puntos

[5 puntos] Elabore un diagrama de barras para la variable Hermanos y determine qué cantidad es la más frecuente.

tab.h<-table(datos.p$Hermanos)
barplot(tab.h, main ="diagrama de Cantidad de hermanos",xlab = "numero de hermanos",
        ylab="frecuencia", col = "coral3")

cat("la gran parte de las personas no tienen hermanos")
## la gran parte de las personas no tienen hermanos

(b)

[5 puntos] Elabore un diagrama de torta en 3D para la variable NivelEducativo.

tabla.edu<-table(datos.p$NivelEducativo);tabla.edu
## 
##      Primaria    Secundaria       Técnico Universitario 
##            37            37            39            47
pie3D(tabla.edu,labels = names(tabla.edu),main="nivel educativo")

cat("la mayoria se agrupa en la universidad con 47 personas, los segunda clase es el tecnico con 39 y primaria y secundaria estan iguales con 37 estudiantes")
## la mayoria se agrupa en la universidad con 47 personas, los segunda clase es el tecnico con 39 y primaria y secundaria estan iguales con 37 estudiantes

(c)

[5 puntos] Elabore una tabla de frecuencias, el histograma y el polígono de fre cuencias para la variable HorasDeTrabajo.

attach(datos.p)
tabla.hora<-fdt(x=datos.p$HorasDeTrabajo,k=8);tabla.hora
##     Class limits  f   rf rf(%)  cf  cf(%)
##   [16.434,22.46)  5 0.03  3.12   5   3.12
##   [22.46,28.486) 17 0.11 10.62  22  13.75
##  [28.486,34.511) 26 0.16 16.25  48  30.00
##  [34.511,40.537) 37 0.23 23.12  85  53.12
##  [40.537,46.563) 33 0.21 20.62 118  73.75
##  [46.563,52.588) 26 0.16 16.25 144  90.00
##  [52.588,58.614) 13 0.08  8.12 157  98.12
##   [58.614,64.64)  3 0.02  1.88 160 100.00
plot(tabla.hora,col = "coral2", type = "fh",main = "Tabla de horas",xlab = "horas trabajo")

boxplot(x=datos.p$HorasDeTrabajo,col="coral2", main="Distribucion de horas",
        ylab= "horas")

cat("tiene distribucion casi simetrica no hay tanta ausencia de datos hacia ningun lado,y la mayori se agrupa entre 34.51 y 46.56 horas")
## tiene distribucion casi simetrica no hay tanta ausencia de datos hacia ningun lado,y la mayori se agrupa entre 34.51 y 46.56 horas

##(d) [15 puntos] Elabore un dataframe con las medidas de tendencia central, de varia bilidad, Q1 ,Q3 y las medidas de forma para la variable IingresoMensual.

d <- ds_tidy_stats(datos.p,IngresoMensual)
kable(d)
vars min max mean t_mean median mode range variance stdev skew kurtosis coeff_var q1 q3 iqrange
IngresoMensual -274.41 4377.27 1944.276 1945.531 1933.685 -274.41 4651.68 643272.7 802.0428 0.0402796 0.2661356 41.25149 1460.4 2495.057 1034.658
cat("la mediana de los ingresos son 1933.685,q1 es de 1460.4 y de q3    2495.057")
## la mediana de los ingresos son 1933.685,q1 es de 1460.4 y de q3  2495.057