##base de datos
Base.esta <- read_excel("C:/Users/Acer/Downloads/Base_Estadistica_Descriptiva.xlsx")
set.seed(6269)
datos.p<-sample_n(Base.esta, size=160,replace = FALSE)
##1 Determine el porcentaje de hombres que tienen estudios universitarios y muestre cuál es la cantidad total de mujeres participantes.
t1<-table(datos.p$NivelEducativo, datos.p$Genero)
addmargins(t1)
##
## Femenino Masculino Otro Sum
## Primaria 6 18 13 37
## Secundaria 11 12 14 37
## Técnico 14 12 13 39
## Universitario 11 22 14 47
## Sum 42 64 54 160
kable(t1)
Femenino | Masculino | Otro | |
---|---|---|---|
Primaria | 6 | 18 | 13 |
Secundaria | 11 | 12 | 14 |
Técnico | 14 | 12 | 13 |
Universitario | 11 | 22 | 14 |
t2<-table(datos.p$Genero);t2
##
## Femenino Masculino Otro
## 42 64 54
cat("hay 22 hombres con estudios universitarios y hay 42 mujeres en total")
## hay 22 hombres con estudios universitarios y hay 42 mujeres en total
Elabore un diagrama de caja y bigotes para la variable estatura en función del género y analice la gráfica
boxplot(datos.p$Estatura~datos.p$Genero,xlab ="Genero", ylab = "Estatura",main="diagrama de caja estura y sexo",col=c("coral2","coral1","coral"))
cat("la varibilidad del genero masculino es mas grande desde 1.60 a cercano a 1.90,
tanto Masculino y otro tienen una asimetria negativa sepuede decir que la mayori delos datos se encuentra cercano a 1.80 y el delas mujeres presenta una asimetria positiva la mayoria de sus participantes se encuentra en 1.75cm")
## la varibilidad del genero masculino es mas grande desde 1.60 a cercano a 1.90,
## tanto Masculino y otro tienen una asimetria negativa sepuede decir que la mayori delos datos se encuentra cercano a 1.80 y el delas mujeres presenta una asimetria positiva la mayoria de sus participantes se encuentra en 1.75cm
[5 puntos] Elabore un diagrama de barras para la variable Hermanos y determine qué cantidad es la más frecuente.
tab.h<-table(datos.p$Hermanos)
barplot(tab.h, main ="diagrama de Cantidad de hermanos",xlab = "numero de hermanos",
ylab="frecuencia", col = "coral3")
cat("la gran parte de las personas no tienen hermanos")
## la gran parte de las personas no tienen hermanos
[5 puntos] Elabore un diagrama de torta en 3D para la variable NivelEducativo.
tabla.edu<-table(datos.p$NivelEducativo);tabla.edu
##
## Primaria Secundaria Técnico Universitario
## 37 37 39 47
pie3D(tabla.edu,labels = names(tabla.edu),main="nivel educativo")
cat("la mayoria se agrupa en la universidad con 47 personas, los segunda clase es el tecnico con 39 y primaria y secundaria estan iguales con 37 estudiantes")
## la mayoria se agrupa en la universidad con 47 personas, los segunda clase es el tecnico con 39 y primaria y secundaria estan iguales con 37 estudiantes
[5 puntos] Elabore una tabla de frecuencias, el histograma y el polígono de fre cuencias para la variable HorasDeTrabajo.
attach(datos.p)
tabla.hora<-fdt(x=datos.p$HorasDeTrabajo,k=8);tabla.hora
## Class limits f rf rf(%) cf cf(%)
## [16.434,22.46) 5 0.03 3.12 5 3.12
## [22.46,28.486) 17 0.11 10.62 22 13.75
## [28.486,34.511) 26 0.16 16.25 48 30.00
## [34.511,40.537) 37 0.23 23.12 85 53.12
## [40.537,46.563) 33 0.21 20.62 118 73.75
## [46.563,52.588) 26 0.16 16.25 144 90.00
## [52.588,58.614) 13 0.08 8.12 157 98.12
## [58.614,64.64) 3 0.02 1.88 160 100.00
plot(tabla.hora,col = "coral2", type = "fh",main = "Tabla de horas",xlab = "horas trabajo")
boxplot(x=datos.p$HorasDeTrabajo,col="coral2", main="Distribucion de horas",
ylab= "horas")
cat("tiene distribucion casi simetrica no hay tanta ausencia de datos hacia ningun lado,y la mayori se agrupa entre 34.51 y 46.56 horas")
## tiene distribucion casi simetrica no hay tanta ausencia de datos hacia ningun lado,y la mayori se agrupa entre 34.51 y 46.56 horas
##(d) [15 puntos] Elabore un dataframe con las medidas de tendencia central, de varia bilidad, Q1 ,Q3 y las medidas de forma para la variable IingresoMensual.
d <- ds_tidy_stats(datos.p,IngresoMensual)
kable(d)
vars | min | max | mean | t_mean | median | mode | range | variance | stdev | skew | kurtosis | coeff_var | q1 | q3 | iqrange |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
IngresoMensual | -274.41 | 4377.27 | 1944.276 | 1945.531 | 1933.685 | -274.41 | 4651.68 | 643272.7 | 802.0428 | 0.0402796 | 0.2661356 | 41.25149 | 1460.4 | 2495.057 | 1034.658 |
cat("la mediana de los ingresos son 1933.685,q1 es de 1460.4 y de q3 2495.057")
## la mediana de los ingresos son 1933.685,q1 es de 1460.4 y de q3 2495.057