PARCIAL 1 PROBABILIDAD 2.0

Base_Estadistica_Descriptiva_2_ <- read_excel("C:/Users/maria/Downloads/Base_Estadistica_Descriptiva (2).xlsx")
set.seed(83)
datos_b <- sample_n(Base_Estadistica_Descriptiva_2_, size = 160, replace = FALSE)

is.data.frame(datos_b)

## [1] TRUE

Pregunta 1

Determine el porcentaje de hombres que tienen estudios universitarios y muestre cuál es la cantidad total de mujeres participantes.

tabla_genero <- table(datos_b$Genero, datos_b$NivelEducativo)
tabla_genero <- addmargins(tabla_genero)
tabla_genero

##            
##             Primaria Secundaria Técnico Universitario Sum
##   Femenino        10         17      13            10  50
##   Masculino       13         18      12            15  58
##   Otro            12         17       9            14  52
##   Sum             35         52      34            39 160

En la muestra participaron 52 mujeres, mientras que el porcentaje de hombres con estudios universitarios corresponde al 6,25%.(se uso la calculadora)

#### Pregunta 2

 boxplot(datos_b$Estatura ~ datos_b$Genero, horizontal = TRUE, 
          xlab= "Estatura" , ylab= "Género",
      main="Funcion de genero", col=c("pink", 
                                            "blue", "red") )

#### Pregumta 3a

tabla_hermanos <- table (datos_b$Hermanos)

tabla_hermanos

## 
##  0  1  2  3  4  5  6 
## 31 27 15 24 23 21 19

is.data.frame(tabla_hermanos)

## [1] FALSE

df_hermanos <- as.data.frame(tabla_hermanos)

is.data.frame(df_hermanos)

## [1] TRUE

df_hermanos

##   Var1 Freq
## 1    0   31
## 2    1   27
## 3    2   15
## 4    3   24
## 5    4   23
## 6    5   21
## 7    6   19

df_hermanos <- rename(df_hermanos, Hermanos = Var1, Frecuencia= Freq)

kable(df_hermanos)

Hermanos	Frecuencia
0	31
1	27
2	15
3	24
4	23
5	21
6	19

diag_barras <- ggplot(df_hermanos, aes(x = Hermanos , y=Frecuencia, fill = Hermanos)) +
  geom_bar(stat = "identity", color = "blue") +
  scale_fill_manual(values = c("green", "red", "pink", "skyblue", "yellow","purple", "grey" ))+
  geom_text(aes(label = Hermanos), vjust = -1, colour = "orange") +
  ylim(c(0,50))
diag_barras

6 hermanos

pregunta 3b

tabla_nivel_educativo <- table (datos_b$NivelEducativo)
tabla_nivel_educativo

## 
##      Primaria    Secundaria       Técnico Universitario 
##            35            52            34            39

is.data.frame(tabla_nivel_educativo)

## [1] FALSE

df_nivel_educativo <- as.data.frame(tabla_nivel_educativo)

is.data.frame(df_nivel_educativo)

## [1] TRUE

df_nivel_educativo

##            Var1 Freq
## 1      Primaria   35
## 2    Secundaria   52
## 3       Técnico   34
## 4 Universitario   39

df_nivel_educativo <- rename(df_nivel_educativo, Nivel_Educativo = Var1, Frecuencia= Freq)

kable(df_nivel_educativo)

Nivel_Educativo	Frecuencia
Primaria	35
Secundaria	52
Técnico	34
Universitario	39

pie3D(tabla_nivel_educativo, radius = 1.1, theta = pi/4, explode=0.2, labels = c("Primaria", "Secundaria", "Técnico", "Universitario"),col= c("orange", "red", "yellow", "green"),
      border = "blue", main= "Grafica torta 3D", )

Pregunta 3c

tabla_horast <- fdt(x =datos_b$HorasDeTrabajo,k =10)

kable(tabla_horast)

Class limits	f	rf	rf(%)	cf	cf(%)
[7.326,13.744)	1	0.00625	0.625	1	0.625
[13.744,20.162)	3	0.01875	1.875	4	2.500
[20.162,26.581)	10	0.06250	6.250	14	8.750
[26.581,32.999)	25	0.15625	15.625	39	24.375
[32.999,39.417)	32	0.20000	20.000	71	44.375
[39.417,45.835)	44	0.27500	27.500	115	71.875
[45.835,52.253)	27	0.16875	16.875	142	88.750
[52.253,58.672)	10	0.06250	6.250	152	95.000
[58.672,65.09)	5	0.03125	3.125	157	98.125
[65.09,71.508)	3	0.01875	1.875	160	100.000

	x
start	7.3260
end	71.5080
h	6.4182
right	0.0000

plot(tabla_horast, col=c("red","orange","yellow","green", "blue",
                          "purple","pink", "gray",
                          "hotpink", "royalblue4"),
     type = "fh", main = "Histograma horas t")

plot(tabla_horast, col=c("red","orange","yellow","green", "blue",
                          "purple","pink", "gray",
                          "hotpink", "royalblue4"),
     type = "fp", main = "poligono de frecuencias horas t")

#### Pregunta 3d

media_i <- mean(datos_b$IngresoMensual)
mediana_i <-  median(datos_b$IngresoMensual)
moda_i <- mlv1(datos_b$IngresoMensual)

df_tc <- data.frame (media_i, mediana_i, moda_i)
kable(df_tc, caption = "Medidas tendencia central")

Medidas tendencia central
media_i	mediana_i	moda_i
2019.806	2055.715	1836.513

rango_i <- max(datos_b$IngresoMensual) -min(datos_b$IngresoMensual)
varianza_i <-  var(datos_b$IngresoMensual)
ds_i <- sqrt(var(datos_b$IngresoMensual))
CV_i <-  (sd(datos_b$IngresoMensual) / mean(datos_b$IngresoMensual))*100

df_v <- data.frame (rango_i, varianza_i, ds_i, CV_i)
kable(df_v, caption = "Medidas Variabilidad")

Medidas Variabilidad
rango_i	varianza_i	ds_i	CV_i
4441.96	633594.7	795.9866	39.40906

percentil_i <- quantile(datos_b$IngresoMensual, 
                              probs = c(0.25, 0.75), type= 6)
percentil_i

##      25%      75% 
## 1478.530 2549.993

asim_i <- ds_skewness(datos_b$IngresoMensual)
curt_i <- ds_kurtosis(datos_b$IngresoMensual)

df_f <- data.frame (asim_i, curt_i)
kable(df_f, caption = "Medidas Forma")

Medidas Forma
asim_i	curt_i
-0.2669729	0.3473592

resumen_i <- ds_tidy_stats(datos_b, IngresoMensual)
kable(resumen_i)

vars	min	max	mean	t_mean	median	mode	range	variance	stdev	skew	kurtosis	coeff_var	q1	q3	iqrange
IngresoMensual	-509.91	3932.05	2019.806	2038.484	2055.715	-509.91	4441.96	633594.7	795.9866	-0.2669729	0.3473592	39.40906	1484.93	2537.718	1052.787

PARCIAL 1 PROBABILIDAD 2.0

Maria paula valdes y Daniela Contreras

2025-08-29

Pregunta 1

pregunta 3b

Pregunta 3c