M19 <- read.csv("C:\\Users\\santi\\Downloads\\reto_modelacion\\Datos_molec_2019.csv")
M20 <- read.csv("C:\\Users\\santi\\Downloads\\reto_modelacion\\Datos_molec_2020.csv")
M21 <- read.csv("C:\\Users\\santi\\Downloads\\reto_modelacion\\Datos_molec_2021.CSV")
M22 <- read.csv("C:\\Users\\santi\\Downloads\\reto_modelacion\\Datos_molec_2022.csv")
M23 <- read.csv("C:\\Users\\santi\\Downloads\\reto_modelacion\\Datos_molec_2023.csv")
M24 <- read.csv("C:\\Users\\santi\\Downloads\\reto_modelacion\\Datos_molec_2024.csv")
column_number <- which(colnames(base_reto) == "edad")
edad= base_reto[ ,column_number]
mean(edad)
## [1] 45.65803
median(edad)
## [1] 44
(min(edad)+max(edad))/2
## [1] 57.5
sd(edad)
## [1] 16.68
sd(edad)/mean(edad)
## [1] 0.3653246
cuartiles=quantile(edad, probs = c(0.25, 0.75))
cuartiles
## 25% 75% 
##  32  58
skewness(edad)
## [1] 0.3195985
kurtosis(edad)
## [1] -0.738101
frecuencia_relativa<- prop.table(table(edad))
frecuencia_relativa
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 97
0.0087749 0.0142905 0.0150426 0.0176333 0.0165469 0.0167976 0.0176333 0.0199733 0.0179676 0.0182183 0.0199733 0.0197225 0.0221461 0.0213939 0.0201404 0.0194718 0.0166305 0.0192211 0.0198897 0.0198061 0.0197225 0.0193047 0.0215611 0.0200568 0.0186361 0.0221461 0.0213939 0.0197225 0.0198897 0.018469 0.0179676 0.0178004 0.0177169 0.0183854 0.0186361 0.0178004 0.017299 0.0198061 0.0172154 0.0163797 0.0172154 0.0171319 0.0166305 0.0142905 0.0128698 0.0134548 0.0137055 0.0144576 0.0103627 0.0099448 0.0108641 0.010697 0.0113655 0.0096941 0.0087749 0.0088584 0.0073542 0.0066856 0.0065185 0.0056828 0.0050142 0.0041785 0.0041785 0.0035935 0.00234 0.0025907 0.001755 0.0020893 0.0015878 0.0010028 0.0008357 0.0010864 0.0004179 0.0005014 0.0004179 0.0001671 0.0002507 8.36e-05 0.0001671
frecuencia_absoluta<-frecuencia_relativa*dim(base_reto)[1]
barplot(frecuencia_absoluta, main = "Histograma de edades", col = "skyblue", xlab = "Edad", ylab = "Frecuencia")

boxplot(edad, main = "Boxplot de edades", ylab = "Edades", col = "skyblue")

abline(h = cuartiles[1], col = "green", lty = 2, lwd = 2)  
text(y = cuartiles[1], x = 1.2, col = "green")
abline(h = cuartiles[2], col = "green", lty = 2, lwd = 2)  
text(y = cuartiles[3], x = 1.2, col = "green")

Calcula las medidas de las variables cuantitativas por categoría de alguna variable categórica de interés Elabora gráficos de caja y bigote de las variables cuantitativas por categoría de alguna variable categórica de interés Elabora gráficos comparativos por años si tu objetivo es comparar años

column_number <- which(colnames(base_reto) == "p4")
p4= base_reto[ ,column_number]
mean(p4)
## [1] 1.434648
median(p4)
## [1] 0
(min(p4)+max(p4))/2
## [1] 49.5
sd(p4)
## [1] 3.852617
sd(p4)/mean(p4)
## [1] 2.685409
cuartiles=quantile(p4, probs = c(0.25, 0.75))
cuartiles
## 25% 75% 
##   0   2
skewness(p4)
## [1] 9.479147
kurtosis(p4)
## [1] 138.5202
frecuencia_relativa<- prop.table(table(p4))
frecuencia_relativa
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 20 22 23 24 25 30 32 35 40 42 45 50 52 60 65 66 70 80 99
0.5931807 0.1256895 0.1021227 0.0693632 0.0354337 0.0236503 0.0145412 0.0040114 0.0063513 0.0010028 0.0078556 0.0004179 0.0042621 0.0004179 0.0003343 0.0027578 0.0001671 0.0003343 0.0001671 0.0028414 0.0001671 0.0001671 0.0004179 0.0004179 0.0010864 0.0001671 0.0002507 0.0005014 8.36e-05 8.36e-05 0.0006686 8.36e-05 0.0005014 8.36e-05 8.36e-05 0.0001671 8.36e-05 8.36e-05
frecuencia_absoluta<-frecuencia_relativa*dim(base_reto)[1]
barplot(frecuencia_absoluta, main = "Histograma de libros leídos", col = "skyblue", xlab = "Cantidad de libros", ylab = "Frecuencia")

boxplot(p4, main = "Boxplot de libros leídos", ylab = "Cantidad de libros", col = "skyblue")
abline(h = cuartiles[1], col = "green", lty = 2, lwd = 2)  
text(y = cuartiles[1], x = 1.2, col = "green")

abline(h = cuartiles[2], col = "green", lty = 2, lwd = 2)  
text(y = cuartiles[3], x = 1.2, col = "green")

y= p4
x= edad
modelo <- lm(y ~ x)

# Resumen del modelo

summary(modelo)
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -1.993 -1.488 -1.044  0.290 97.108 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  2.356419   0.102253  23.045   <2e-16 ***
## x           -0.020189   0.002104  -9.597   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.838 on 11964 degrees of freedom
## Multiple R-squared:  0.00764,    Adjusted R-squared:  0.007557 
## F-statistic: 92.11 on 1 and 11964 DF,  p-value: < 2.2e-16
plot(x, y, main = "Correlación entre edad y libros leídos", xlab = "Edad", 
     ylab = "p_35", col = "blue", pch = 19)

# Añadir la línea de regresión
abline(modelo, col = "red", lwd = 2)

column_number <- which(colnames(base_reto) == "p5")
p5= base_reto[ ,column_number]
  
#Calcula las medidas de las variables cuantitativas por categoría de alguna variable categórica de interés

#Elabora gráficos de caja y bigote de las variables cuantitativas por categoría de alguna variable categórica de interés


#blanco", "trabajo", "estudio", "cultura gen", "entretenimiento", "religión", "otro")


boxplot(p4 ~ p5, data = base_reto, main = "Boxplot de Edad por Tipo de Material", 
        xlab = "Tipo de Material", ylab = "Edad", col = c("lightblue", "lightgreen", "lightcoral"))

boxplot(p4 ~ p5, data = base_reto, main = "Boxplot de Libros Leídos por Tipo de Material", 
        xlab = "Tipo de Material", ylab = "Libros Leídos", col = c("lightblue", "lightgreen", "lightcoral"))

Elabora gráficos comparativos por años si tu objetivo es comparar años

column_number <- which(colnames(M19) == "p4")
p4_19= M19[ ,column_number]
column_number <- which(colnames(M20) == "p4")
p4_21= M21[ ,column_number]
column_number <- which(colnames(M24) == "p4")
p4_24= M24[ ,column_number]



frecuencia_relativa19<- prop.table(table(p4_19))
frecuencia_absoluta19<-frecuencia_relativa19*dim(M19)[1]


frecuencia_relativa21<- prop.table(table(p4_21))
frecuencia_absoluta21<-frecuencia_relativa21*dim(M21)[1]

frecuencia_relativa24<- prop.table(table(p4_24))
frecuencia_absoluta24<-frecuencia_relativa24*dim(M24)[1]


barplot(frecuencia_absoluta19, main = "Histograma de libros leídos en 2019", col = "skyblue", xlab = "Cantidad de libros", ylab = "Frecuencia")

barplot(frecuencia_absoluta21, main = "Histograma de libros leídos en 2021", col = "skyblue", xlab = "Cantidad de libros", ylab = "Frecuencia")

barplot(frecuencia_absoluta24, main = "Histograma de libros leídos en 2024", col = "skyblue", xlab = "Cantidad de libros", ylab = "Frecuencia")