Datos20 = read.csv("M20final_limpio.csv")
Datos24 = read.csv("M24final_limpio.csv")
p4 es la cantidad de libros leidos en 12 meses
# Reemplazar valores no numéricos por NA (si fueran detectados previamente)
variable1 = as.numeric(as.character(Datos20$p4)) # Convertir nuevamente por seguridad
# Calculo de medidas de tendencia central
media = mean(variable1, na.rm = TRUE)
media
## [1] 1.466292
mediana = median(variable1, na.rm = TRUE)
rango_medio = (max(variable1, na.rm = TRUE) + min(variable1, na.rm = TRUE)) / 2
# Calculo de medidas de dispersión
ds = sd(variable1, na.rm = TRUE)
coef_var = ds / media * 100
# Calculo de medidas de posición
cuartiles = quantile(variable1, probs = c(0.25, 0.5, 0.75), na.rm = TRUE)
# Calculo de medidas de forma
install.packages("e1071")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(e1071)
##
## Attaching package: 'e1071'
## The following objects are masked from 'package:moments':
##
## kurtosis, moment, skewness
sesgo = skewness(variable1, na.rm = TRUE)
curtosis = kurtosis(variable1, na.rm = TRUE)
# Herramientas de visualización
# Boxplot para visualizar cuartiles y outliers
boxplot(variable1, main = "Boxplot de Libros leidos en los ultimos 12 meses 2020", col = "lightblue")
# Histograma para analizar la distribución de los datos
hist(variable1, main = "Histograma de Libros leidos en los ultimos 12 meses 2020", xlab = "Libros leídos", ylab = "Número de Personas", col = "green", breaks = 30)
# Analisis p4 en 2024 p4 es la cantidad de libros leidos en 12 meses
# Reemplazar valores no numéricos por NA (si fueran detectados previamente)
variable1.1 = as.numeric(as.character(Datos24$p4)) # Convertir nuevamente por seguridad
# Calculo de medidas de tendencia central
media = mean(variable1.1, na.rm = TRUE)
media
## [1] 1.305231
mediana = median(variable1.1, na.rm = TRUE)
rango_medio = (max(variable1.1, na.rm = TRUE) + min(variable1.1, na.rm = TRUE)) / 2
# Calculo de medidas de dispersión
ds = sd(variable1.1, na.rm = TRUE)
coef_var = ds / media * 100
# Calculo de medidas de posición
cuartiles = quantile(variable1.1, probs = c(0.25, 0.5, 0.75), na.rm = TRUE)
# Calculo de medidas de forma
install.packages("e1071")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(e1071)
sesgo = skewness(variable1.1, na.rm = TRUE)
curtosis = kurtosis(variable1.1, na.rm = TRUE)
# Herramientas de visualización
# Boxplot para visualizar cuartiles y outliers
boxplot(variable1.1, main = "Boxplot de Libros leidos en los ultimos 12 meses 2024", col = "lightblue")
# Histograma para analizar la distribución de los datos
hist(variable1.1, main = "Histograma de Libros leidos en los ultimos 12 meses 2024", xlab = "Libros leídos", ylab = "Número de Personas",col = "green", breaks = 30)
# Analisis p4 comparación de años
indice1 = which(!is.na(Datos20$p4)) # Índices no NAs en Datos20$p4
indice2 = which(!is.na(Datos24$p4)) # Índices no NAs en Datos24$p4
# Filtrar datos para mantener solo las filas no NAs
indices_comunes = intersect(indice1, indice2) # Índices comunes
variable1 = as.numeric(as.character(Datos20$p4[indices_comunes]))
variable1.1 = as.numeric(as.character(Datos24$p4[indices_comunes]))
# Combinar ambas variables en un dataframe
data = data.frame(variable1, variable1.1)
# Calcular la correlación entre las dos variables
correlacion = cor(data$variable1, data$variable1.1, method = "pearson")
# Imprimir la correlación
print(paste("Correlación entre p4 de Datos20 y Datos24:", correlacion))
## [1] "Correlación entre p4 de Datos20 y Datos24: 0.00981060923907858"
# Gráfico de dispersión (scatter plot) para visualizar la relación
plot(data$variable1, data$variable1.1,
main = "Gráfico de Dispersión: p4 Datos20 vs Datos24",
xlab = "Libros leídos en 2020",
ylab = "Libros leídos en 2024",
col = "darkblue", pch = 16)
# Agregar la línea de regresión lineal
abline(lm(data$variable1.1 ~ data$variable1), col = "red")
¿El libro (La mayoría de los libros) fue(ron)…
MARCA CON “X” UN SOLO
1 descargado(s) gratuitamente?
2 regalado(s) o prestado(s)?
3 comprado(s) (impreso o digital)? 7a. Aproximadamente, ¿cuánto gastó?
## Category Count Porcentaje
## 1 No Leen Libros 0 0
## 2 Leen Libros 811 100
## Datos para 2020
## Media: 851.6411
## Mediana: 500
## Rango medio: 14999
## Desviación estándar: 1276.753
## Coeficiente de variación: 1.499168
## Cuartiles: 250 500 1000
## Sesgo: 5.707283
## Curtosis: 49.22846
## Parte cualitativa de la pregunta
## Tabla de frecuencia:
##
## 1 2 3
## 97 385 329
## # A tibble: 3 × 4
## p7 count Porcentaje Label
## <int> <int> <dbl> <chr>
## 1 1 97 12.0 Gratis
## 2 2 385 47.5 Regalados o prestados
## 3 3 329 40.6 Comprados
Antes de ver de dónde obtienen los libros, primero tenemos que analizar cuántos de los encuestados totales leen libros y cuántos no. Es por ello que hicimos un pie chart inicial en el que podemos ver que solo el 41.4% ha leído libros en los últimos 12 meses. Mientras que el 58.6% dijeron que no leyeron libros en los últimos 12 meses.
Como podemos observar, la media de la parte cuantitativa de la pregunta es 1015.92, esto es el promedio de lo que se gastan en libros en un año. Esto solo aplica para las personas que compran libros en su mayoría. Si se trata de libros físicos, esto significa que son aproximadamente 4 o 5 libros en promedio al año. En formato digital varían más los precios. La mediana son 500 pesos (con los cuales se pueden comprar aproximadamente 2 libros), en este análisis usaremos la mediana para representar el conjunto de datos ya que, como veremos más adelante, hay varios valores atípicos que hacen que el promedio crezca tanto. Esto se demuestra con el rango medio, el cual es muy alto en este caso: 14970. El hecho de que sea así de grande se debe a que hay una diferencia muy grande entre el valor más pequeño y el más grande, lo cual afecta el promedio.
Tenemos una desviación estándar de 1276.753 significa que, en promedio, los datos están muy dispersos alrededor de la media. Esto implica que el conjunto de datos tiene una variación alta, es decir, los datos tienen una gran dispersión y no se encunetran cercanos unos con otros. El coeficiente de variación es 1.499, este nos explica la relación entre la desviación estándar y la media, esto es usado para comparar la variabilidad relativa que hay entre diferentes conjuntos de datos. El hecho de que tengamos un coeficiente de variación de 1.499 nos dice que la desviación estándar es casi 149% de la media, lo cual refuerza lo que habíamos dicho sobre la variabilidad relativa en los datos. Como el CV es mayor a 1, la dispersión es mayor que la media, así que hay una variación significativa.
Q1 (primer cuartil): 250 es el valor por debajo del cual se encuentra el 25% de los datos. Q2 (mediana): 500 es el valor por debajo del cual se encuentra el 50% de los datos. Q3 (tercer cuartil): 1000 es el valor por debajo del cual se encuentra el 75% de los datos. Esto demuestra que hay una distribución asimétrica debido a que el tercer cuartil está más lejos de la mediana que el primer cuartil. Esto lo podremos ver visualmente en el boxplot.
El sesgo mide la asimetría de la distribución de los datos.Como tenemos un sesgo de 5.733, esto nos indica que la distribución tiene una cola larga hacia la derecha, es decir, sesgo positivo, lo cual implica que hay valores atípicos muy altos que están haciendo que la distribución se aleje hacia la derecha, mostrándonos que hay una distribución asimétrica. Nuestra curtosis para el 2020 en esta variable es 52.55, si es elevada, como en este caso, esto significa que los datos tienen más valores extremos comparado con una distribución normal. Tenemos muchas observaciones o datos extremos.
Para analizar el boxplot, podemos ver que este refuerza varias de las cosas ya dichas con anterioridad. Podemos ver que el bigote más largo se muestra del lado derecho ya que tenemos un valor atípico muy grande de ese lado, y cada uno de los puntitos sobre ese bigote nos muestra un valor atípico. Hay más espacio entre la mediana y el tercer cuartil que entre el primero y la mediana, esto nos muestra que los valores son más dispersos del lado derecho.
Para analizar el histograma lo hicimos de dos formas: uno con todos los datos y otro sin tomar en cuenta los valores atípicos para poder facilitar más la visualización. Aquí también podemos ver que la mayor cantidad de los datos se encuentra del lado izquierdo. Esto hace que la distribución no sea normal, esta es una distribución simétrica positiva (hay un sesgo a la derecha), lo cual significa que si hay una cola más larga a la derecha, la mayoría de los datos están concentrados en los valores menores, pero hay algunos valores mayores que alargan la cola hacia del lado derecho.
Ahora analicemos la parte cualitativa de la pregunta. Esto nos permitirá saber cómo consiguen los libros que leen. El valor 1 significa que la mayoría de los libros que leyeron en los últimos 12 meses fueorn descargados gratuitamente, el valor 2 significa que fueron regalados o prestados, mientras que el valor 3 significa que fueron comprados.
Al ver la tabla de frecuencia, distribución y la gráfica de pastel, podemos ver que la mayoría de los libros que leyeron ese año fueron prestados(47%), sin embargo, también una gran parte de ellos fueron comprados (40%). Muy pocas de las personas encuestadas los descargaron gratuitamente (12%).
## Category Count Porcentaje
## 1 No Leen Libros 0 0
## 2 Leen Libros 809 100
## Datos para 2024
## Media: 1015.92
## Mediana: 500
## Rango medio: 14970
## Desviación estándar: 1414.898
## Coeficiente de variación: 1.392725
## Cuartiles: 300 500 1125
## Sesgo: 4.707869
## Curtosis: 35.61992
## Parte cualitativa de la pregunta
## Tabla de frecuencia:
##
## 1 2 3
## 168 359 282
## # A tibble: 3 × 4
## p7 count Porcentaje Label
## <int> <int> <dbl> <chr>
## 1 1 168 20.8 Gratis
## 2 2 359 44.4 Regalados o prestados
## 3 3 282 34.9 Comprados
Como hicimos con el 2020, vamos a ver cuántos encuestados contestaron que sí han leído algún libro en los últimos 12 meses. Podemos ver que los resultados son casi los mismos. Hubo un muy ligero aumento en la respuesta de aquellas personas que no leen libros (58.91%) mientras que aquellos que dijeron que sí fueron el 41%
Aquí pasa algo muy interesante, ya que la media, mediana y rango medio son los mismos que en 2020. Veremos las gráficas y los demás datos para ver qué está ocurriendo.
La desviación estándar en este caso no es la misma, ahora es 1414.89, lo cual significa que aumentó y la dispersión alrededor de la media también. La variación en los datos es más alta que en el 2020. El coeficiente de variación disminuyó un poco, pero sigue siendo alto. Como es mayor a 1, hay una variación muy alta.
Q1 (primer cuartil): 300 es el valor por debajo del cual se encuentra el 25% de los datos. Q2 (mediana): 500 es el valor por debajo del cual se encuentra el 50% de los datos. Q3 (tercer cuartil): 1125 es el valor por debajo del cual se encuentra el 75% de los datos.
Esto demuestra que hay una distribución asimétrica debido a que el tercer cuartil está más lejos de la mediana que el primer cuartil. Comparado con el 2020, el primer cuartil está ahora más cerca de la mediana, y el tercer cuartil está más alejado.
Como tenemos un sesgo de 4.73, esto nos indica que la distribución tiene una cola larga hacia la derecha, es decir, sesgo positivo, lo cual implica que hay valores atípicos muy altos que están haciendo que la distribución se aleje hacia la derecha, mostrándonos que hay una distribución asimétrica. Nuestra curtosis para el 2020 en esta variable es 38.9, si es elevada, como en este caso, significa que los datos tienen más valores extremos comparado con una distribución normal. Tenemos muchas observaciones o datos extremos. Ambos valores disminuyeron en comparación con el 2020. Lo cual implica que en 2020 estaban más dispersos.
Para analizar el boxplot, podemos ver que este refuerza varias de las cosas ya dichas con anterioridad. Podemos ver que el bigote más largo se muestra del lado derecho ya que tenemos un valor atípico muy grande de ese lado, y cada uno de los puntitos sobre ese bigote nos muestra un valor atípico. Hay más espacio entre la mediana y el tercer cuartil que entre el primero y la mediana, esto nos muestra que los valores son más dispersos del lado derecho.Vemos que ahora tenemos menos valores atípicos en comparación con el 2020. El valor más grande en ambos casos es 15000. La mayoría de los datos atípicos son más pequeños en 2024 que en 2020
En el primer histograma también podemos ver que la mayor cantidad de los datos se encuentra del lado izquierdo. Esto hace que la distribución no sea normal, esta es una distribución simétrica positiva (hay un sesgo a la derecha), lo cual significa que si hay una cola más larga a la derecha, la mayoría de los datos están concentrados en los valores menores, pero hay algunos valores mayores que alargan la cola hacia del lado derecho. Lo mismo pasó en 2020. Esto nos demuestra que en ambos años ha habido muy pocas personas que gastan mucho en libros, mientras que la mayoría se mantiene en un rango entre 200 y 600 pesos
Ahora analicemos la parte cualitativa de la pregunta. Igual que antes, el valor 1 significa que la mayoría de los libros que leyeron en los últimos 12 meses fueorn descargados gratuitamente, el valor 2 significa que fueron regalados o prestados, mientras que el valor 3 significa que fueron comprados.
Al ver la tabla de frecuencia, distribución y la gráfica de pastel, podemos ver que la mayoría de los libros que leyeron ese año fueron prestados(44%), sin embargo, también una gran parte de ellos fueron comprados (34%). Aquellos que los descargaron gratuitamente fueron el 20%. Hubo un gran aumento en la cantidad de personas que descargaron libros gratuitamente, mientras que aquellos que los compran disminuyeron más que aquellos que los piden prestados. Esto nos muestra cómo las personas, a lo largo de los últimos años, han migrado hacia un formato digital y gratuito
¿El (Los) libro(s) que leyó se encontraba(n)…
1 en formato digital? 2 impreso(s)?
## Tabla de frecuencia:
##
## 1 2
## 120 691
## Tabla de frecuencias de formato de lectura
## # A tibble: 2 × 4
## p8_1 count Porcentaje Label
## <int> <int> <dbl> <chr>
## 1 1 120 14.8 Digital
## 2 2 691 85.2 Impreso
Para esta pregunta, el valor 1 representa el formato digital y el número 2 es impreso. Observamos que la mayoría prefiere el formato impreso en el 2020. El 14.8% de las personas contestaron que leían los libros en formato digital mientras que el restante 85.2% aún los lee en físico. Veamos cuánto ha cambiado desde ese entonces.
## Tabla de frecuencia:
##
## 1 2
## 196 613
## Tabla de frecuencias de formato de lectura
## # A tibble: 2 × 4
## p8_1 count Porcentaje Label
## <int> <int> <dbl> <chr>
## 1 1 196 24.2 Digital
## 2 2 613 75.8 Impreso
La cantidad de personas que hoy en día leen libros en formato digital es casi un cuarto del total de personas que leen libros. Este porcentaje aumentó a 24.2% este año, y por obvias razones, esto implica que la cantidad de personas que leen libros físicos ha disminuido, en este caso, a un 75.8%. Con esto podemos argumentar con pruebas que en estos últimos años, a medida que ha habido avances en la tecnología, las personas poco a poco han decidido migrar a un nuevo formato: el digital
# Seleccionar las variables p9 y p33 para los años 2020 y 2024
p9_2020 <- M20$p9
p33_2020 <- M20$p33_1
p9_2024 <- M24$p9
p33_2024 <- M24$p33_1
# Tabla de distribución de frecuencia para p9_2020
tabla_frecuencia_p9_2020 <- table(p9_2020)
print(tabla_frecuencia_p9_2020)
## p9_2020
## 1 2 3 4 5
## 674 113 12 10 2
cat("\n")
# Gráfico de barras para p9_2020
barplot(tabla_frecuencia_p9_2020,
main = "¿En qué lugar leyó el (los) libro(s) principalmente? 2020",
xlab = "Categorías de p9 (2020)",
ylab = "Frecuencia",
col = "lightblue")
# Gráfico de pastel para p9_2020
pie(tabla_frecuencia_p9_2020,
main = "¿En qué lugar leyó el (los) libro(s) principalmente? 2020",
col = rainbow(length(tabla_frecuencia_p9_2020)))
# Tabla de distribución de frecuencia para p9_2024
tabla_frecuencia_p9_2024 <- table(p9_2024)
print(tabla_frecuencia_p9_2024)
## p9_2024
## 1 2 3 4 5
## 725 73 3 7 1
cat("\n")
# Gráfico de barras para p9_2024
barplot(tabla_frecuencia_p9_2024,
main = "¿En qué lugar leyó el (los) libro(s) principalmente? 2024",
xlab = "Categorías de p9 (2024)",
ylab = "Frecuencia",
col = "lightgreen")
# Gráfico de pastel para p9_2024
pie(tabla_frecuencia_p9_2024,
main = "¿En qué lugar leyó el (los) libro(s) principalmente? 2024",
col = rainbow(length(tabla_frecuencia_p9_2024)))
El significado de las variables que van de 0 a 5 son las siguientes
0 No ha leido algun libro en el ultimo año
1 En su casa o la de otras personas
2 En su centro de estudios o lugar de trabajo
3 En librerías o bibliotecas
4 En el transporte
5 Otro
En 2020, 1199 personas dijeron que no habian leído ningún libro en el último año, mientras que en 2024 esta numero subió a 1207 personas, con una diferencia de 8 personas (1.8%). Hubo un ligero aumento en la cantidad de personas que no leyeron. Este aumento puede sugerir una ligera disminución en los hábitos de lectura general entre ambos años.
Este es el lugar donde la mayoria de las personas leen. En 2020, 674 personas dijeron que leian en casa, mientras que en 2024 aumentó a 725 personas, con una diferencia de 51 personas (3.5%). Aumentaron las personas que leyeron en casa El aumento puede estar relacionado con un mayor tiempo en casa debido a el incremento de el home office
En 2020, 113 personas dijeron que leian en su lugar de estudio o trabajo, pero en 2024 esta cifra bajo a 73 personas, con una diferencia de -40 personas (2%). Este decresimiento tal vez se deba a que muchos libros ya se encuentran en plataformas digitales.
El número de personas que leyó en librerías o bibliotecas cayó drásticamente de 12 en 2020 a solo 3 en 2024, una diferencia de -9 personas ( 0.4%). Esta caída podría deberse a la reducción en la frecuencia de visitas a estos lugares, probablemente por cambios en los hábitos de consumo de libros (más compras digitales o menor acceso físico).
El número de personas que leyó en el transporte bajo, pasando de 10 en 2020 a 7 en 2024, con una diferencia de -3 personas. Esto proablemente se deba a que las personas prefieren estar en redes sociales.
En la categoría “Otro” (Categoría 5) , las cifras se mantuvieron igual, con 2 en 2020 y 1 en 2024, esto nos dice que hay muy pocos casos de lectura en lugares que no se mencionaron en la encuesta.
p26 es la cantidad de minutos leidos continuamente
# Reemplazar valores no numéricos por NA (si fueran detectados previamente)
variable2 = as.numeric(as.character(Datos20$p26)) # Convertir nuevamente por seguridad
# Calculo de medidas de tendencia central
media = mean(variable2, na.rm = TRUE)
media
## [1] 28.99949
mediana = median(variable2, na.rm = TRUE)
rango_medio = (max(variable2, na.rm = TRUE) + min(variable2, na.rm = TRUE)) / 2
# Calculo de medidas de dispersión
ds = sd(variable2, na.rm = TRUE)
coef_var = ds / media * 100
# Calculo de medidas de posición
cuartiles = quantile(variable2, probs = c(0.25, 0.5, 0.75), na.rm = TRUE)
# Calculo de medidas de forma
install.packages("e1071")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(e1071)
sesgo = skewness(variable2, na.rm = TRUE)
curtosis = kurtosis(variable2, na.rm = TRUE)
# Herramientas de visualización
# Boxplot para visualizar cuartiles y outliers
boxplot(variable2, main = "Boxplot de minutos leidos continuamente 2020", col = "lightblue")
# Histograma para analizar la distribución de los datos
hist(variable2, main = "Histograma de minutos leidos continuamente 2020", xlab = "Minutos", ylab = "Número de Personas",col = "green", breaks = 20)
# Analisis p26 en 2024 p26 es la cantidad de minutos leidos
continuamente
# Reemplazar valores no numéricos por NA (si fueran detectados previamente)
variable2.1 = as.numeric(as.character(Datos24$p26)) # Convertir nuevamente por seguridad
# Calculo de medidas de tendencia central
media = mean(variable2.1, na.rm = TRUE)
media
## [1] 27.42001
mediana = median(variable2.1, na.rm = TRUE)
rango_medio = (max(variable2.1, na.rm = TRUE) + min(variable2.1, na.rm = TRUE)) / 2
# Calculo de medidas de dispersión
ds = sd(variable2.1, na.rm = TRUE)
coef_var = ds / media * 100
# Calculo de medidas de posición
cuartiles = quantile(variable2.1, probs = c(0.25, 0.5, 0.75), na.rm = TRUE)
# Calculo de medidas de forma
install.packages("e1071")
## Installing package into '/cloud/lib/x86_64-pc-linux-gnu-library/4.4'
## (as 'lib' is unspecified)
library(e1071)
sesgo = skewness(variable2.1, na.rm = TRUE)
curtosis = kurtosis(variable2.1, na.rm = TRUE)
# Herramientas de visualización
# Boxplot para visualizar cuartiles y outliers
boxplot(variable2.1, main = "Boxplot de minutos leidos continuamente 2024", col = "lightblue")
# Histograma para analizar la distribución de los datos
hist(variable2.1, main = "Histograma de minutos leidos continuamente 2024", xlab = "Minutos", ylab = "Número de Personas",col = "green", breaks = 20)
indice1 = which(!is.na(Datos20$p26)) # Índices no NAs en Datos20$p26
indice2 = which(!is.na(Datos24$p26)) # Índices no NAs en Datos24$p26
# Filtrar datos para mantener solo las filas no NAs
indices_comunes = intersect(indice1, indice2) # Índices comunes
variable2 = as.numeric(as.character(Datos20$p26[indices_comunes]))
variable2.1 = as.numeric(as.character(Datos24$p26[indices_comunes]))
# Combinar ambas variables en un dataframe
data = data.frame(variable2, variable2.1)
# Calcular la correlación entre las dos variables
correlacion = cor(data$variable2, data$variable2.1, method = "pearson")
# Imprimir la correlación
print(paste("Correlación entre p26 de Datos20 y Datos24:", correlacion))
## [1] "Correlación entre p26 de Datos20 y Datos24: 0.0454176380835766"
# Gráfico de dispersión (scatter plot) para visualizar la relación
plot(data$variable2, data$variable2.1,
main = "Gráfico de Dispersión: p26 Datos20 vs Datos24",
xlab = "Minutos leidos en 2020",
ylab = "Minutos leídos en 2024",
col = "darkblue", pch = 16)
# Agregar la línea de regresión lineal
abline(lm(data$variable2.1 ~ data$variable2), col = "red")
library(ggplot2)
library(reshape2)
# Seleccionar variables p33_1 a p33_4 para M20 y M24
M20_p33 <- M20[, c("p33_1", "p33_2", "p33_3", "p33_4")]
M24_p33 <- M24[, c("p33_1", "p33_2", "p33_3", "p33_4")]
En los últimos tres meses, ¿usted asistió…
p33_1 significa : a la sección de libros y revistas de una tienda departamental?
p33_2 significa : a un puesto de libros o revistas usados?
p33_3 significa : a una biblioteca?
p33_4 significa : a una librería?
Donde 1 es Si y 2 es No
# Función para crear gráficas de barras individuales
crear_bar_chart <- function(datos, variable, año) {
respuestas <- table(factor(datos[[variable]], levels = c(1, 2)))
barplot(respuestas, beside = TRUE, col = c("green", "red"),
names.arg = c("Sí", "No"), main = paste("Respuestas a", variable, "en", año),
ylab = "Frecuencia", xlab = "Respuesta")
}
# Función para crear gráficos de pastel
crear_pie_chart <- function(datos, variable, año) {
respuestas <- table(factor(datos[[variable]], levels = c(1, 2)))
pie(respuestas, labels = c("Sí", "No"), col = c("green", "red"),
main = paste("Respuestas a", variable, "en", año))
}
# Graficar barras para 2020
par(mfrow = c(2, 2)) # Dividir la ventana gráfica en 4
crear_bar_chart(M20, "p33_1", "2020")
crear_bar_chart(M20, "p33_2", "2020")
crear_bar_chart(M20, "p33_3", "2020")
crear_bar_chart(M20, "p33_4", "2020")
# Graficar pastel para 2020
par(mfrow = c(2, 2)) # Dividir la ventana gráfica en 4
crear_pie_chart(M20, "p33_1", "2020")
crear_pie_chart(M20, "p33_2", "2020")
crear_pie_chart(M20, "p33_3", "2020")
crear_pie_chart(M20, "p33_4", "2020")
# Graficar barras para 2024
par(mfrow = c(2, 2)) # Dividir la ventana gráfica en 4
crear_bar_chart(M24, "p33_1", "2024")
crear_bar_chart(M24, "p33_2", "2024")
crear_bar_chart(M24, "p33_3", "2024")
crear_bar_chart(M24, "p33_4", "2024")
# Graficar pastel para 2024
par(mfrow = c(2, 2)) # Dividir la ventana gráfica en 4
crear_pie_chart(M24, "p33_1", "2024")
crear_pie_chart(M24, "p33_2", "2024")
crear_pie_chart(M24, "p33_3", "2024")
crear_pie_chart(M24, "p33_4", "2024")
# Función para crear una tabla de distribución de frecuencias
crear_tabla_frecuencia <- function(datos, variables, año) {
# Inicializar lista vacía para almacenar las tablas
tablas_frecuencia <- list()
# Iterar sobre cada variable
for (var in variables) {
# Contar las frecuencias para Sí (1) y No (2)
frecuencias <- table(factor(datos[[var]], levels = c(1, 2)))
# Convertir en data frame para que sea más legible
tabla_frec <- as.data.frame(frecuencias)
tabla_frec$Variable <- var
tabla_frec$Año <- año
tablas_frecuencia[[var]] <- tabla_frec
}
# Combinar todas las tablas en una sola
resultado <- do.call(rbind, tablas_frecuencia)
colnames(resultado) <- c("Respuesta", "Frecuencia", "Variable", "Año")
return(resultado)
}
# Definir las variables de interés (p33_1 a p33_4)
variables_p33 <- c("p33_1", "p33_2", "p33_3", "p33_4")
# Crear las tablas de distribución de frecuencia para 2020 y 2024
tabla_frecuencia_2020 <- crear_tabla_frecuencia(M20, variables_p33, "2020")
tabla_frecuencia_2024 <- crear_tabla_frecuencia(M24, variables_p33, "2024")
# Unir las tablas para ambos años
tabla_frecuencia_total <- rbind(tabla_frecuencia_2020, tabla_frecuencia_2024)
# Mostrar la tabla final
print(tabla_frecuencia_total)
## Respuesta Frecuencia Variable Año
## p33_1.1 1 401 p33_1 2020
## p33_1.2 2 1557 p33_1 2020
## p33_2.1 1 259 p33_2 2020
## p33_2.2 2 1699 p33_2 2020
## p33_3.1 1 169 p33_3 2020
## p33_3.2 2 1789 p33_3 2020
## p33_4.1 1 341 p33_4 2020
## p33_4.2 2 1617 p33_4 2020
## p33_1.11 1 335 p33_1 2024
## p33_1.21 2 1634 p33_1 2024
## p33_2.11 1 172 p33_2 2024
## p33_2.21 2 1797 p33_2 2024
## p33_3.11 1 134 p33_3 2024
## p33_3.21 2 1835 p33_3 2024
## p33_4.11 1 261 p33_4 2024
## p33_4.21 2 1708 p33_4 2024
2020:
401 personas asistieron (20.5%).
1557 personas no asistieron (79.5%).
2024:
335 personas asistieron (17%).
1634 personas no asistieron (83%).
Hubo una disminución en la asistencia a la sección de libros y revistas de una tienda departamental, con una caída de 3.5 % en la cantidad de personas que asistieron.
2020:
259 personas asistieron (13.2%).
1699 personas no asistieron (86.8%).
2024:
172 personas asistieron (8.7%).
1797 personas no asistieron (91.3%).
La asistencia a puestos de libros usados disminuyó en 4.5 %, lo que indica que menos personas visitaron estos espacios en 2024.
2020:
169 personas asistieron (8.6%).
1789 personas no asistieron (91.4%).
2024:
134 personas asistieron (6.8%).
1835 personas no asistieron (93.2%).
La asistencia a bibliotecas también disminuyó entre 2020 y 2024, con una caída de 1.8 %.
2020:
341 personas asistieron (17.4%).
1617 personas no asistieron (82.6%).
2024:
261 personas asistieron (13.3%).
1708 personas no asistieron (86.7%).
La asistencia a librerías disminuyó en 4.1 % entre 2020 y 2024.
La mayor caída se dio en la asistencia a puestos de libros usados, con una reducción de 4.5 % . La menor caída fue en la asistencia a bibliotecas (1.8 %), lo que marca una tendencia a la baja en la visita a estos espacios.