TALLER DISEÑO DE ENCUESTAS

Con el próposito de poner en práctica los conocimientos adquiridos durante este corte se propueso una actividad de creación de encuestas con ayuda de la herramienta online Kobotoolbox. La encuesta consiste de 10 preguntas y se selecciono una muestra de 50 estudiantes de la Universidad Javeriana para desarrollarla.

Para iniciar se realizo un muestreo estratificado asignando por grupos según las facultades: Se toma n/#de estratos. Teniendo como ideal encuestar a 3 estudiantes de cada una de las 17 facultades.

A la hora de puesta en práctica no se lograron recolectar respuestas de todas las facultades por lo cual los resultados se reducen a un total de seis facultades.

Población: Estudiantes de la universidad Javeriana.

### Muestra: 50 estudiantes de 6 facultades

Este es un documento en el cual se compartiran los resultados de una encuesta realizada a 50 estudiantes de la universidad Javeriana Bogotá, para conocer su satisfacción acerca de las materias obligatorias de las areás de Teología y Filosofía. Se escogio esta por la importancia que la universidad le concede a estas materias, importancia que se evidencia en la obligatoriedad de cumplimiento de cierta cantidad de créditos para graduarnos.

Variable dependiente: Satisfacción acerca de las materias de Teología y Filosofía.

ENCUESTA:

Se planteron 10 preguntas, cada una comprende una variable explicativa que nos conllevará posteriormente a un resultado.

1.¿A qué facultad pertenece?

facultades <- c("Ciencias Económicas y Administrativas", "Ingeniería", "Ciencias Jurídicas", "Medicina", "Ciencias Políticas y Relaciones Internacionales", "Psicología", "Artes", "Ciencias")
estudiantes <- c(27, 10, 6, 24, 2, 1, 1, 1)
datos <- data.frame(Facultad = facultades, Estudiantes = estudiantes)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.2
scatter_plot <- ggplot(datos, aes(x = Facultad, y = Estudiantes)) +
  geom_point() +
  labs(title = "Diagrama de Dispersión de Estudiantes por Facultad",
       x = "Facultad", y = "Número de Estudiantes")
print(scatter_plot)

2.¿A visto o cursado materias de filosofía / Teología?

library(ggplot2)
library(plotly)
## Warning: package 'plotly' was built under R version 4.3.2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
pregunta <- "¿Ha visto o cursado materias de filosofía/teología?"
respuestas <- data.frame(Respuesta = c("Sí", "No"),Frecuencia = c(50, 0))
fig <- plot_ly(data = respuestas, x = ~Respuesta, y = ~Frecuencia, type = "bar", text = ~Frecuencia, textposition = "inside", marker = list(color = "blue"))
fig <- fig %>% layout(title = pregunta, xaxis = list(title = "Respuesta"), yaxis = list(title = "Frecuencia"))
fig

3.¿Cuántos créditos de materias de filosofía/teología le exige su carrera para graduarse?

creditos <- c(4, 4, 4, 4, 4, 4, 4, 9, 8, 6, 6, 6, 8, 12, 8, 10, 8, 8, 8, 8, 4, 10, 12, 10, 10, 10, 6, 4, 10, 8, 10, 8, 8, 8, 12, 10, 2, 3, 6, 4, 4, 4, 9, 4, 6, 12, 15, 4, 6, 8)
moda <- as.numeric(names(sort(table(creditos), decreasing = TRUE)[1]))
media <- mean(creditos)
mediana <- median(creditos)
resultados <- data.frame(Estadística = c("Moda", "Media", "Mediana"),Valor = c(moda, media, mediana))
resultados
##   Estadística Valor
## 1        Moda   4.0
## 2       Media   7.2
## 3     Mediana   8.0

4.¿Respecto a esta cantidad usted se siente?

#Los resultados se presentan en el siguiente orden:  Indiferente, Algo inconforme, Conforme, Muy conforme, Muy inconforme, Inconforme.
respuestas <- c(19, 11, 10, 4, 3, 3)
# Para el análisis de esta pregunta, formule una prueba de hipotesis, para esto se clasifican las respuestas en persepción positiva, y persepción negativa:
positivo <- sum(respuestas[c(1, 3, 4)])
negativo <- sum(respuestas[c(2, 5, 6)])
cat("Categoría Positivo:", positivo, "\n")
## Categoría Positivo: 33
cat("Categoría Negativo:", negativo, "\n")
## Categoría Negativo: 17
# Prueba de hipotesis: 50% de los encuestados tienen una persepción positiva
total_respuestas <- sum(respuestas)
proporcion_positivo <- positivo / total_respuestas
proporcion_esperada <- 0.5  
prueba_hipotesis <- prop.test(positivo, total_respuestas, p = proporcion_esperada, alternative = "two.sided")
# El resultado de la prueba de hipotesis fue:
cat("\nResultado de la prueba de hipótesis:\n")
## 
## Resultado de la prueba de hipótesis:
print(prueba_hipotesis)
## 
##  1-sample proportions test with continuity correction
## 
## data:  positivo out of total_respuestas, null probability proporcion_esperada
## X-squared = 4.5, df = 1, p-value = 0.03389
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.5114459 0.7840536
## sample estimates:
##    p 
## 0.66
#No se cumple la hipotesis ya que las opiniones positivas son mayores al 50%.

5.De 1 a 5, ¿Cómo considera su experiencia en estas clases? Siendo 5 satisfecho y 1 no satisfecho

experiencia <- c(8, 12, 17, 12, 5)
total_respuestas <- sum(experiencia)
porcentajes <- (experiencia / total_respuestas) * 100
etiquetas <- c("1", "2", "3", "4", "5")
pie(porcentajes, labels = etiquetas, main = "Experiencia en las clases")
legend("topright", legend = paste("Nivel ", etiquetas, ": ", porcentajes, "%"), cex = 0.8, fill = rainbow(length(etiquetas)))

6.Califique de 1 a 10 el grado de dificultad de estas materias; siendo 1 nada difícil y 10 muy difícil.

datos <- c(4, 7, 5, 5, 3, 6, 3, 7, 8, 7, 2, 2, 4, 6, 3, 0, 1, 2, 3, 1, 10, 4, 8, 6, 6, 4, 7, 2, 1, 0, 8, 5, 2, 6, 7, 5, 7, 7, 1, 5, 4, 6, 3, 3, 3, 3, 8, 2, 8, 2)
moda <- as.numeric(names(sort(table(datos), decreasing = TRUE)[1]))
moda
## [1] 3
media <- mean(datos)
media
## [1] 4.44
mediana <- median(datos)
mediana
## [1] 4
#El grado de dificultad esta alrededor de 3 y 4.

7.En promedio su nota en estas materias, es:

datos <- c(41, 33, 35, 38, 41, 36, 40, 43, 36, 40, 35, 46, 45, 45, 45, 44, 48, 47, 43, 45, 47, 40, 40, 45, 43, 38, 43, 40, 40, 48, 44, 34, 46, 40, 42, 40, 40, 46, 47, 40, 45, 47, 40, 40, 40, 30, 40, 40, 40)
tabla_frecuencias <- table(datos)
frecuencia_abs_acumulada <- cumsum(table(datos))
frecuencia_rel_acumulada <- cumsum(table(datos)) / length(datos)
tabla_frecuencias_df <- data.frame(
  Valor = as.numeric(names(tabla_frecuencias)),
  Frecuencia_Absoluta = as.numeric(tabla_frecuencias),
  Frecuencia_Absoluta_Acumulada = frecuencia_abs_acumulada,
  Frecuencia_Relativa = as.numeric(tabla_frecuencias) / length(datos),
  Frecuencia_Relativa_Acumulada = frecuencia_rel_acumulada)
print(tabla_frecuencias_df)
##    Valor Frecuencia_Absoluta Frecuencia_Absoluta_Acumulada Frecuencia_Relativa
## 30    30                   1                             1          0.02040816
## 33    33                   1                             2          0.02040816
## 34    34                   1                             3          0.02040816
## 35    35                   2                             5          0.04081633
## 36    36                   2                             7          0.04081633
## 38    38                   2                             9          0.04081633
## 40    40                  16                            25          0.32653061
## 41    41                   2                            27          0.04081633
## 42    42                   1                            28          0.02040816
## 43    43                   4                            32          0.08163265
## 44    44                   2                            34          0.04081633
## 45    45                   6                            40          0.12244898
## 46    46                   3                            43          0.06122449
## 47    47                   4                            47          0.08163265
## 48    48                   2                            49          0.04081633
##    Frecuencia_Relativa_Acumulada
## 30                    0.02040816
## 33                    0.04081633
## 34                    0.06122449
## 35                    0.10204082
## 36                    0.14285714
## 38                    0.18367347
## 40                    0.51020408
## 41                    0.55102041
## 42                    0.57142857
## 43                    0.65306122
## 44                    0.69387755
## 45                    0.81632653
## 46                    0.87755102
## 47                    0.95918367
## 48                    1.00000000

8.¿Ha retirado una de estas materias en alguna oportunidad?

library(ggplot2)
pregunta <- "¿Ha retirado estas materias en alguna oportunidad?"
respuestas <- data.frame(Respuesta = c("Sí", "No"),Frecuencia = c(4, 46))
fig2 <- plot_ly(data = respuestas, x = ~Respuesta, y = ~Frecuencia, type = "bar", text = ~Frecuencia, textposition = "inside", marker = list(color = "pink"))
fig2 <- fig2 %>% layout(title = pregunta, xaxis = list(title = "¿Ha retirado una de estas materias en alguna oportunidad?"), yaxis = list(title = "Frecuencia"))
fig2

9.Su nivel de atención en estas materias es:

niveles_atencion <- c("Atento", "Poco Atento", "Pongo atención en oportunidades", "No presto nada de atención")
cantidad_respuestas <- c(21, 14, 12, 3)
datos <- data.frame(Nivel = niveles_atencion, Cantidad = cantidad_respuestas)
barplot(datos$Cantidad, names.arg = datos$Nivel, col = "skyblue", xlab = "Nivel de Atención", ylab = "Cantidad", main = "Nivel de Atención en Materias", space = 0)

10. ¿Para su formación integral usted considera qué estas materias son importantes? Siendo cero nada importante y 10 muy importante?

datos_diez <-c(9,1,5,4,8,8,3,6,4,2,2,4,9,3,1,6,4,7,10,3,4,2,5,4,4,4,9,7,1,6,10,2,8,5,2,3,1,3,2,8,1,8,2,2,7,10,2,3,7,8)
moda <- as.numeric(names(sort(table(datos_diez), decreasing = TRUE)[1]))
moda
## [1] 2
media <- mean(datos_diez)
media
## [1] 4.78
mediana <- median(datos_diez)
mediana
## [1] 4