TALLER DISEÑO DE ENCUESTAS

Con el próposito de poner en práctica los conocimientos adquiridos durante este corte se propueso una actividad de creación de encuestas con ayuda de la herramienta online Kobotoolbox. La encuesta consiste de 10 preguntas y se selecciono una muestra de 50 estudiantes de la Universidad Javeriana para desarrollarla.

La encuesta puede ser revisada en el siguiente link: https://ee.kobotoolbox.org/x/EYSnXLZa

Muestreo:

Para iniciar se realizo un muestreo estratificado asignando por grupos según las facultades:

Se toma n/#de estratos. Donde n: Es el tamaño de la muestra. Aplicado a nuestro contexto seria: 50/17=3

Teniendo como ideal encuestar a 3 estudiantes de cada una de las 17 facultades.

Población: Estudiantes de la universidad Javeriana.

Muestra: 50 estudiantes de 6 facultades


Explicación del tema:

La variable dependiente o lo que se pretende medir es el **nivel de satisfacción acerca de las materias de Teología y Filosofía*. Se escogio esta por la importancia que la universidad le concede a estas materias, importancia que se evidencia en la obligatoriedad de cumplimiento de cierta cantidad de créditos para graduarnos y se pretende contrastar con la importancia que le dan los estudiantes que las toman.

Nuestra variable dependiente es el efecto o resultado de diferentes variables independientes. A continuación se análisa cada pregunta y la variable explicativa que la relaciona con nuestra variable dependiente.

ENCUESTA:

1.¿A qué facultad pertenece?

Variable Dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Facultad. Relación entre las variables: Está variable no es explicativa, solo es informativa, busca darnos información sobre la muestra y las personas que se encuestaron.

Para interpretar los resultados se realiza un diagrama de dispersión:

facultades <- c("Ciencias Económicas y Administrativas", "Ingeniería", "Ciencias Jurídicas", "Medicina", "Ciencias Políticas y Relaciones Internacionales", "Psicología", "Artes", "Ciencias")
estudiantes <- c(27, 10, 6, 2, 2, 1, 1, 1)
datos <- data.frame(Facultad = facultades, Estudiantes = estudiantes)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.2
scatter_plot <- ggplot(datos, aes(x = Facultad, y = Estudiantes)) +
  geom_point() +
  labs(title = "Diagrama de Dispersión de Estudiantes por Facultad",
       x = "Facultad", y = "Número de Estudiantes")
print(scatter_plot)

En este gráfico de dispersión cada uno de los puntos representa una facultad, como es evidente existe un sesgo en la muestra debido a la falta de representación equitativa de estudiantes de todas las facultades. En las facultades de CEA e Ingienería existe una sobremuestra mientras que en las otras se da un subsampleo, es decir hay menos encuestas realizadas de lo esperado. Se determina que la causa más acertada para explicar este resultado es por preferencias del encuestador (Notas del encuestador:A pesar de querer cumplir con el muestreo estratificado que se había planteado es dificil conocer a personas de todas las facultades que esten dispuestas a colaborarte y responder tu encuesta por lo cual la encuesta se limito a conocidos que me pudieron ayudar respondiendo.)

Como resultado se pudo identificar que no fue posible poner en práctica el muestreo estratificado.

2.¿A visto o cursado materias de filosofía / Teología? Variable dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Participación. Relación entre variables: Está variable no es explicativa, solo es informativa, Y nos da información sobre si la persona que responde puede o no dar una opinión en base a su experiencia.

Se realiza un gráfico de barras mostranto los resultados:

library(ggplot2)
library(plotly)
## Warning: package 'plotly' was built under R version 4.3.2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
pregunta <- "¿Ha visto o cursado materias de filosofía/teología?"
respuestas <- data.frame(Respuesta = c("Sí", "No"),Frecuencia = c(50, 0))
fig <- plot_ly(data = respuestas, x = ~Respuesta, y = ~Frecuencia, type = "bar", text = ~Frecuencia, textposition = "inside", marker = list(color = "blue"))
fig <- fig %>% layout(title = pregunta, xaxis = list(title = "Respuesta"), yaxis = list(title = "Frecuencia"))
fig

El 100% de los encuestados han visto o cursado la materia por lo cuál todas las respuestas dadas a continuación son en base a su experiencia personal.

3.¿Cuántos créditos de materias de filosofía/teología le exige su carrera para graduarse? Variable dependiente: Satisfacción. Variable independiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Relación entre variables: Está variable no es explicativa, solo es informativa, Y nos da información sobre la cantidad de horas que por programa la universidad exige a los estudiantes cursar y aprobar para graduarse.

En esta pregunta

creditos <- c(4, 4, 4, 4, 4, 4, 4, 9, 8, 6, 6, 6, 8, 12, 8, 10, 8, 8, 8, 8, 4, 10, 12, 10, 10, 10, 6, 4, 10, 8, 10, 8, 8, 8, 12, 10, 2, 3, 6, 4, 4, 4, 9, 4, 6, 12, 15, 4, 6, 8)
moda <- as.numeric(names(sort(table(creditos), decreasing = TRUE)[1]))
media <- mean(creditos)
mediana <- median(creditos)
resultados <- data.frame(Estadística = c("Moda", "Media", "Mediana"),Valor = c(moda, media, mediana))
resultados
##   Estadística Valor
## 1        Moda   4.0
## 2       Media   7.2
## 3     Mediana   8.0

La moda de 4.0 sugiere que un número significativo de carreras tienen requisitos en torno a 4 créditos. La media de 7.2 indica un promedio ponderado por la cantidad de créditos requeridos por todas las carreras encuestadas. La mediana de 8.0 sugiere que la mitad de las carreras tienen requisitos de 8 o menos créditos, lo cual es útil para entender la distribución central de los requisitos. En conclusión, estos valores resumen la distribución de los requisitos de créditos de filosofía/teología y proporcionan una visión general de cuántos créditos son típicamente requeridos para graduarse en las carreras encuestadas.

4.¿Respecto a esta cantidad usted se siente? Variable dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Satisfacción con número de créditos. Relación entre variables:En está ocasión análisamos nuestra primera variable explicativa, en la cual revisamos si la satisfacción de la materia en general tiene que ver con la cantidad de horas y tiempo que se debe dedicar a esta.

#Los resultados se presentan en el siguiente orden:  Indiferente, Algo inconforme, Conforme, Muy conforme, Muy inconforme, Inconforme.
respuestas <- c(19, 11, 10, 4, 3, 3)
# Para el análisis de esta pregunta, formule una prueba de hipotesis, para esto se clasifican las respuestas en persepción positiva, y persepción negativa:
positivo <- sum(respuestas[c(1, 3, 4)])
negativo <- sum(respuestas[c(2, 5, 6)])
cat("Categoría Positivo:", positivo, "\n")
## Categoría Positivo: 33
cat("Categoría Negativo:", negativo, "\n")
## Categoría Negativo: 17
# Prueba de hipotesis: 50% de los encuestados tienen una persepción positiva
total_respuestas <- sum(respuestas)
proporcion_positivo <- positivo / total_respuestas
proporcion_esperada <- 0.5  
prueba_hipotesis <- prop.test(positivo, total_respuestas, p = proporcion_esperada, alternative = "two.sided")
# El resultado de la prueba de hipotesis fue:
cat("\nResultado de la prueba de hipótesis:\n")
## 
## Resultado de la prueba de hipótesis:
print(prueba_hipotesis)
## 
##  1-sample proportions test with continuity correction
## 
## data:  positivo out of total_respuestas, null probability proporcion_esperada
## X-squared = 4.5, df = 1, p-value = 0.03389
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.5114459 0.7840536
## sample estimates:
##    p 
## 0.66
#No se cumple la hipotesis ya que las opiniones positivas son mayores al 50%.

Nuestra variable explicativa nos arroja un resultado positivo fente a la satisfacción de los estudiantes con la cantidad de créditos obligatorios, siendo esta una variable explicativa de nuestra variable dependiente se puede empezar a inferir que la satisfacción general de los estudiantes con la materia es buena.

5.De 1 a 5, ¿Cómo considera su experiencia en estas clases? Siendo 5 satisfecho y 1 no satisfecho

Variable dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Satisfacción con la clase en especifico. Relación entre variables: Esta variable es explicativa porque nos indica como el desarrollo de la clase incluyendo los temas que se ven, la forma en la que se explican y evaluan, entre otros afectan la satisfacción de las personas con las materias de teología y Filosofía.

Se realiza un diagrama de pie para ver

experiencia <- c(8, 12, 17, 12, 5)
total_respuestas <- sum(experiencia)
porcentajes <- (experiencia / total_respuestas) * 100
etiquetas <- c("1", "2", "3", "4", "5")
pie(porcentajes, labels = etiquetas, main = "Experiencia en las clases")
legend("topright", legend = paste("Nivel ", etiquetas, ": ", porcentajes, "%"), cex = 0.8, fill = rainbow(length(etiquetas)))

Nivel 1 (No satisfecho - 4 respuestas): Este sector del círculo representa el porcentaje de personas que calificaron su experiencia con un 1, indicando insatisfacción. En este caso, parece que un número bajo de personas expresaron insatisfacción con la experiencia en las clases.

Nivel 2 (Poco satisfecho - 12 respuestas):Este sector indica la proporción de personas que calificaron su experiencia con un 2. Aunque mayor que la categoría 1, sigue siendo una proporción relativamente baja en comparación con las demás categorías.

Nivel 3 (Neutral - 17 respuestas): La mayor proporción de respuestas se encuentra en esta categoría, donde los participantes calificaron su experiencia con un 3, indicando una posición neutral. La mayoría parece no estar extremadamente satisfecha ni insatisfecha.

Nivel 4 (Satisfecho - 12 respuestas): Este sector representa a aquellos que calificaron su experiencia con un 4, indicando satisfacción. La proporción es similar a la categoría 2, pero con un grado más alto de satisfacción.

Nivel 5 (Muy satisfecho - 5 respuestas): Este sector representa a los participantes que calificaron su experiencia con un 5, indicando una alta satisfacción. Aunque es la proporción más baja, muestra que hay personas que están muy satisfechas con sus clases.

Observaciones Generales: La mayoría de las respuestas se encuentran en las categorías de neutral a satisfecho, lo que sugiere que la experiencia general es positiva. La insatisfacción extrema (categoría 1) es baja en comparación con otras categorías. La categoría neutral (3) es la más grande, lo que indica que hay una diversidad de opiniones y experiencias en las clases.

6.Califique de 1 a 10 el grado de dificultad de estas materias; siendo 1 nada difícil y 10 muy difícil Variable dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Dificultad de la clase. Relación entre variables: Está variable es explicativa porque nos indica como el grado de dificultad de una materia que no tiene que ver en especifico con los conocimientos especiales que cada pregrado afecta la satisfacción que los estudiantes van a tener frente a esta.

datos <- c(4, 7, 5, 5, 3, 6, 3, 7, 8, 7, 2, 2, 4, 6, 3, 0, 1, 2, 3, 1, 10, 4, 8, 6, 6, 4, 7, 2, 1, 0, 8, 5, 2, 6, 7, 5, 7, 7, 1, 5, 4, 6, 3, 3, 3, 3, 8, 2, 8, 2)
moda <- as.numeric(names(sort(table(datos), decreasing = TRUE)[1]))
moda
## [1] 3
media <- mean(datos)
media
## [1] 4.44
mediana <- median(datos)
mediana
## [1] 4
#El grado de dificultad esta alrededor de 3 y 4.

En nuestro análisis encontramos un nivel de dificultad bajo ya que se encuentra entre 3 y 4, con los resultados obtenidos se puede llegar a inferir que a un menor nivel de dificultad mayor satisfaccioón sienten los estudiantes.

7.En promedio su nota en estas materias, es: Variable dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Nota promedio en estas materias. Relación entre variables: Está variable es explicativa porque en general a mayor nota mayor satisfacción presenta el estudiante.

datos <- c(41, 33, 35, 38, 41, 36, 40, 43, 36, 40, 35, 46, 45, 45, 45, 44, 48, 47, 43, 45, 47, 40, 40, 45, 43, 38, 43, 40, 40, 48, 44, 34, 46, 40, 42, 40, 40, 46, 47, 40, 45, 47, 40, 40, 40, 30, 40, 40, 40, 28,29)
tabla_frecuencias <- table(datos)
frecuencia_abs_acumulada <- cumsum(table(datos))
frecuencia_rel_acumulada <- cumsum(table(datos)) / length(datos)
tabla_frecuencias_df <- data.frame(
  Valor = as.numeric(names(tabla_frecuencias)),
  Frecuencia_Absoluta = as.numeric(tabla_frecuencias),
  Frecuencia_Absoluta_Acumulada = frecuencia_abs_acumulada,
  Frecuencia_Relativa = as.numeric(tabla_frecuencias) / length(datos),
  Frecuencia_Relativa_Acumulada = frecuencia_rel_acumulada)
print(tabla_frecuencias_df)
##    Valor Frecuencia_Absoluta Frecuencia_Absoluta_Acumulada Frecuencia_Relativa
## 28    28                   1                             1          0.01960784
## 29    29                   1                             2          0.01960784
## 30    30                   1                             3          0.01960784
## 33    33                   1                             4          0.01960784
## 34    34                   1                             5          0.01960784
## 35    35                   2                             7          0.03921569
## 36    36                   2                             9          0.03921569
## 38    38                   2                            11          0.03921569
## 40    40                  16                            27          0.31372549
## 41    41                   2                            29          0.03921569
## 42    42                   1                            30          0.01960784
## 43    43                   4                            34          0.07843137
## 44    44                   2                            36          0.03921569
## 45    45                   6                            42          0.11764706
## 46    46                   3                            45          0.05882353
## 47    47                   4                            49          0.07843137
## 48    48                   2                            51          0.03921569
##    Frecuencia_Relativa_Acumulada
## 28                    0.01960784
## 29                    0.03921569
## 30                    0.05882353
## 33                    0.07843137
## 34                    0.09803922
## 35                    0.13725490
## 36                    0.17647059
## 38                    0.21568627
## 40                    0.52941176
## 41                    0.56862745
## 42                    0.58823529
## 43                    0.66666667
## 44                    0.70588235
## 45                    0.82352941
## 46                    0.88235294
## 47                    0.96078431
## 48                    1.00000000

La nota más baja es 28 y la más alta es 48. Hay una mayor concentración de notas entre 40 y 45, ya que estas tienen frecuencias más altas (f = 9 para 45, por ejemplo). La frecuencia absoluta acumulada (F) muestra cuántos estudiantes obtuvieron una nota igual o inferior a cierto valor. Por ejemplo, 45 estudiantes obtuvieron una nota igual o inferior a 45. La frecuencia relativa (f_rel) indica la proporción de estudiantes que obtuvieron cierta nota con respecto al total de estudiantes. Por ejemplo, el 18% de los estudiantes obtuvo una nota de 45. La frecuencia relativa acumulada (F_rel) muestra la proporción acumulada de estudiantes que obtuvieron una nota igual o inferior a cierto valor. Al final de la tabla, vemos que el 98% de los estudiantes obtuvo una nota de 47 o inferior. Esta tabla proporciona una visión completa de la distribución de las notas, permitiendo identificar tendencias, concentraciones y la variabilidad en los resultados.

8.¿Ha retirado una de estas materias en alguna oportunidad? Variable dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Frecuencia de deserción de la materia. Relación entre variables: Está variable es explicativa porque el tener una alta deserción comunmente es consecuncia de una alta insatisfacción con la materia.

library(ggplot2)
pregunta <- "¿Ha retirado estas materias en alguna oportunidad?"
respuestas <- data.frame(Respuesta = c("Sí", "No"),Frecuencia = c(4, 46))
fig2 <- plot_ly(data = respuestas, x = ~Respuesta, y = ~Frecuencia, type = "bar", text = ~Frecuencia, textposition = "inside", marker = list(color = "pink"))
fig2 <- fig2 %>% layout(title = pregunta, xaxis = list(title = "¿Ha retirado una de estas materias en alguna oportunidad?"), yaxis = list(title = "Frecuencia"))
fig2

Como podemos observar es muy baja la cantidad de personas que han retirado la materia en alguna oportunidad, por lo cual se puede inferir que existe una buena satisfacción.

9.Su nivel de atención en estas materias es: Variable dependiente: Nivel de satisfacción acerca de las materias de Teología y Filosofía. Variable independiente: Nivel de atención . Relación entre variables: Está variable es explicativa porque el nivel de atención es un indicador de gusto e importancia hacia una materia.

niveles_atencion <- c("Atento", "Poco Atento", "Pongo atención en oportunidades", "No presto nada de atención")
cantidad_respuestas <- c(21, 14, 12, 3)
datos <- data.frame(Nivel = niveles_atencion, Cantidad = cantidad_respuestas)
barplot(datos$Cantidad, names.arg = datos$Nivel, col = "skyblue", xlab = "Nivel de Atención", ylab = "Cantidad", main = "Nivel de Atención en Materias", space = 0)

“Atento” (21 respuestas):La mayoría de los estudiantes se considera “atenta” en las clases de Teología y Filosofía. Esto puede sugerir un alto nivel de interés y participación activa en estas materias.

“Poco Atento” (14 respuestas):Un número significativo de estudiantes se autocalifica como “poco atento”. Esto podría indicar que algunos estudiantes podrían tener desafíos para mantener un nivel constante de atención en estas clases.

“Pongo atención en oportunidades” (12 respuestas):Otro grupo de estudiantes menciona que pone atención en oportunidades. Esto podría sugerir que algunos estudiantes pueden experimentar fluctuaciones en su nivel de atención, tal vez dependiendo del tema o la metodología de enseñanza.

“No presto nada de atención” (3 respuestas):Una minoría de estudiantes indica que no presta nada de atención en estas materias. Esto podría ser un área de preocupación y podría requerir una exploración más profunda para comprender las razones detrás de esta falta de atención.

10.¿Para su formación integral usted considera qué estas materias son importantes? Siendo cero nada importante y 10 muy importante? Esta es una pregunta que no busca exactamente ser explicativa ante nuestra variable dependiente, sino que pretende ser una pregunta de conclusión:

datos_diez <-c(9,1,5,4,8,8,3,6,4,2,2,4,9,3,1,6,4,7,10,3,4,2,5,4,4,4,9,7,1,6,10,2,8,5,2,3,1,3,2,8,1,8,2,2,7,10,2,3,7,8)
moda <- as.numeric(names(sort(table(datos_diez), decreasing = TRUE)[1]))
moda
## [1] 2
media <- mean(datos_diez)
media
## [1] 4.78
mediana <- median(datos_diez)
mediana
## [1] 4

Los resultados sugieren que hay una tendencia hacia la percepción de que estas materias son de importancia intermedia. La moda, siendo 4, indica que hay una concentración notable en esa calificación específica. La media y la mediana refuerzan la idea de que, en promedio, los estudiantes tienen una percepción de importancia intermedia para estas materias en su formación integral. Estos resultados proporcionan información valiosa sobre la percepción colectiva de los estudiantes y pueden ser útiles para los educadores y diseñadores de currículos al evaluar la relevancia y la forma de presentar estas materias en el contexto de la formación integral.