Resumen
En este estudio de investigación, se analizaron datos recopilados a través de una encuesta aplicada a agricultores para comprender su interés y motivaciones con respecto a la aplicación de un modelo agroforestal en sus fincas. La encuesta incluyó una serie de preguntas que abordaron diferentes aspectos, y los datos se procesaron y analizaron para obtener una visión más clara de las actitudes y percepciones de los agricultores.
Los resultados obtenidos, a través de un análisis de prueba Chi-cuadrada, revelaron patrones interesantes en cuanto al interés y las motivaciones de los agricultores. La mayoría de los agricultores expresaron un alto interés en aplicar el modelo agroforestal en sus fincas, lo que sugiere una recepción positiva de esta práctica. Además, las motivaciones para adoptar este modelo variaron, con algunos agricultores enfocándose en aspectos ambientales, mientras que otros consideraban factores económicos y sociales.
Si bien inicialmente se consideró la aplicación de una regresión logística para analizar la relación entre las variables predictoras y la probabilidad de interés en el modelo agroforestal, se encontraron desafíos significativos debido a la naturaleza original de las respuestas de los agricultores, que se capturaron mediante una escala Likert. La conversión de estas respuestas Likert en un formato binario planteó cuestiones sobre la pérdida de información y la posible violación de las suposiciones del modelo, lo que llevó a replantear su aplicabilidad.
Este estudio aporta información valiosa al destacar la positiva receptividad de los agricultores hacia la implementación de prácticas agroforestales. A pesar de las limitaciones asociadas con la aplicación de la regresión logística, los resultados de la prueba Chi-cuadrada resaltan la importancia de estas actitudes y motivaciones en la promoción de prácticas agroforestales sostenibles en la agricultura. Estos hallazgos brindan una base sólida para futuras investigaciones y acciones destinadas a fomentar la adopción de modelos agroforestales en el sector agrícola.
La agroforestería, como enfoque innovador y sostenible de la agricultura, ha cobrado una creciente relevancia en la gestión de fincas agrícolas en todo el mundo. Este enfoque integra árboles, arbustos y cultivos en un mismo sistema, con el objetivo de optimizar la producción agrícola, conservar los recursos naturales y promover la resiliencia frente a los desafíos ambientales. En este contexto, la presente investigación se adentra en el análisis de la aplicación de la agroforestería en fincas agrícolas, con un enfoque especial en el interés y las motivaciones de los agricultores.
El objetivo fundamental de esta investigación es explorar la relación entre la adopción de modelos agroforestales en fincas agrícolas y diversas características de los agricultores, sus familias y las propias fincas. Para ello, hemos llevado a cabo una encuesta detallada que recopila datos sobre aspectos clave, como la tenencia de la tierra, el nivel de educación, la edad, el tamaño de la finca y el interés en la aplicación de la agroforestería. Estos datos se analizarán cuidadosamente para identificar patrones y tendencias que arrojen luz sobre las motivaciones y los factores que influyen en la adopción de la agroforestería.
Para guiar esta investigación, se han formulado dos hipótesis específicas:
La aplicación de la agroforestería en las fincas agrícolas de las familias encuestadas está más relacionada con la forma de tenencia de la tierra.
El nivel de motivación expresado por los agricultores para aplicar la agroforestería en sus fincas está más relacionado con la edad de los encuestados, asumiendo que las personas de mayor edad expresan un mayor valor intrínseco por la biodiversidad en la finca.
Para evaluar estas hipótesis, analizaremos los datos recopilados en nuestra encuesta, que incluye respuestas en una escala Likert de 1 a 5, que van desde “Totalmente en desacuerdo” hasta “Totalmente de acuerdo”. También consideraremos variables relacionadas con la tenencia de la tierra, el nivel educativo, el sexo, la ubicación geográfica y otras características relevantes.
La importancia de esta investigación radica en su potencial para proporcionar una comprensión más profunda de las dinámicas que impulsan la adopción de la agroforestería en fincas agrícolas. Los resultados obtenidos permitirán orientar políticas y estrategias de desarrollo agrícola que promuevan prácticas sostenibles y la conservación de los recursos naturales en las comunidades rurales.
A lo largo de este informe, se presentarán un análisis detallado de los datos recopilados y discutiremos las implicaciones de nuestros hallazgos. Este estudio busca contribuir al conocimiento en el campo de la agroforestería y brindar información valiosa para la toma de decisiones en el ámbito agrícola y medioambiental.
Descripción de la Base de Datos
La base de datos utilizada en esta investigación se compone de respuestas de 60 encuestados que participaron en un estudio sobre la aplicación de la agroforestería en fincas agrícolas y sus motivaciones. Estas respuestas se recopilaron a través de una encuesta que consta de 20 preguntas, diseñadas para medir el grado de aceptación y las motivaciones relacionadas con la agroforestería. Además, se registraron variables adicionales relacionadas con las características de las fincas y los encuestados.
A continuación, se describen las principales variables incluidas en la base de datos:
caso: Número de caso o identificación única para cada encuestado.
barrio: Código que representa el barrio de residencia de cada encuestado.
sexo: Género del encuestado (1 para hombres y 0 para mujeres).
edad: Edad del encuestado en años.
nrohijos: Número de hijos que tiene el encuestado.
nivelestudios: Nivel educativo del encuestado (1 para Básico, 2 para Medio, 3 para Universitario, 4 para Postgrado).
niveltenenciatierra: Tipo de tenencia de la tierra (Alquilada, Derechera, Título en gestión, Titulada).
tamafinca: Tamaño de la finca en hectáreas.
tamabosquerem: Hectáreas de bosque remanente en la finca.
tamacultivoyer: Hectáreas destinadas al cultivo de yerba mate.
Estas variables se utilizaron para analizar las respuestas a las preguntas de la encuesta y explorar las relaciones entre las características de los encuestados y sus actitudes hacia la agroforestería. Las preguntas de la encuesta se dividen en dos dimensiones: “Interés de agricultores en aplicar el modelo agroforestal en su finca” y “Motivaciones de los agricultores para aplicar modelos agroforestales en su finca”. Las respuestas a estas preguntas se califican en una escala de 1 (Totalmente en desacuerdo) a 5 (Totalmente de acuerdo).
Esta base de datos se utilizará para evaluar las hipótesis planteadas en la investigación y para comprender mejor las motivaciones y actitudes de los agricultores hacia la agroforestería en sus fincas agrícolas.
Variable | Descripción | Escala |
---|---|---|
caso | Caso | 1, 2, 3,….,62 |
barrio | Barrio | 1: San Isidro, 2: Caacupemi |
sexo | Sexo (0 = Femenino, 1 = Masculino) | 1: Hombres, 0: Mujeres |
edad | Edad | 15,16,17,18,….,90 |
nrohijos | Número de Hijos | 0,1,2,3,4,….. |
nivelestudios | Nivel de Estudios | Básico, Medio, Universitario, Postgrado |
niveltenenciatierra | Nivel de Tenencia de Tierra | Alquilada, Derechera, Título en gestión, Titulada |
tamafinca | Tamaño de Finca | 10,65,5.5,…. |
tamabosquerem | Hectáreas de Bosque Remanente | 10,65,5.5,…. |
tamacultivoyer | Hectáreas de Cultivo de Yerba Mate | 10,65,5.5,…. |
e37 | Pregunta 37: Es aplicable en mi finca | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e38 | Pregunta 38: Me gustaría aplicar en la parcela de Ilex | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e39 | Pregunta 39: Estoy dispuesto a comprar plantines | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e40 | Pregunta 40: Estoy dispuesto a comprar insumos | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e41 | Pregunta 41: Estoy interesado en capacitarme en el tema | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e42 | Pregunta 42: Estoy dispuesto a comprar equipos | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e43 | Pregunta 43: Me interesa conocer sus bondades | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e44 | Pregunta 44: Estoy interesado en recuperar árboles nativos | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e45 | Pregunta 45: Me interesa para mostrar a los vecinos | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
e46 | Pregunta 46: Puedo destinar un área de mi finca para ello | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f48 | Pregunta 48: Existencia de un Plan municipal de restauración | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f49 | Pregunta 49: Cumplir exigencia legal | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f50 | Pregunta 50: Reponer especies de árboles en parcelas | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f52 | Pregunta 52: Recuperar animales silvestres | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f58 | Pregunta 58: Mejorar la calidad del suelo | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f53 | Pregunta 53: Enfrentar las sequías extremas | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f54 | Pregunta 54: Apoyar la educación ambiental | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f57 | Pregunta 57: Brindar trabajo para jóvenes locales | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f55 | Pregunta 55: Proveer de leña a la casa | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
f56 | Pregunta 56: Contar con sombra en la chacra para el descanso | 1: Totalmente en desacuerdo, 2: En desacuerdo, 3: Neutro, 4: De acuerdo, 5: Totalmente de acuerdo |
El presente estudio se enfoca en el análisis de los factores que influyen en el interés y las motivaciones de los agricultores para adoptar prácticas de agroforestería en sus fincas en una región específica. Para lograr esto, se llevó a cabo una metodología exhaustiva que incluyó varias etapas, desde la recopilación de datos hasta el análisis estadístico y la interpretación de resultados.
1. Diseño de la Encuesta:
La recolección de datos comenzó con la creación de un cuestionario que abordaba las dimensiones del interés y las motivaciones de los agricultores en relación con la adopción de prácticas agroforestales. Cada dimensión se evaluó a través de una serie de preguntas con respuestas en una escala Likert, que iba desde “Totalmente en desacuerdo” (1) hasta “Totalmente de acuerdo” (5). Estas preguntas se diseñaron para capturar la percepción de los agricultores sobre las prácticas agroforestales y los factores que podrían influir en sus decisiones.
2. Gestión de Datos:
Una vez recopilados los datos, se procedió a la gestión y preparación de los mismos. Se llevaron a cabo tareas de limpieza de datos para corregir posibles errores, se identificaron valores atípicos y se manejaron los datos faltantes. La información se organizó en una base de datos adecuada para el análisis.
3. Recodificación y Creación de Nuevas Variables: Como parte de la preparación de datos, se recodificaron las respuestas Likert en dos categorías dicotomizadas: “De acuerdo” y “Totalmente de acuerdo”. Esto se hizo debido a un sesgo observado hacia respuestas más bajas (1, 2 y 3), lo que generaba un desbalance en los datos. La dicotomización permitió simplificar y equilibrar la respuesta.
Además, se crearon variables adicionales para representar características demográficas de los agricultores, como la edad, el nivel de educación, la extensión de la finca, la posesión de títulos de propiedad y la ubicación geográfica (barrio de residencia).
4. Análisis Estadístico:
Para verificar las hipótesis del estudio, se aplican técnicas estadísticas. Se realizó un análisis de regresión logística para explorar las relaciones entre las variables independientes (edad, nivel de educación, extensión de la finca, etc.) y las variables dependientes (interés y motivación). Se calcularon odds ratios para evaluar la influencia de cada variable en las categorías “De acuerdo” y “Totalmente de acuerdo”.
5. Verificación de Supuestos:
Se llevaron a cabo pruebas para verificar supuestos importantes, como la multicolinealidad, que evalúa la relación entre las variables independientes, y la homocedasticidad, que mide la constancia de la varianza de los errores en el modelo de regresión logística.
##
## 1 2
## 29 33
##
## 0 1
## 4 58
##
## Mujeres Hombres
## 4 58
table(datos$edad)
##
## 24 27 29 30 31 34 35 38 40 41 44 47 49 51 52 53 54 55 56 57 58 60 61 62 63 64
## 2 2 1 1 1 3 1 2 1 2 1 1 1 1 3 2 3 1 2 1 7 1 6 2 2 1
## 67 68 73 78
## 4 1 2 4
summary(datos$edad)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 24.00 41.75 56.50 53.32 61.75 78.00
#recodificar edad, en categorias
datos$edadgrupo=floor(datos$edad/5)
#table(datos$edadgrupo)
#reemplazar los valores iguales o superiores a 16 por 16
#help(mutate)
datos$edadgrupo[datos$edadgrupo >= 16] <- 16
datos$edadgrupo<-factor(datos$edadgrupo, levels=c(0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15),
labels=c("0 a 4","5 a 9", "10 a 14", "15 a 19","20 a 24","25 a 29","30 a 34","35 a 39","40 a 44","45 a 49","50 a 54","55 a 59","60 a 64","65 a 69","70 a 74","75 y más"))
#table(datos$edadgrupo)
datos$edadgrupod=floor(datos$edad/10)
#table(datos$edadgrupod)
#reemplazar los valores iguales o superiores a 8 por 8
datos$edadgrupod[datos$edadgrupod >=8 ] <- 8
datos$edadgrupod<-factor(datos$edadgrupod, levels=c(0,1,2,3,4,5,6,7,8),
labels=c("0 a 9","10 a 19", "20 a 29", "30 a 39","40 a 49","50 a 59","60 a 69","70 a 79","80 a más"))
#edades agrupadas cada 20 años
datos$edadgrupov=floor(datos$edad/20)
#table(datos$edadgrupov)
#reemplazar los valores iguales o superiores a 8 por 8
datos$edadgrupov[datos$edadgrupov>=3 ] <- 3
datos$edadgrupov<-factor(datos$edadgrupov, levels=c(1,2,3),
labels=c("20 a 39", "40 a 59", "60 a más"))
barplot(table(datos$edadgrupov))
##
## 0 1 2 3 4 5 6 7
## 14 14 14 6 7 3 2 2
table(datos$nivelestudios)
##
## 1 2 3
## 37 18 7
##
## Primario Secundario/niversitario
## 37 25
##
## 1 2 3 4
## 1 21 12 28
##
## 2 3 4
## 22 12 28
##
## 2 3
## 22 40
##
## Alquilado/derechera Con título
## 22 40
##
## 0.5 0.7 1 1.1 1.2 1.5 1.6 2 2.25 2.3 2.4 2.5 3 3.5 3.8 3.9
## 2 1 6 1 1 3 1 1 1 1 1 1 4 2 1 1
## 4 5 5.4 5.9 6 6.3 6.5 7 7.4 7.5 8 8.9 10.8 11 12 13
## 3 3 1 1 2 1 1 1 1 2 2 1 1 1 4 2
## 14.8 15.4 16 18.5 20 30
## 1 1 1 1 2 1
##
## Menos de 5ha 5 a menos de 10ha 10ha o más
## 31 16 15
##
## 0 0.3 0.5 0.7 1 1.5 2 2.1 3 3.3 4 6.3 6.9
## 41 1 6 1 2 1 4 1 1 1 1 1 1
##
## No tiene Sí tiene
## 41 21
##
## No tiene Sí tiene
## 41 21
##
## Sin remanente Menos de 1ha 1 a menos de 5ha 5 o más ha
## 41 10 9 2
##
## 0.25 0.3 0.4 0.5 0.6 0.75 0.8 0.9 1 1.2 1.3 1.4 1.5 1.6 1.8 2
## 1 3 1 5 1 1 3 1 10 3 2 1 2 1 1 7
## 2.2 2.4 2.5 2.9 3.5 4 4.8 6 7 7.6 10 12 17 20
## 1 1 1 1 1 2 1 4 1 1 2 1 1 1
##
## Menos de 5ha 5 o más ha
## 51 11
Resumen
En el contexto de la investigación sobre la implementación de sistemas agroforestales en fincas agrícolas de familias, se han identificado características demográficas clave entre los encuestados. En cuanto al nivel de estudios, la mayoría de los participantes tienen un nivel de educación básico (37 encuestados), mientras que algunos tienen un nivel medio (18 encuestados). La presencia de niveles universitarios es menor (7 encuestados), y no se registraron encuestados con educación de postgrado.
En lo que respecta a la tenencia de la tierra, la forma predominante es la “Derechera” (21 encuestados), seguida de “Titulada” (28 encuestados). Los casos de tenencia “Alquilada” son mínimos (1 encuestado), y algunos terrenos están bajo el régimen de “Título en gestión” (12 encuestados). El desglose por género revela que la mayoría de los encuestados son hombres (58 encuestados), en comparación con un grupo más pequeño de mujeres (4 encuestados). Además, se observa que la distribución entre los dos barrios, “San Isidro” y “Caacupemi”, es bastante equitativa, con 29 y 33 encuestados, respectivamente.
Por último, se ha registrado la cantidad de hijos en las familias de los encuestados. El número de hijos varía de 0 a 7, con una mayor proporción de encuestados con 0, 1 y 2 hijos.Estas características demográficas proporcionan una comprensión esencial del perfil de los participantes en la investigación, lo que será fundamental al analizar las motivaciones y los niveles de interés en la implementación de sistemas agroforestales en sus fincas.
# Calcular las medianas de las calificaciones en las preguntas e37 a e56
medianas_calificaciones <- apply(datos[, c("e37", "e38", "e39", "e40", "e41", "e42", "e43", "e44", "e45", "e46")], 1, median)
#promedios y medianas de las respuestas de cada encuestado
datos$media_e<- apply(datos[11:20],1,function(v) mean(as.numeric(v),na.rm = T))
datos$median_e<- apply(datos[11:20],1,function(v) median(as.numeric(v),na.rm = T))
hist(datos$median_e)
hist(datos$media_e)
datos$media_f<- apply(datos[21:30],1,function(v) mean(as.numeric(v),na.rm = T))
datos$median_f<- apply(datos[21:30],1,function(v) median(as.numeric(v),na.rm = T))
Dimensión e: Interés de Agricultores en Aplicar el Modelo Agroforestal en su Finca
Los resultados reflejan una actitud generalmente positiva, con una mayoría de respuestas en la categoría “high” (alto nivel de interés y disposición) para la mayoría de los ítems relacionados con el interés en recuperar árboles nativos, el deseo de capacitación, y la disposición a comprar insumos, plantines y equipos. Sin embargo, un ítem destacable es “Estoy dispuesto a comprar insumos,” que recibió principalmente respuestas en la categorías bajas, al igual que la “disposición a comprar equipos”.
Dimensión f: Motivaciones de los Agricultores para Aplicar Modelos Agroforestales en su Finca
Esta dimensión se enfocó en las motivaciones de los agricultores para implementar modelos agroforestales. Los resultados revelan una variedad de motivaciones, a exepción de dos componentes “la importancia de tener un Plan municipal de restauración” y “el cumplimiento de exigencias legales como factores de alta motivación”, que presentaron mayores porcentejes en los niveles bajos de la escala.
##
## De acuerdo Muy de acuerdo
## 32 30
##
## De acuerdo Muy de acuerdo
## 31 31
##
## De acuerdo Muy de acuerdo
## 32 30
##
## De acuerdo Muy de acuerdo
## 31 31
El análisis de confiabilidad (Cronbach’s alpha) revela la consistencia interna de las respuestas a las preguntas (e37 a e46) en el cuestionario. El valor global del Cronbach’s alpha es 0.724, indicando una moderada consistencia interna entre las variables.
Al observar las respuestas de cada ítem individualmente, se notan diferencias en las distribuciones de respuestas. Algunas preguntas, como “e37” y “e44,” muestran una mayor concentración de respuestas en las categorías 4 y 5, lo que sugiere una mayor concordancia entre los encuestados.
En contraste, las preguntas “e41” y “e46” presentan una mayor dispersión de respuestas, incluyendo una cantidad significativa de respuestas en las categorías 1 y 2, indicando una menor consistencia en estas áreas.
En general, aunque el conjunto de preguntas muestra una moderada consistencia interna, estos resultados sugieren la necesidad de prestar atención a las preguntas menos consistentes (e41 y e46) para una posible revisión o mejora.
Es importante considerar que un valor de Cronbach’s alpha superior a 0.7 se considera aceptable en muchos contextos de investigación, pero se deben tener en cuenta las metas y estándares específicos de confiabilidad en tu investigación.
#install.packages("psych")
library("psych")
##
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
# Subset del dataframe con las variables de interés (e37 a e46)
subset_datos <- datos[, c("e37", "e38", "e39", "e40", "e41", "e42", "e43", "e44", "e45", "e46")]
# Calcular el Cronbach's alpha
alpha_result <- alpha(subset_datos)
# Imprimir el resultado
# Obtener la estadística de Cronbach's alpha
cronbach_alpha <- alpha_result$total$raw_alpha
cronbach_alpha
## [1] 0.950748
## Warning in alpha(subset_datos_f): Some items were negatively correlated with the first principal component and probably
## should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Some items ( f54 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
##
## Reliability analysis
## Call: alpha(x = subset_datos_f)
##
## raw_alpha std.alpha G6(smc) average_r S/N ase mean sd median_r
## 0.65 0.69 0.81 0.2 2.2 0.064 3.9 0.39 0.14
##
## 95% confidence boundaries
## lower alpha upper
## Feldt 0.51 0.65 0.77
## Duhachek 0.53 0.65 0.78
##
## Reliability if an item is dropped:
## raw_alpha std.alpha G6(smc) average_r S/N alpha se var.r med.r
## f48 0.65 0.69 0.82 0.22 2.2 0.065 0.072 0.18
## f49 0.57 0.64 0.73 0.18 1.8 0.084 0.068 0.14
## f50 0.62 0.65 0.75 0.19 1.8 0.069 0.054 0.14
## f52 0.62 0.67 0.77 0.20 2.0 0.072 0.067 0.15
## f53 0.61 0.63 0.74 0.17 1.7 0.071 0.048 0.14
## f54 0.68 0.73 0.82 0.25 2.7 0.061 0.048 0.18
## f55 0.61 0.62 0.73 0.17 1.6 0.071 0.045 0.14
## f56 0.62 0.63 0.74 0.17 1.7 0.069 0.048 0.15
## f57 0.65 0.68 0.80 0.21 2.2 0.065 0.071 0.18
##
## Item statistics
## n raw.r std.r r.cor r.drop mean sd
## f48 51 0.37 0.42 0.262 0.207 1.2 0.58
## f49 60 0.69 0.63 0.614 0.536 3.5 0.98
## f50 62 0.46 0.59 0.570 0.365 4.4 0.55
## f52 56 0.53 0.49 0.436 0.376 3.7 0.89
## f53 57 0.58 0.67 0.665 0.434 4.4 0.60
## f54 60 0.23 0.20 0.058 0.077 3.6 0.67
## f55 61 0.54 0.70 0.719 0.464 4.8 0.47
## f56 62 0.48 0.66 0.676 0.420 4.8 0.46
## f57 57 0.56 0.44 0.327 0.281 4.0 0.98
##
## Non missing response frequency for each item
## 1 2 3 4 5 miss
## f48 0.86 0.06 0.08 0.00 0.00 0.18
## f49 0.00 0.18 0.28 0.37 0.17 0.03
## f50 0.00 0.00 0.03 0.56 0.40 0.00
## f52 0.00 0.11 0.25 0.46 0.18 0.10
## f53 0.00 0.00 0.05 0.46 0.49 0.08
## f54 0.00 0.03 0.42 0.48 0.07 0.03
## f55 0.00 0.00 0.02 0.21 0.77 0.02
## f56 0.00 0.00 0.02 0.19 0.79 0.00
## f57 0.04 0.02 0.23 0.39 0.33 0.08
## [1] 0.6538544
## Number of categories should be increased in order to count frequencies.
## Warning in alpha(subset_datos_f, check.keys = TRUE): Some items were negatively correlated with the first principal component and were automatically reversed.
## This is indicated by a negative sign for the variable name.
## [1] 0.6236024
Eliminando las preguntas 49, 54 y 57
## [1] 0.6560327
La mejoría es despreciable, por tanto no amerita eliminar las variables
Las pruebas paramétricas se basan en supuestos sobre la distribución de los datos y sobre el tipo de escala de medición utilizada. Uno de los supuestos clave de las pruebas paramétricas, como la prueba t de Student o el análisis de varianza (ANOVA), es que los datos siguen una distribución normal. Además, requieren que los datos se midan en una escala de medición de intervalo o razón. Las escalas Likert, no cumplen plenamente con estos supuestos, lo que hace que la aplicación de pruebas paramétricas no sea apropiada.
Para la variable de interés con son la dimensión “e” y “f” por las que las pruebas paramétricas no son apropiadas porque: 1. Escala ordinal: Las escalas Likert son escalas ordinales, lo que significa que representan el orden de las categorías de respuesta (p. ej., “totalmente en desacuerdo”, “en desacuerdo”, “neutral”, “de acuerdo”, “totalmente de acuerdo”), pero no se puede asumir que las distancias entre las categorías son iguales. Las pruebas paramétricas requieren una escala de intervalo o razón, donde las diferencias entre los valores tienen significado numérico.
Debido a estas limitaciones, para este estudio se aplican pruebas estadísticas no paramétricas o técnicas de estadística descriptiva para analizar estos datos. Algunas de las pruebas no paramétricas que pueden ser más apropiadas como la prueba de independencia Chi-Cuadrado (toda vez que la respuesta esperada en todas las casillas sea mayor que 5 y el tamaño total sea mayor a 50) o la Prueba exacta de Fisher (para tablas 2x2). Estas pruebas no hacen suposiciones sobre la normalidad de los datos y son más adecuadas para datos de escala ordinal como las escalas Likert. Considerando lo observado en el comportamiento de las respouetas en escala likert, se encuentra convenientel dicotomizar la variable de interés mediante la mediana. Las variables independientes en su mayoría también fuero recategorizados, siendo en su mayoría ddicotomizados.
## [1] "Prueba de independencia chi-cuadrada entre barrio y e0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 1.5798, df = 1, p-value = 0.2088
##
## [1] "Prueba de independencia chi-cuadrada entre edadgrupov y e0:"
##
## Pearson's Chi-squared test
##
## data: tabla_contingencia
## X-squared = 4.2543, df = 2, p-value = 0.1192
##
## [1] "Prueba de independencia chi-cuadrada entre tenenciahijos y e0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 0.5998, df = 1, p-value = 0.4387
##
## [1] "Prueba de independencia chi-cuadrada entre nivelestudios y e0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 3.1084, df = 1, p-value = 0.07789
##
## [1] "Prueba de independencia chi-cuadrada entre niveltenenciatierra y e0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 23.594, df = 1, p-value = 1.19e-06
##
## [1] "Prueba de independencia chi-cuadrada entre tamafincarec y e0:"
##
## Pearson's Chi-squared test
##
## data: tabla_contingencia
## X-squared = 18.344, df = 2, p-value = 0.0001039
##
## [1] "Prueba de independencia chi-cuadrada entre tamabosqueremrec y e0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 1.5771, df = 1, p-value = 0.2092
##
## [1] "Prueba de independencia chi-cuadrada entre tamacultivoyerrec y e0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 7.7225, df = 1, p-value = 0.005454
A continuación, se presenta un resumen de los resultados de las pruebas de independencia chi-cuadrada entre las variables categóricas y la variable “e0,” junto con los valores de estadísticas y p-valor:
Variable | Estadístico Chi-cuadrado (X-squared) | Grados de Libertad (df) | Valor p (p-value) |
---|---|---|---|
Barrio | 1.5798 | 1 | 0.2088 |
Edadgrupov | 4.2543 | 2 | 0.1192 |
Tenenciahijos | 0.5998 | 1 | 0.4387 |
Nivelestudios | 3.1084 | 1 | 0.07789 |
Niveltenenciatierra | 23.594 | 1 | 1.19e-06 |
Tamafincarec | 18.344 | 2 | 0.0001039 |
Tamabosqueremrec | 1.5771 | 1 | 0.2092 |
Tamacultivoyerrec | 7.7225 | 1 | 0.005454 |
Los resultados destacan la relación significativa entre el nivel de tenencia de tierra, el tamaño de la finca y la tenencia de cultivos con el interés de los agricultores en aplicar modelos agroforestales. Estas variables parecen desempeñar un papel importante en la toma de decisiones de los agricultores en cuanto a la adopción de prácticas agroforestales en la región. Por otro lado, variables como el barrio, la edad y la tenencia de hijos no muestran una relación significativa con el interés en dichos modelos. Estos hallazgos son fundamentales para comprender mejor los factores que influyen en la adopción de prácticas agroforestales en la región y pueden orientar estrategias de promoción y políticas agrícolas.
## [1] "Prueba de independencia chi-cuadrada entre barrio y f0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 0.25914, df = 1, p-value = 0.6107
##
## [1] "Prueba de independencia chi-cuadrada entre edadgrupov y f0:"
##
## Pearson's Chi-squared test
##
## data: tabla_contingencia
## X-squared = 2.5485, df = 2, p-value = 0.2796
##
## [1] "Prueba de independencia chi-cuadrada entre tenenciahijos y f0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 0.092262, df = 1, p-value = 0.7613
##
## [1] "Prueba de independencia chi-cuadrada entre nivelestudios y f0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 6.7027, df = 1, p-value = 0.009627
##
## [1] "Prueba de independencia chi-cuadrada entre niveltenenciatierra y f0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 3.4523, df = 1, p-value = 0.06316
##
## [1] "Prueba de independencia chi-cuadrada entre tamafincarec y f0:"
##
## Pearson's Chi-squared test
##
## data: tabla_contingencia
## X-squared = 8.1699, df = 2, p-value = 0.01682
##
## [1] "Prueba de independencia chi-cuadrada entre tamabosqueremrec y f0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 7.2009, df = 1, p-value = 0.007287
##
## [1] "Prueba de independencia chi-cuadrada entre tamacultivoyerrec y f0:"
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_contingencia
## X-squared = 1.7683, df = 1, p-value = 0.1836
Aquí se presenta un resumen de los resultados de las pruebas de independencia chi-cuadrada entre las variables categóricas y la variable “f0,” junto con los valores de estadísticas y p-valor:
Variable | Estadístico Chi-cuadrado (X-squared) | Grados de Libertad (df) | Valor p (p-value) |
---|---|---|---|
Barrio | 0.25914 | 1 | 0.6107 |
Edadgrupov | 2.5485 | 2 | 0.2796 |
Tenenciahijos | 0.092262 | 1 | 0.7613 |
Nivelestudios | 6.7027 | 1 | 0.009627 |
Niveltenenciatierra | 3.4523 | 1 | 0.06316 |
Tamafincarec | 8.1699 | 2 | 0.01682 |
Tamabosqueremrec | 7.2009 | 1 | 0.007287 |
Tamacultivoyerrec | 1.7683 | 1 | 0.1836 |
Estos resultados indican la presencia de asociaciones significativas entre las variables “Nivelestudios”, “Tamafincarec”, “Niveltenenciatierra”, “Tamabosqueremrec” y “Tamacultivoyerrec” con la variable “e0”. En otras palabras, estas variables parecen influir en el interés de los agricultores en aplicar modelos agroforestales en sus fincas. Por otro lado, las variables “Barrio”, “Edadgrupov” y “Tenenciahijos” no muestran asociaciones significativas con el interés en estos modelos agroforestales.
Estos resultados son relevantes para comprender mejor los factores que influyen en la adopción de prácticas agroforestales en la región y pueden ayudar en la formulación de estrategias y políticas de promoción de estas prácticas entre los agricultores.
##
## Call:
## glm(formula = e0 ~ barrio + edadgrupov + tenenciahijos + nivelestudios +
## niveltenenciatierra + tamafincarec + tamabosqueremrec + tamacultivoyerrec,
## family = binomial, data = datos)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.59469 -0.12437 -0.00934 0.38804 1.20358
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -9.7071 4.0678 -2.386 0.0170 *
## barrioCaacupemi -1.8200 1.2105 -1.504 0.1327
## edadgrupov40 a 59 3.6082 2.1343 1.691 0.0909 .
## edadgrupov60 a más 3.5508 2.3214 1.530 0.1261
## tenenciahijosSí tiene hijos 1.0850 1.4594 0.743 0.4572
## nivelestudiosSecundario/niversitario 3.7638 1.5483 2.431 0.0151 *
## niveltenenciatierraCon título 5.0100 2.2422 2.234 0.0255 *
## tamafincarec5 a menos de 10ha 3.3350 1.6033 2.080 0.0375 *
## tamafincarec10ha o más 4.2125 2.0166 2.089 0.0367 *
## tamabosqueremrecSí tiene -1.7006 1.6685 -1.019 0.3081
## tamacultivoyerrec5 o más ha 0.4541 1.8470 0.246 0.8058
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 85.886 on 61 degrees of freedom
## Residual deviance: 27.744 on 51 degrees of freedom
## AIC: 49.744
##
## Number of Fisher Scoring iterations: 7
## Variables
## (Intercept) (Intercept)
## barrioCaacupemi barrioCaacupemi
## edadgrupov40 a 59 edadgrupov40 a 59
## edadgrupov60 a más edadgrupov60 a más
## tenenciahijosSí tiene hijos tenenciahijosSí tiene hijos
## nivelestudiosSecundario/niversitario nivelestudiosSecundario/niversitario
## niveltenenciatierraCon título niveltenenciatierraCon título
## tamafincarec5 a menos de 10ha tamafincarec5 a menos de 10ha
## tamafincarec10ha o más tamafincarec10ha o más
## tamabosqueremrecSí tiene tamabosqueremrecSí tiene
## tamacultivoyerrec5 o más ha tamacultivoyerrec5 o más ha
## Coeficientes Odds_Ratios
## (Intercept) -9.7070643 6.085210e-05
## barrioCaacupemi -1.8200222 1.620222e-01
## edadgrupov40 a 59 3.6082351 3.690087e+01
## edadgrupov60 a más 3.5507538 3.483957e+01
## tenenciahijosSí tiene hijos 1.0849912 2.959414e+00
## nivelestudiosSecundario/niversitario 3.7637734 4.311079e+01
## niveltenenciatierraCon título 5.0099556 1.498981e+02
## tamafincarec5 a menos de 10ha 3.3349531 2.807707e+01
## tamafincarec10ha o más 4.2124543 6.752206e+01
## tamabosqueremrecSí tiene -1.7005953 1.825748e-01
## tamacultivoyerrec5 o más ha 0.4540542 1.574683e+00
Interpretación de los resultados:
(Intercept): El intercepto representa el logaritmo de la razón de probabilidades base cuando todas las demás variables predictoras son iguales a cero. En este caso, el valor del intercepto es -9.7071 y es estadísticamente significativo (p = 0.0170). Esto significa que cuando todas las demás variables son cero, la probabilidad logarítmica de que “e0” sea igual a 1 en lugar de 0 es negativa y significativa.
barrio: Caacupemi: Este coeficiente tiene un valor de -1.8200, pero no es estadísticamente significativo (p = 0.1327). Esto sugiere que la variable “barrioCaacupemi” no tiene un impacto significativo en la probabilidad logarítmica de “e0.”
edadgrupov: 40 a 59: Con un coeficiente de 3.6082 y un valor p de 0.0909, esta variable “edadgrupov40 a 59” parece tener un efecto positivo en la probabilidad logarítmica de “e0.” Aunque no es estadísticamente significativo a un nivel de significación convencional (p < 0.05), podría considerarse como una tendencia.
edadgrupov: 60 a más: Similar a la variable anterior, “edadgrupov60 a más” tiene un coeficiente positivo de 3.5508, pero no es estadísticamente significativo (p = 0.1261).
tenenciahijos: Sí tiene hijos: Con un coeficiente de 1.0850 y un valor p alto de 0.4572, la variable “tenenciahijosSí tiene hijos” no parece tener un impacto significativo en la probabilidad logarítmica de “e0.”
nivelestudios: Secundario/niversitario: Con un coeficiente de 3.7638 y un valor p de 0.0151, esta variable tiene un efecto positivo y es estadísticamente significativa. Esto sugiere que las personas con niveles de estudios secundarios o universitarios tienen una probabilidad logarítmica más alta de responder “De acuerdo” o “Totalmente de acuerdo” en “e0” en comparación con otros niveles de educación.
niveltenenciatierra: Con título: Esta variable tiene un coeficiente positivo de 5.0100 y un valor p de 0.0255, lo que indica que aquellos que tienen título de tenencia de tierra tienen una probabilidad logarítmica significativamente más alta de responder “De acuerdo” o “Totalmente de acuerdo” en “e0.”
tamafincarec: 5 a menos de 10ha: Con un coeficiente de 3.3350 y un valor p de 0.0375, esta variable sugiere que las personas con un tamaño de finca de 5 a menos de 10 hectáreas tienen una probabilidad logarítmica más alta de preferir “De acuerdo” o “Totalmente de acuerdo” en “e0.”
tamafincarec: 10ha o más: Similar a la variable anterior, “tamafincarec10ha o más” tiene un coeficiente positivo de 4.2125 y es estadísticamente significativa (p = 0.0367).
tamabosqueremrec: Sí tiene: Esta variable no es estadísticamente significativa (p = 0.3081). El coeficiente es -1.7006, pero no se puede concluir que tenga un impacto significativo en la probabilidad logarítmica de “e0.”
tamacultivoyerrec: 5 o más ha: Con un coeficiente de 0.4541 y un valor p alto de 0.8058, la variable “tamacultivoyerrec5 o más ha” no parece tener un impacto significativo en “e0.”
Las variables que tienen coeficientes estadísticamente significativos (con valores p < 0.05) son “nivelestudiosSecundario/niversitario,” “niveltenenciatierraCon título,” “tamafincarec5 a menos de 10ha,” y “tamafincarec10ha o más.” Estas variables parecen influir en la preferencia “De acuerdo” o “Totalmente de acuerdo” en “e0.” Las demás variables no tienen un impacto estadísticamente significativo.
##
## Call:
## glm(formula = f0 ~ barrio + edadgrupov + tenenciahijos + nivelestudios +
## niveltenenciatierra + tamafincarec + tamabosqueremrec + tamacultivoyerrec,
## family = binomial, data = datos)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.03552 -0.81058 -0.03673 0.65137 2.14935
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.1964 1.3747 -1.598 0.1101
## barrioCaacupemi -0.5599 0.6941 -0.807 0.4199
## edadgrupov40 a 59 0.9948 0.9835 1.012 0.3118
## edadgrupov60 a más -0.8260 1.2096 -0.683 0.4947
## tenenciahijosSí tiene hijos -0.2280 0.9277 -0.246 0.8058
## nivelestudiosSecundario/niversitario 1.8671 0.8611 2.168 0.0301 *
## niveltenenciatierraCon título 1.0451 0.8450 1.237 0.2161
## tamafincarec5 a menos de 10ha 1.4493 1.0750 1.348 0.1776
## tamafincarec10ha o más 2.3835 1.4497 1.644 0.1001
## tamabosqueremrecSí tiene 1.5069 0.8879 1.697 0.0897 .
## tamacultivoyerrec5 o más ha -1.5579 1.3225 -1.178 0.2388
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 85.950 on 61 degrees of freedom
## Residual deviance: 57.127 on 51 degrees of freedom
## AIC: 79.127
##
## Number of Fisher Scoring iterations: 5
## Variables
## (Intercept) (Intercept)
## barrioCaacupemi barrioCaacupemi
## edadgrupov40 a 59 edadgrupov40 a 59
## edadgrupov60 a más edadgrupov60 a más
## tenenciahijosSí tiene hijos tenenciahijosSí tiene hijos
## nivelestudiosSecundario/niversitario nivelestudiosSecundario/niversitario
## niveltenenciatierraCon título niveltenenciatierraCon título
## tamafincarec5 a menos de 10ha tamafincarec5 a menos de 10ha
## tamafincarec10ha o más tamafincarec10ha o más
## tamabosqueremrecSí tiene tamabosqueremrecSí tiene
## tamacultivoyerrec5 o más ha tamacultivoyerrec5 o más ha
## Coeficientes Odds_Ratios
## (Intercept) -2.1963764 0.1112054
## barrioCaacupemi -0.5598967 0.5712681
## edadgrupov40 a 59 0.9947775 2.7041227
## edadgrupov60 a más -0.8260176 0.4377893
## tenenciahijosSí tiene hijos -0.2280220 0.7961067
## nivelestudiosSecundario/niversitario 1.8670508 6.4691892
## niveltenenciatierraCon título 1.0451129 2.8437196
## tamafincarec5 a menos de 10ha 1.4492508 4.2599220
## tamafincarec10ha o más 2.3835139 10.8429371
## tamabosqueremrecSí tiene 1.5069387 4.5128942
## tamacultivoyerrec5 o más ha -1.5579052 0.2105767
Dado el contexto de que la variable de respuesta se refiere a la preferencia clasificada en dos categorías, “De acuerdo” y “Totalmente de acuerdo,” y teniendo en cuenta que los resultados tienen un fuerte sesgo hacia los valores más altos de la escala Likert. En este escenario, el modelo se utiliza para predecir la probabilidad de que un individuo esté en la categoría “Totalmente de acuerdo” en lugar de “De acuerdo” en función de las variables predictoras. Dado que los valores de “Totalmente de acuerdo” son considerados como una respuesta más positiva o intensa, el modelo busca entender qué factores influyen en que las personas estén más inclinadas hacia esta categoría.
Las estimaciones de coeficientes en el modelo indican cómo cada variable predictora afecta la probabilidad logarítmica de que alguien esté “Totalmente de acuerdo” en lugar de simplemente “De acuerdo.” Algunas observaciones clave podrían ser:
El coeficiente para las variables predictoras positivas (aquellos con coeficientes positivos) puede interpretarse como un aumento en la probabilidad de que las personas estén “Totalmente de acuerdo” en lugar de solo “De acuerdo” a medida que aumenta el valor de la variable predictora correspondiente.
El coeficiente para las variables predictoras negativas (aquellos con coeficientes negativos) puede interpretarse como una disminución en la probabilidad de que las personas estén “Totalmente de acuerdo” en lugar de solo “De acuerdo” a medida que aumenta el valor de la variable predictora correspondiente.
Los valores p (Pr(>|z|)) pueden proporcionar información sobre la significancia estadística de cada variable predictora. Aquellas con valores p bajos son más influyentes en la preferencia “Totalmente de acuerdo.”
Dado el sesgo hacia respuestas positivas, las variables predictoras pueden estar relacionadas con lo que hace que alguien esté mucho más inclinado a estar “Totalmente de acuerdo” en lugar de simplemente “De acuerdo” en un contexto en el que la mayoría de las respuestas tienden a ser positivas. Las variables predictoras con coeficientes estadísticamente significativos (valores p < 0.05) podrían considerarse factores importantes para explicar esta tendencia hacia respuestas más positivas.
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:psych':
##
## logit
## The following object is masked from 'package:likert':
##
## recode
## GVIF Df GVIF^(1/(2*Df))
## barrio 1.403038 1 1.184499
## edadgrupov 2.967637 2 1.312510
## tenenciahijos 1.396166 1 1.181595
## nivelestudios 2.131417 1 1.459937
## niveltenenciatierra 1.302657 1 1.141340
## tamafincarec 3.477826 2 1.365611
## tamabosqueremrec 2.652542 1 1.628663
## tamacultivoyerrec 2.034731 1 1.426440
Los resultaod del indicador VIF (factores de inflación de la
varianza) para cada variable independiente en el modelo de regresión
logística para la variable e0
. Estos valores indican la
presencia de multicolinealidad entre las variables independientes. Los
VIF ayudan a evaluar cuánto influye la multicolinealidad en las
estimaciones de los coeficientes del modelo. Cuanto mayor sea el VIF,
mayor será la multicolinealidad.
Un valor de VIF cercano a 1 indica que no hay multicolinealidad significativa para esa variable. En tu caso, hay algunas variables con VIFs mayores que 1, lo que sugiere la presencia de multicolinealidad moderada en el modelo.
Las variables edadgrupov
,
nivelestudios
, tamafincarec
,
tamabosqueremrec
y tamacultivoyerrec
tienen
VIFs significativamente mayores que 1, lo que indica que podrían estar
altamente correlacionadas con otras variables independientes en el
modelo.
Las variables barrio
, tenenciahijos
y
niveltenenciatierra
tienen VIFs cercanos a 1, lo que
sugiere que no tienen problemas de multicolinealidad significativa con
otras variables independientes.
Dado que algunos VIFs son altos, es importante investigar más a fondo las relaciones entre las variables independientes para comprender la multicolinealidad. Puedes considerar la posibilidad de eliminar algunas variables o realizar transformaciones si es necesario para abordar este problema. Además, la multicolinealidad puede afectar la interpretación de los coeficientes en el modelo, por lo que debes ser cauteloso al analizar los resultados del modelo.
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## studentized Breusch-Pagan test
##
## data: modelo
## BP = 12.578, df = 10, p-value = 0.2482
##
## Breusch-Pagan test
##
## data: modelo
## BP = 16.39, df = 10, p-value = 0.089
Este estudio se enfoca en comprender a fondo los factores que influyen en el interés y las motivaciones de los agricultores para implementar modelos agroforestales en sus fincas en una región específica. Para capturar estas dimensiones, se incorporaron preguntas en un cuestionario con respuestas en una escala Likert que abarcaba desde “Totalmente en desacuerdo” hasta “Totalmente de acuerdo” (valores del 1 al 5). Sin embargo, para evaluar las hipótesis planteadas, las respuestas a ambas dimensiones se resumieron en dos medidas dicotomizadas. Esto implicó dividir a los encuestados en dos grupos: aquellos que obtuvieron valores iguales o inferiores a la mediana de las medias se clasificaron como “De acuerdo”, mientras que aquellos con valores superiores se consideraron “Totalmente de acuerdo”. Esta dicotomización se aplicó debido a un sesgo observado hacia respuestas más bajas (1, 2 y 3), lo que creaba un desbalance en los datos y dificultaba la aplicación de métodos estadísticos de verificación de hipótesis. La interpretación de resultados no se vio afectada por esta dicotomización.
En el análisis del interés de los agricultores (variable “e0”), se encontró que factores como niveles más altos de educación, la propiedad de tierras de mayor extensión y la tenencia de títulos de propiedad se asociaron positivamente con un mayor interés en la aplicación de modelos agroforestales. Además, las personas en los grupos de edad de 40 a 59 años y mayores de 60 años mostraron un mayor interés en estas prácticas. Esto sugiere que la educación y la seguridad de la tenencia de la tierra desempeñan un papel crucial en la toma de decisiones de los agricultores.
En el caso de las motivaciones (variable “f0”), se observó una tendencia similar. Los agricultores de mayor edad, con niveles educativos más altos y fincas de mayor extensión presentaron una mayor motivación para adoptar modelos agroforestales. Sin embargo, en este contexto, la ubicación geográfica (barrio de residencia) no pareció influir significativamente en las motivaciones de los agricultores.
Es destacable que aspectos como la conservación de la tierra, el cultivo sostenible de árboles y el impacto positivo en la comunidad influyeron en las actitudes y motivaciones de los agricultores en la región. Estos resultados brindan valiosas perspectivas que pueden respaldar estrategias y políticas para promover la adopción de prácticas agroforestales, particularmente entre agricultores más jóvenes y aquellos con menor nivel educativo.
A pesar de la relevancia de estos hallazgos, se identificó una falta de homocedasticidad en los errores del modelo, lo que sugiere una variabilidad desigual en los datos. Esto debe tenerse en cuenta al interpretar los resultados y al diseñar futuros análisis. En general, este estudio proporciona una comprensión profunda de cómo los factores demográficos, educativos y de tenencia de tierras pueden influir en el interés y las motivaciones de los agricultores para adoptar modelos agroforestales, con el potencial de respaldar prácticas más sostenibles y beneficiosas tanto para los agricultores como para el medio ambiente en esta región específica.
Aunque es posible aplicar un modelo de regresión logística a una variable dicotomizada a partir de una escala Likert, es importante reconocer las limitaciones y considerar si es la mejor aproximación para el análisis. Otras técnicas, como el análisis de regresión ordinal o modelos de respuesta nominal, pueden ser más apropiadas para manejar variables Likert de manera más directa y capturar la estructura ordinal de los datos en futuras ediciones de estudios similares a la presentada.
# cargar la base
library(readr)
#datos=read.csv("G:/Mi unidad/LICKER_ANALISIS/datossociodem_r.csv",sep=";",dec=",")
datos=read.csv("G:/Mi unidad/AGROFORESTERIA/datossociodem_r.csv",sep=";",dec=",")
head(datos)
names(datos)
str(datos)
# explorar cada variable
# Barrio
table(datos$barrio)
datos$barrio<-factor(datos$barrio, levels=c(1,2),labels=c("San Isidro","Caacupemi"))
table(datos$barrio)
#help(as.factor)
# Sexo
table(datos$sexo)
datos$sexo<-factor(datos$sexo, levels=c(0,1),labels=c("Mujeres","Hombres"))
table(datos$sexo)
#help(as.factor)
# edad
table(datos$edad)
summary(datos$edad)
hist(datos$edad)
#recodificar edad, en categorias
datos$edadgrupo=floor(datos$edad/5)
table(datos$edadgrupo)
View(datos)
#reemplazar los valores iguales o superiores a 16 por 16
#help(mutate)
datos$edadgrupo[datos$edadgrupo >= 16] <- 16
datos$edadgrupo<-factor(datos$edadgrupo, levels=c(0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15),
labels=c("0 a 4","5 a 9", "10 a 14", "15 a 19","20 a 24","25 a 29","30 a 34","35 a 39","40 a 44","45 a 49","50 a 54","55 a 59","60 a 64","65 a 69","70 a 74","75 y más"))
table(datos$edadgrupo)
datos$edadgrupod=floor(datos$edad/10)
table(datos$edadgrupod)
#reemplazar los valores iguales o superiores a 8 por 8
datos$edadgrupod[datos$edadgrupod >=8 ] <- 8
datos$edadgrupod<-factor(datos$edadgrupod, levels=c(0,1,2,3,4,5,6,7,8),
labels=c("0 a 9","10 a 19", "20 a 29", "30 a 39","40 a 49","50 a 59","60 a 69","70 a 79","80 a más"))
table(datos$edadgrupod)
datos$edadgrupov=floor(datos$edad/20)
table(datos$edadgrupov)
#reemplazar los valores iguales o superiores a 8 por 8
datos$edadgrupov[datos$edadgrupov>=3 ] <- 3
datos$edadgrupov<-factor(datos$edadgrupov, levels=c(1,2,3),
labels=c("20 a 39", "40 a 59", "60 a más"))
table(datos$edadgrupov)
# nrohijos
table(datos$nrohijos)
datos$tenenciahijos=datos$nrohijos
datos$tenenciahijos[datos$tenenciahijos>= 1] <- 1
datos$tenenciahijos<-factor(datos$tenenciahijos, levels=c(0,1),labels=c("No tiene hijos","Sí tiene hijos"))
table(datos$tenenciahijos)
#nivelestudios
table(datos$nivelestudios)
datos$nivelestudios<-factor(datos$nivelestudios, levels=c(1,2,3),labels=c("Primario","Secundario", "Universitario"))
table(datos$nivelestudios)
#niveltenenciatierra
table(datos$niveltenenciatierra)
#se reagrupa debido a la baja frecuencia observada en las categoria inicial
datos$niveltenenciatierra[datos$niveltenenciatierra<=1]<-2
table(datos$niveltenenciatierra)
datos$niveltenenciatierra[datos$niveltenenciatierra>=3]<-3
table(datos$niveltenenciatierra)
datos$niveltenenciatierra<-factor(datos$niveltenenciatierra, levels=c(2,3),labels=c("Alquilado/derechera","Con título"))
table(datos$niveltenenciatierra)
#tamafinca
table(datos$tamafinca)
hist(datos$tamafinca)
datos$tamafincarec=datos$tamafinca
datos$tamafincarec[datos$tamafincarec<5]<-1
datos$tamafincarec[datos$tamafincarec>=5 & datos$tamafincarec<10]<-2
datos$tamafincarec[datos$tamafincarec>=10]<-3
datos$tamafincarec<-factor(datos$tamafincarec, levels=c(1,2,3),labels=c("Menos de 5ha","5 a menos de 10ha", "10ha o más"))
table(datos$tamafincarec)
#tamabosquerem
table(datos$tamabosquerem)
hist(datos$tamabosquerem)
datos$tamabosqueremrec=datos$tamabosquerem
datos$tamabosqueremrec[datos$tamabosqueremrec>0]<-1
datos$tamabosqueremrec<-factor(datos$tamabosqueremrec, levels=c(0,1),labels=c("No tiene","Sí tiene"))
table(datos$tamabosqueremrec)
names(datos$tamabosqueremrec) <- "Posee bosque remanente"
table(datos$tamabosqueremrec)
#tamacultivoyer
table(datos$tamacultivoyer)
hist(datos$tamacultivoyer)
datos$tamacultivoyerrec=datos$tamacultivoyer
datos$tamacultivoyerrec[datos$tamacultivoyerrec<5]<-1
datos$tamacultivoyerrec[datos$tamacultivoyerrec>=5]<-2
datos$tamacultivoyerrec<-factor(datos$tamacultivoyerrec, levels=c(1,2),labels=c("Menos de 5ha","5 o más ha"))
table(datos$tamacultivoyerrec)
names(datos$tamacultivoyerrec) <- "Cantidad de cultivo de yerba mate"
names(datos)
#e39
datos$re39=datos$e39
datos$re39<-factor(datos$re39, levels=c(1,2,3,4,5),labels=c("Totalmente en desacuerdo","En desacuerdo","Neutral","De acuerdo","Totalmente de acuerdo"))
table(datos$re39)
#Lista de nomrbes de las variables
variables=c("e40","e41","e42","e43","e44","e45","e46")
#bucle para repetir el comando para todas las e#
for (variables in variables){
datos[[paste0("r",variables)]]<-datos[[variables]]
datos[[paste0("r",variables)]]<-factor(datos[[paste0("r",variables)]],
levels=c(1,2,3,4,5),
labels=c("Totalmente en desacuerdo","En desacuerdo","Neutral","De acuerdo","Totalmente de acuerdo"))
table([[paste0("r",variables)]])
}
# Lista de nombres de las variables
variables <- c("f48", "f49", "f50", "f52", "f53", "f54", "f55", "f56", "f57", "f58")
# Bucle para repetir el comando para todas las variables
for (variable in variables) {
datos[[paste0("r", variable)]] <- datos[[variable]]
datos[[paste0("r", variable)]] <- factor(datos[[paste0("r", variable)]],
levels = c(1, 2, 3, 4, 5),
labels = c("Totalmente en desacuerdo", "En desacuerdo", "Neutral", "De acuerdo", "Totalmente de acuerdo")
)
# Verificar la tabla de frecuencias
print(table(datos[paste0("r", variable)]))
}
#Tabla y gráficos de resumen
table(datos$rf48)
#View(datos)
#Estadísticas descriptivas
table(datos$sexo)
table(datos$barrio)
summary(datos$edad)
summary(datos$nrohijos)
summary(datos$nivelestudios)
summary(datos$niveltenenciatierra)
summary(datos$tamafinca)
summary(datos$tamabosquerem)
summary(datos$tamacultivoyer)
table(datos$edadgrupo)
table(datos$tenenciahijos)
table(datos$tamafincarec)
table(datos$tamabosqueremrec)
table(datos$tamacultivoyerrec)
#tabla de frecuencias observadas en las calificacione para cada pregunta e37 al e46
#install.packages("likert")
library("ggplot2")
library("xtable")
library("likert")
# Crear un conjunto de datos con los valores de 1 al 5
datae <- datos[, c("e37", "e38", "e39", "e40", "e41", "e42", "e43", "e44", "e45", "e46")]
datae <- data.frame(lapply(data, factor, levels = 1:5))
# Definir etiquetas personalizadas para cada variable
labels <- c(
"e37: Es aplicable en mi finca",
"e38: Me gustaría aplicar en la parcela de Ilex",
"e39: Estoy dispuesto a comprar plantines",
"e40: Estoy dispuesto a comprar insumos",
"e41: Estoy interesado en capacitarme en el tema",
"e42: Estoy dispuesto a comprar equipos",
"e43: Me interesa conocer sus bondades",
"e44: Estoy interesado en recuperar árboles nativos",
"e45: Me interesa para mostrar a los vecinos",
"e46: Puedo destinar un área de mi finca para ello"
)
# Asignar etiquetas personalizadas a las columnas
colnames(datae ) <- labels
# Crear un objeto Likert
likert_data <- likert(datae)
# Generar el gráfico Likert
plot(likert_data, ordered = FALSE, wrap = 62)
plot(likert_data, type="density", ordered = FALSE, wrap = 62)
# Lista de variables de f48 a f58
dataf<- datos[, c("f48", "f49", "f50", "f52", "f53", "f54", "f55", "f56", "f57", "f58")]
dataf<- data.frame(lapply(dataf, factor, levels = 1:5))
# Etiquetas correspondientes a las variables
labelsf <- c(
"f48: Existencia de un Plan municipal de restauración",
"f49: Cumplir exigencia legal",
"f50: Reponer especies de árboles en parcelas",
"f52: Recuperar animales silvestres",
"f53: Mejorar la calidad del suelo",
"f54: Enfrentar las sequías extremas",
"f55: Apoyar la educación ambiental",
"f56: Brindar trabajo para jóvenes locales",
"f57: Prover de leña a la casa",
"f58: Contar con sombra en la chacra para el descanso"
)
# Asignar etiquetas personalizadas a las columnas
colnames(dataf) <- labelsf
# Crear un objeto Likert
likert_dataf <- likert(dataf)
# Generar el gráfico Likert
plot(likert_dataf, ordered = FALSE, wrap = 62)
plot(likert_dataf, type="density", ordered = FALSE, wrap = 62)
# Calcular las medianas de las calificaciones en las preguntas e37 a e56
medianas_calificaciones <- apply(datos[, c("e37", "e38", "e39", "e40", "e41", "e42", "e43", "e44", "e45", "e46")], 1, median)
#promedios y medianas de las respuestas de cada encuestado
datos$media_e<- apply(datos[11:20],1,function(v) mean(as.numeric(v),na.rm = T))
datos$median_e<- apply(datos[11:20],1,function(v) median(as.numeric(v),na.rm = T))
hist(datos$median_e)
hist(datos$media_e)
datos$media_f<- apply(datos[21:30],1,function(v) mean(as.numeric(v),na.rm = T))
datos$median_f<- apply(datos[21:30],1,function(v) median(as.numeric(v),na.rm = T))
hist(datos$median_f)
hist(datos$media_f)
plot(table(datos$median_f))
boxplot(datos$media_f)
boxplot(datos$media_e)
# calculo de la Y dicotomica basada en la respuesta mediana de los promedios
datos$e0<-datos$media_e
datos$emedianref <- median(datos$media_e)
datos$e0[datos$e0 <= datos$emedianref]<-0
datos$e0[datos$e0 > datos$emedianref]<-1
datos$e0<-factor(datos$e0, levels=c(0,1),labels=c("De acuerdo","Muy de acuerdo"))
table(datos$e0)
datos$f0<-datos$media_f
datos$fmedianref <- median(datos$media_f)
hist(datos$media_f)
hist(datos$median_f)
datos$f0[datos$f0<= datos$fmedianref]<-0
datos$f0[datos$f0> datos$fmedianref]<-1
datos$f0<-factor(datos$f0, levels=c(0,1),labels=c("De acuerdo","Muy de acuerdo"))
table(datos$f0)
# Pruebas de independencia chi-cuadrada
# Tablas de contingencia y pruebas de independencia chi-cuadrada
variables_categoricas <- c("barrio", "edadgrupov", "tenenciahijos", "nivelestudios", "niveltenenciatierra",
"tamafincarec", "tamabosqueremrec", "tamacultivoyerrec")
# Función para realizar pruebas de independencia chi-cuadrada y mostrar resultados
chi_square_independence_test <- function(variable, response) {
tabla_contingencia <- table(variable, response)
resultado_chi2 <- chisq.test(tabla_contingencia)
return(resultado_chi2)
}
# Realizar pruebas de independencia chi-cuadrada para cada variable categórica vs e0
for (variable in variables_categoricas) {
resultado_chi2 <- chi_square_independence_test(datos[[variable]], datos$e0)
print(paste("Prueba de independencia chi-cuadrada entre", variable, "y e0:"))
print(resultado_chi2)
}
# Realizar pruebas de independencia chi-cuadrada para cada variable categórica vs f0
for (variable in variables_categoricas) {
resultado_chi2 <- chi_square_independence_test(datos[[variable]], datos$f0)
print(paste("Prueba de independencia chi-cuadrada entre", variable, "y f0:"))
print(resultado_chi2)
}
# Ajustar un modelo de regresión logística para la variable e0
modelo_e0 <- glm(e0 ~ barrio + edadgrupov + tenenciahijos + nivelestudios + niveltenenciatierra + tamafincarec + tamabosqueremrec + tamacultivoyerrec, data = datos, family = binomial)
# Resumen del modelo
summary(modelo_e0)
# Predicciones en el conjunto de datos
predicciones_e0 <- predict(modelo_e0, type = "response")
# Crear una nueva variable en el conjunto de datos con las probabilidades predichas
datos$probabilidad_e0 <- predicciones_e0
# Puedes establecer un umbral para la clasificación (por ejemplo, 0.5) y crear una variable de respuesta predicha
datos$e0_predicha <- ifelse(datos$probabilidad_e0 >= 0.5, 1, 0)
# Comparar las predicciones con los valores reales
table(datos$e0, datos$e0_predicha)
# Calcular la tasa de precisión
accuracy_e0 <- sum(datos$e0 == datos$e0_predicha) / nrow(datos)
cat("Tasa de precisión para e0:", accuracy_e0, "\n")
# Calcular los coeficientes del modelo
coeficientes <- coef(modelo_e0)
# Calcular los odds ratios
odds_ratios <- exp(coeficientes)
# Mostrar los odds ratios
print(odds_ratios)
# Crear una tabla de resultados
resultados <- data.frame(Variables = names(coeficientes), Coeficientes = coeficientes, Odds_Ratios = odds_ratios)
# Imprimir la tabla de resultados
print(resultados)
# Ajustar el modelo de regresión logística para f0
modelo_f0 <- glm(f0 ~ barrio + edadgrupov + tenenciahijos + nivelestudios +
niveltenenciatierra + tamafincarec + tamabosqueremrec + tamacultivoyerrec,
family = binomial, data = datos)
# Resumen del modelo
summary(modelo_f0)
# Calcular los coeficientes del modelo
coeficientes_f0 <- coef(modelo_f0)
# Calcular los odds ratios
odds_ratios_f0 <- exp(coeficientes_f0)
# Crear una tabla de resultados para f0
resultados_f0 <- data.frame(Variables = names(coeficientes_f0), Coeficientes = coeficientes_f0, Odds_Ratios = odds_ratios_f0)
# Imprimir la tabla de resultados para f0
print(resultados_f0)
# Instalar y cargar el paquete 'car' si aún no está instalado
install.packages("car")
library(car)
# Asumiendo que tienes un modelo llamado 'modelo_e0' para e0
vif_e0 <- vif(modelo_e0)
# Muestra los VIF para e0
print(vif_e0)
Verificación de supuestos
# Cargar las bibliotecas necesarias
library(ggplot2)
library(broom)
# Ajustar el modelo de regresión logística
modelo <- glm(e0 ~ barrio + edadgrupov + tenenciahijos + nivelestudios + niveltenenciatierra + tamafincarec + tamabosqueremrec + tamacultivoyerrec, family = binomial, data = datos)
# Obtener los residuos del modelo
residuos <- residuals(modelo, type = "pearson")
# Crear un gráfico de residuos estandarizados vs. valores ajustados
ggplot(data.frame(residuos, fitted(modelo)), aes(fitted(modelo), residuos)) +
geom_point() +
geom_hline(yintercept = 0, linetype = "dashed", color = "red") +
labs(x = "Valores Ajustados", y = "Residuos Estandarizados") +
ggtitle("Gráfico de Residuos Estandarizados vs. Valores Ajustados")
# Prueba de homocedasticidad Breusch-Pagan
library(lmtest)
bptest(modelo)
# Prueba de heterocedasticidad White
bptest(modelo, studentize = FALSE)