Logo FCA Logo UNCA

Cátedra de Biometría y Técnica Experimental

_______________________________________________________________________________________________________

T. P. N° 10: Correlación y Regresión Lineal Simple


Autores: Prof. Adj. Ing. Agr. Esp. Sebastian Bustos
         JTP Ing. Agr. Arnaldo Romero

Contacto: estadistica@agrarias.unca.edu.ar


Motivación

El estudio de la Correlación y Regresión Lineal Simple permite analizar y modelar datos agronómicos con el fin de optimizar procesos y tomar decisiones. Estos métodos estadísticos ayudan a identificar y cuantificar relaciones entre dos variables, permitiendo ademas predecir resultados futuros.

Actividad

Ejercicio 1. Se ha estudiado la relación existente entre la altitud (msnm) y el número de especies de aves presentes en un departamento de la Provincia de Catamarca. Los resultados obtenidos fueron:


Altitud (msnm) 310 650 789 892 1102 1540 2550 3500
Número de especies 32 21 20 11 10 6 3 1

Responder:

  1. Efectuar un diagrama de dispersión. Indicar las características más sobresalientes del mismo.

  2. ¿Está asociada la altitud con la cantidad de especies presentes en un área determinada?


Ejercicio 2. Considere un estudio realizado en un bosque abierto de la región del Chaco Árido, en la zona este de la Provincia de Catamarca, donde se midió el diámetro a nivel del pecho (DAP) y la altura de las plantas (metros). Los datos fueron los siguientes:


DAP (cm) 15.6 14.8 15.5 12.5 14.2 15.7 12.3 14.2 8.8 11.9
Altura (m) 17.4 18.4 16.5 15.2 19.9 22.2 14.8 17.3 10.3 14.6

Responder:

  1. Represente la información obtenida mediante un gráfico y realice el análisis del mismo.

  2. ¿Está asociado el DAP con la altura de las plantas?


Ejecicio 3. En el marco de una investigación sobre la fertilidad del suelo, se realizó un experimento para evaluar los efectos de la aplicación de compost de olivo sobre las propiedades químicas del suelo (contenido de Nitrógeno). Para ello, dentro de un campo experimental fueron seleccionadas 12 parcelas de 400 metros cuadrados de suelo y se le aplicaron, aleatoriamente, distintas dosis de compost (0, 6 12 y 18 ton/ha). Al cabo de un año, en cada parcela se midió el contenido de Nitrógeno inorgánico (kilogramos de Nitrógeno/ha) en los primeros 20 cm del suelo. Los datos generados se presentan en el siguiente cuadro:


Parcela
1 2 3 4 5 6 7 8 9 10 11 12
Compost (t/ha) 0 0 0 6 6 6 12 12 12 18 18 18
N inorg. (k/ha) 173 166 155 164 188 177 170 185 198 200 192 206

Responder:

  1. Indique el tipo de investigación realizada.

  2. Identificar la variable de respuesta e independiente.

  3. Elabora un diagrama de dispersión y describir la relación estadística entre las variables.

  4. ¿Las variables del estudio se encuentran correlacionadas? Interprete.

  5. Formule el modelo de regresión lineal ajustada e intérprete en términos agronómicos los estimadores de los parámetros (a y b).

  6. Realice la prueba de hipótesis adecuada para la investigación e interprete.

  7. Según la ecuación propuesta en e), ¿cuál es el contenido de Nitrógeno esperado si se decide aplicar 15 t/ha de compost?

  8. ¿Se cumplen los supuestos?

  9. Calcular e interpretar el coeficiente de determinación.


Ejercicio 4. Para estudiar el efecto de la temperatura sobre el vigor de la germinación, se dispusieron semillas de alfalfa en germinadores y se colocaron en cámaras a distintas temperaturas (10, 15,20 y 25 °C), midiéndose la longitud de las plántulas (expresada en mm) a los 6 días. Los datos obtenidos fueron:


Temperatura °C mm
10 13 16 15 12 11 17
15 20 21 15 17 20 19
20 22 27 30 21 21 26
25 28 20 23 29 25 28

Responder:

  1. Efectúe el diagrama de dispersión y describa ¿Es razonable proponer un ajuste lineal?

  2. Escriba el modelo que se supone relaciona las vos variables consideradas.

  3. Especifique los supuestos

  4. Estime los parámetros del modelo ¿Qué indica “a” y “b”?

  5. ¿Se verifican los supuestos?

  6. ¿La temperatura explica parte de la variación de la longitud de las plantas?

  7. Una medida muestral de la capacidad predictora del modelo es R2 ¿Qué valor asume? ¿Cómo lo interpreta?

  8. ¿Cuál es la longitud promedio esperada para una temperatura de 22 °C?


Ejercicio 5. En colaboración con los integrantes de sus respectivos equipos de trabajo conformados para realizar el Proyecto Integrador N° 2, analizar las variables “Peso del fruto” y “Diámetro” para cada variedad, obtenida por su grupo en el muestreo de campo, respondiendo las siguientes consignas:


  1. Represente los datos adecuadamente en un gráfico de dispersión e interprete.

  2. Calcular el Coeficiente de Correlación de Pearson ¿Qué diferencias encuentra entre las variedades?¿ Es significativo el coeficiente encontrado?

  3. Indique cual es la variable dependiente y cuál es la variable independiente.

  4. Escriba el modelo que se supone relaciona las variables consideradas.

  5. Especifique los supuestos del modelo

  6. Estime los parámetros del modelo. ¿Qué indica “a” y “b”?

  7. Obtenga un intervalo de confianza para alfa y beta. Interprete para cada variedad.

  8. ¿Se verifican los supuestos?

  9. Una medida muestral de la capacidad predictora del modelo es R2 ¿Qué valor asume? ¿Cómo lo interpreta?

  10. ¿Cuál es el diámetro promedio que se espera obtener si el peso de la mandarina es de 100 gramos?


Bibliografía

  • Amat R. J. (2016). Correlación Lineal y Regresión Lineal Simple. Recuperado de: https://cienciadedatos.net/documentos/24_correlacion_y_regresion_line

  • Balzarini, M., Di Rienzo, J. Tablada, M. González, L. Bruno, C., Córdoba, M. Robledo, W., Casanoves, F. (2016). Estadística y biometría: ilustraciones del uso de InfoStat en problemas de agronomía - 2a ed. Córdoba: Editorial Brujas; UNC.

  • Batista, W. B., (2018). Introducción a la inferencia estadística aplicada: teoría, cálculo e interpretación - 1a ed. Ciudad Autónoma de Buenos Aires: Editorial Facultad de Agronomía.