Análisis exploratorio de la base de datos del ReTAA

Santiago Rossi
4/09/2019

Qué es el Análisis Exploratorio de Datos (EDA)?

“Procedures for analyzing data, techniques for interpreting the results of such procedures, ways of planning the gathering of data to make its analysis easier, more precise or more accurate, and all the machinery and results of (mathematical) statistics which apply to analyzing data.” John Tukey-The Future of Data Analysis-July 1961

“We need both exploratory and confirmatory” Tukey, John W. (1980)

Técnicas del EDA

Los objetivos del EDA son:

  • Sugerir hipótesis sobre las causas de un fenómeno observado
  • Evaluar los supuestos en los que se basará la inferencia estadística
  • Facilitar la selección de herramientas y técnicas estadísticas apropiadas
  • Proporcionar una base para una mayor recopilación de datos a través de encuestas o experimentos

Técnicas del EDA

El EDA se carcteriza por el uso de herramientas gráficas y métodos estadísticos, pero en realidad lo que caracteriza al EDA es la actitud: intertar comprender el mundo a trav'es de los datos

Algunas típicas herramientas gráficas usada en el EDA son:

Box plots, Histogramas, gráficos multivariados, Run charts (series de tiempo), Pareto charts (Diagramas de Pareto), scatter plots (gráficos de dispersión), gráficos de coordenadas paralelas (gráficos de perfiles)

Técnicas de reducción de dimensionalidad: Análisis de Componentes Principales, Análisis de Correspondencia, entre otros.

Cluster Análisis: Dendograma

Fuente: Retaa

Cluster Análisis: K-medias

Fuente: Retaa

Análisis de Componente Principales

Fuente: Retaa

Conclusiones

Existe una amplia gama de trabajos para los que la base del ReTAA puede ser utilizada:

  • Determinantes del nivel tecnológico de los productores agropecuarios
    • Determinantes dde las brechas entre productores
    • Analisis geografico de la producción: técnicas aplicadas, cultivos, climas, etc.
    • Estimación de elasticidades de rendimientos con variables climáticas, y uso de insumos.
    • Asociación entre uso de insumos y variables climáticas: ej. fungicidas