Observaciones

Analisi de datos

Author

francisco ibanez y yanine ramos [sede:Caucasia]

Published

March 22, 2025

Code
library(readr)
library(readxl)
library(tidyr)

organizacion de datos tidy

esta actividad se desarrolla con el proposito de aquirir abilidades de identificion y organizacion de bases de datos segun el concepto de datos tidy

para esto se importan y analisan usando las herramietas de R y Rstudio

Code
tabla_1 <- read.csv("datos_analisis/Agricultores_Municipio_de_San_Cayetano_20250320.csv")
tabla_2 <- read.csv("datos_analisis/arroz-serie-1924-2022.csv")
tabla_3 <- read.csv("datos_analisis/_ndice_de_precios_de_insumos_agr_colas_20250320.csv")
tabla_4 <- read.csv("datos_analisis/Zonificaci_n_de_aptitud_para_la_producci_n_de_carne_ovina__Ovis_aries__en_pastoreo_para_Colombia_20250320.csv")
tabla_5 <- read.csv("datos_analisis/Evaluaci_n_de_Tierras_para_el_cultivo_tecnificado_de_Frijol__Phaseolus_vulgaris__de_variedades_volubles__semestre_2___en_el_departamento_del_Huila_20250322.csv")

Analisis de datos del conjunto de datos (Agricultores municipio de san cayetano)

Code
head(tabla_1)

en la columna 5 en las filas [64,20,86,77,79,51,59,17,99] todas estas filas tienen informacion incorrecta, no usan las mismas unidades de medida y tambien algunos usan divisiones en lugar de decimales como en otras filas.

ademas de en la columna 6 varios de los valores les faltan separaciones con comas.

Propuesta de solucion

cambiar los valores por sus correspondientes unidades de medida y pasar todos a valores decimales en lugar de diviciones

separate() para remover las filas con valores incorrectos. posteriormente se agregan las correciones de la tabla usando el joint para agregar dichas filas corregidas

Analisis de datos del conjunto de datos (arroz serie 1924-2022)

Code
head(tabla_2)

de esta tabla esta correcta, no tiene valores vacios, tienen todas sus unidades de medida correctamente colocadas.

Propuesta de solucion

no hay nada que hacer porque la tabla esta correctamente estructurada.

Analisis de datos del conjunto de datos (indices de precios al consumidor)

Code
head(tabla_3)

los totales de esta tabla se encuentran colocados en sus primeras columnas, tiene campos vacios y despues de esto tiene columnas repetidas para productos y un completo deshorden de estos mismos.

Propuesta de solucion

eliminando las columnas con variables repetidas de productos y ordenando los productos de una forma alfabetica para mayor comprensibilidad

con pivot_longer eliminlar las columnas repetidas con el argumento:

pivot_longer(tabla_3,(-Xcolumna,-ycolumna,-zcolumna…))

donde entre parentesis van las columnas a excluir usando el (-)

Analisis de datos del conjunto de datos (zonificacion para producion de carne)

Code
head(tabla_4)

hay un uso correcto de las variables y sus datos sensarios

Propuesta de solucion

ninguna, la tabla esta bien en correlacion con los estandares tidy

Analisis de datos del conjunto de datos (evaluacion de tierras para cultivo de frijol)

Code
head(tabla_5)

la gestion de datos evaluativos estan bien hechos para el cultivo de fijoles a nivel departamental del huila.

conclusion

el uso de R para organizar la informacion y gesrionar las diversas vaces de datos en formatos como CSV Y XSLX es una herramienta que permite filtrar y corregir este tipo de formatos ademas de reorganizarlos de forma en que se puede hacer facil uso y entendimiento de estas.