Code
library(readr)
library(readxl)
library(tidyr)
Analisi de datos
library(readr)
library(readxl)
library(tidyr)
esta actividad se desarrolla con el proposito de aquirir abilidades de identificion y organizacion de bases de datos segun el concepto de datos tidy
para esto se importan y analisan usando las herramietas de R y Rstudio
<- read.csv("datos_analisis/Agricultores_Municipio_de_San_Cayetano_20250320.csv")
tabla_1 <- read.csv("datos_analisis/arroz-serie-1924-2022.csv")
tabla_2 <- read.csv("datos_analisis/_ndice_de_precios_de_insumos_agr_colas_20250320.csv")
tabla_3 <- read.csv("datos_analisis/Zonificaci_n_de_aptitud_para_la_producci_n_de_carne_ovina__Ovis_aries__en_pastoreo_para_Colombia_20250320.csv")
tabla_4 <- read.csv("datos_analisis/Evaluaci_n_de_Tierras_para_el_cultivo_tecnificado_de_Frijol__Phaseolus_vulgaris__de_variedades_volubles__semestre_2___en_el_departamento_del_Huila_20250322.csv") tabla_5
head(tabla_1)
en la columna 5 en las filas [64,20,86,77,79,51,59,17,99] todas estas filas tienen informacion incorrecta, no usan las mismas unidades de medida y tambien algunos usan divisiones en lugar de decimales como en otras filas.
ademas de en la columna 6 varios de los valores les faltan separaciones con comas.
cambiar los valores por sus correspondientes unidades de medida y pasar todos a valores decimales en lugar de diviciones
separate() para remover las filas con valores incorrectos. posteriormente se agregan las correciones de la tabla usando el joint para agregar dichas filas corregidas
head(tabla_2)
de esta tabla esta correcta, no tiene valores vacios, tienen todas sus unidades de medida correctamente colocadas.
no hay nada que hacer porque la tabla esta correctamente estructurada.
head(tabla_3)
los totales de esta tabla se encuentran colocados en sus primeras columnas, tiene campos vacios y despues de esto tiene columnas repetidas para productos y un completo deshorden de estos mismos.
eliminando las columnas con variables repetidas de productos y ordenando los productos de una forma alfabetica para mayor comprensibilidad
con pivot_longer eliminlar las columnas repetidas con el argumento:
pivot_longer(tabla_3,(-Xcolumna,-ycolumna,-zcolumna…))
donde entre parentesis van las columnas a excluir usando el (-)
head(tabla_4)
hay un uso correcto de las variables y sus datos sensarios
ninguna, la tabla esta bien en correlacion con los estandares tidy
head(tabla_5)
la gestion de datos evaluativos estan bien hechos para el cultivo de fijoles a nivel departamental del huila.
el uso de R para organizar la informacion y gesrionar las diversas vaces de datos en formatos como CSV Y XSLX es una herramienta que permite filtrar y corregir este tipo de formatos ademas de reorganizarlos de forma en que se puede hacer facil uso y entendimiento de estas.