#1.¿Cuál es el individuo bajo estudio para la base de datos seleccionada en la actividad 1?
##R/ El elemento bajo estudio es el precio al productor por el sacrificio de su ganado bovino en Colombia durante los primero 9 meses del año 2018.
#2.Definir si la base de datos seleccionada en la actividad 1 posee la estructura de datos ordenados. Mencione las razones por las cuales cumple o no dicha condición.
##R/ la base de datos seleccionada está en un formato desordenado ya que tiene un formato ancho y no largo, posee meses del año donde no hay información, estas debemos eliminarlas para evitar confusión en la interpretación.
#3.Si la respuesta al numeral anterior es negativa, es decir, que su base de datos no cumple con los principios del tidy data, con R transforme sus datos al formato adecuado.
##R/ en este paso se organiza la base de datos, llamo la biblioteca tidyverse para organizar mi base de datos con los codigos de allí y hacer ver mi base de datos de una manera mas organizada y agradable con R.
library(tidyverse)
datos <- read_csv(file = "Sacrificio_y_precios_al_productor_de_ganado_bovino_2018.csv")
datos
library(janitor)
datos1 <- clean_names(datos)
datos1
variables <- names(datos1)[-c(11, 12)]
datos2 <- datos1[, variables]
datos2
-organizo la base de datos para que no esté en formato ancho
Datos3 <- pivot_longer (data = datos2,
cols = -c(variable),
names_to = "Meses")
Datos3
#4.¿La información contenida en la base de datos es suficiente para responder las consultas planteadas en la actividad 1?
#5.Importe la base de datos a R y seleccione sólo las variables que considere necearias para responder a sus consultas.
Datos3 %>%
arrange(desc(value)) %>%
filter(variable == "Precio Promedio Pagado al Productor ( Kg)")
#6. ¿Qué métricas estadísticas le sirven para dar respuesta a las consultas? Obtenga con R los estadísticos descriptivos que considere necesarios.
Datos3 %>%
arrange(desc(value)) %>%
filter(variable == "B\nAnimales Hembras sacrificadas") %>%
summarise(Total_hembras_sacrificadas = sum(value))
Datos3 %>%
arrange(desc(value)) %>%
filter(variable == "Precio Promedio Pagado al Productor ( Kg)") %>%
summarise(Promedio_pagado_2018 = mean(value) )
-el mayor valor que se pagó al productor en el 2018 y el valor minimo.
Datos3 %>%
filter(variable == "Precio Promedio Pagado al Productor ( Kg)") %>%
arrange(desc(value)) %>%
summarise(maximo = max(value), minimo = min(value))
#7. Además de las métricas estadísticas, ¿qué gráficos considera pertinentes para dilucidar la información de su base de datos? Construirlos manualmente (borrador en papel o paint) e incorporarlos al documento R Markdown.
#8. Imprima en su documento la base de datos final.
#Ejercicio hipotético -Usted ha sido encargado por el ministerio de agricultura para recopilar información de un experimento en cítricos. Le es suministrada la siguiente información:
Hay tres tratamientos bajo análisis y un cuarto grupo denominado “control”. El ensayo se realizará en tres zonas diferentes del país. Se tomarán datos durante 3 meses con periodicidad de 1 mes. En cada zona hay 5 predios productores de naranja que harán parte de esta investigación. Las variables bajo análisis son rendimiento/hectárea y % de fruta desperdiciada (clasificado como desperdicio bajo, moderado y alto).
Debemos recopilar la informacion de manera ordenada para ingresarlo a la tabulación y llamar esa base de datos en R, yo propongo la plantilla para tratar los datos de la siguiente manera:
-tabular los datos en formato largo en vez de ancho, o podemos tratar la base de datos importada desde excel puede ser, y usar el pivot_longer para organizar su formato en R. -En una columna podemos unir los tratamientos con los meses de prueba, ejem: mes1_tart1_finca1….