#1.¿Cuál es el individuo bajo estudio para la base de datos seleccionada en la actividad 1?

##R/ El elemento bajo estudio es el precio al productor por el sacrificio de su ganado bovino en Colombia durante los primero 9 meses del año 2018.

#2.Definir si la base de datos seleccionada en la actividad 1 posee la estructura de datos ordenados. Mencione las razones por las cuales cumple o no dicha condición.

##R/ la base de datos seleccionada está en un formato desordenado ya que tiene un formato ancho y no largo, posee meses del año donde no hay información, estas debemos eliminarlas para evitar confusión en la interpretación.

#3.Si la respuesta al numeral anterior es negativa, es decir, que su base de datos no cumple con los principios del tidy data, con R transforme sus datos al formato adecuado.

##R/ en este paso se organiza la base de datos, llamo la biblioteca tidyverse para organizar mi base de datos con los codigos de allí y hacer ver mi base de datos de una manera mas organizada y agradable con R.

Base de datos Actividad1

library(tidyverse)

datos <- read_csv(file = "Sacrificio_y_precios_al_productor_de_ganado_bovino_2018.csv")
datos
library(janitor)
datos1 <- clean_names(datos)
datos1
variables <- names(datos1)[-c(11, 12)]

datos2 <- datos1[, variables]
datos2

-organizo la base de datos para que no esté en formato ancho

Datos3 <- pivot_longer (data = datos2, 
                        cols = -c(variable), 
                        names_to = "Meses")
Datos3

#4.¿La información contenida en la base de datos es suficiente para responder las consultas planteadas en la actividad 1?

R/ para este ejercicio organicé la base de datos de manera que fuera posible responder a las demandas de la actividad1, pero tambipen debí replantearme el proceso y renovar puntos claves en las preguntas inicialmente planteadas para darle continuidad al proceso de empalme entre el documento pasado y el actual.

#5.Importe la base de datos a R y seleccione sólo las variables que considere necearias para responder a sus consultas.

R/Para resolver las preguntas , como cual es el precio promedio pagado al productor para el mes de enero organizo en orden descendente mis datos de valor numerico y así puedo visualizar mi dato de interes con mayor rapidez.

R/con el paso filter puedo solo ver una fila, en este caso necesito solo el precio pagado al productor.

Datos3 %>% 
  arrange(desc(value)) %>% 
  filter(variable == "Precio Promedio Pagado al Productor ( Kg)") 

#6. ¿Qué métricas estadísticas le sirven para dar respuesta a las consultas? Obtenga con R los estadísticos descriptivos que considere necesarios.

  • necesito la sumatoria de las hembras sacrificadas para obtener el numero de hembras sacrificadas en el 2018.
Datos3 %>% 
  arrange(desc(value)) %>% 
  filter(variable == "B\nAnimales Hembras sacrificadas") %>% 
  summarise(Total_hembras_sacrificadas = sum(value))

R/ voy a extraer el dato de cual es el promedio del precio que se le paga al productor en el año 2018, enotonces debo extraer las filas de precio pagado al productor en los diferentes meses, tenemos datos de 9 meses del año 2018 y sacamos la media para responder, si lo quisieramos tambine podemos extraer un dato espefifio bien sea el mes en que mejor pagaron al producto o el mes donde peor pagaron al productor.

Datos3 %>% 
  arrange(desc(value)) %>% 
  filter(variable == "Precio Promedio Pagado al Productor ( Kg)") %>% 
  summarise(Promedio_pagado_2018 = mean(value) )

-el mayor valor que se pagó al productor en el 2018 y el valor minimo.

Datos3 %>%
  filter(variable == "Precio Promedio Pagado al Productor ( Kg)") %>% 
  arrange(desc(value)) %>% 
  summarise(maximo = max(value), minimo = min(value))

#7. Además de las métricas estadísticas, ¿qué gráficos considera pertinentes para dilucidar la información de su base de datos? Construirlos manualmente (borrador en papel o paint) e incorporarlos al documento R Markdown.

Gráfico

#8. Imprima en su documento la base de datos final.

#Ejercicio hipotético -Usted ha sido encargado por el ministerio de agricultura para recopilar información de un experimento en cítricos. Le es suministrada la siguiente información:

Hay tres tratamientos bajo análisis y un cuarto grupo denominado “control”. El ensayo se realizará en tres zonas diferentes del país. Se tomarán datos durante 3 meses con periodicidad de 1 mes. En cada zona hay 5 predios productores de naranja que harán parte de esta investigación. Las variables bajo análisis son rendimiento/hectárea y % de fruta desperdiciada (clasificado como desperdicio bajo, moderado y alto).

Respuesta

Debemos recopilar la informacion de manera ordenada para ingresarlo a la tabulación y llamar esa base de datos en R, yo propongo la plantilla para tratar los datos de la siguiente manera:

-tabular los datos en formato largo en vez de ancho, o podemos tratar la base de datos importada desde excel puede ser, y usar el pivot_longer para organizar su formato en R. -En una columna podemos unir los tratamientos con los meses de prueba, ejem: mes1_tart1_finca1….