1-en la actividad uno se trabajo con una base de datos que contiene informacion hacerca de la cantidad de litros de leche en el departamento de boyaca, el individuo de estudio es la cantidad de leche que se produce en un dia.
library(readr)
library(tidyverse)
datos <- read_csv("Producci_n_Leche__Litros_D_a__-_DEPARTAMENTO_DE_BOYAC_.csv")
datos1 <- datos %>%
rename("TIPO_EXPLOTACION" ="TIPO DE EXPLOTACION","VACAS_ORDEÑO" = "VACAS PARA ORDEÑO", "TOTAL_LITROS/DIA" = "TOTAL LITROS/DÍA", "PRODUCCION_VACA(LITROS/DIA)" = "PRODUCCION POR VACA (LITROS/DIA)")
2- los datos de la tabla estan ordenados por que cumple con las condiciones necesarias para que sea una tabla ordenada
-cada variable tiene su columna -Cada observación debe tener su propia fila. -Cada valor debe tener su propia celda
¿que region produce mas leche ?
¿que tipo de explotacion produce mas leche?
¿en que año se alcanzo mas produccion de leche ?
# - ¿que region produce mas leche ?
library(tidyverse)
regionleche <- tapply(X = datos$`TOTAL LITROS/DÍA`, INDEX = datos$MUNICIPIO, FUN= sum)
regionleche
## ALMEIDA AQUITANIA ARCABUCO
## NA NA 74600
## BELEN BERBEO BETEITIVA
## 162330 NA NA
## BOAVITA BOYACA BRICEÑO
## 23238 NA 8950
## BUENAVISTA BUSBANZA CALDAS
## 26764 NA 43140
## CAMPOHERMOSO CERINZA CHINAVITA
## NA NA NA
## CHIQUINQUIRA CHIQUIZA CHISCAS
## NA NA NA
## CHITA CHITARAQUE CHIVATA
## NA NA NA
## CHIVOR CIENEGA COMBITA
## NA 81250 149020
## COPER CORRALES COVARACHIA
## NA 7978 NA
## CUBARA CUCAITA CUITIVA
## NA NA NA
## DUITAMA EL COCUY EL ESPINO
## 144400 NA NA
## FIRAVITOBA FLORESTA GACHANTIVA
## 108000 NA NA
## GAMEZA GARAGOA GUACAMAYAS
## NA NA NA
## GUATEQUE GUAYATA GUICAN
## 6530 NA NA
## IZA JENESANO JERICO
## 42705 NA NA
## LA CAPILLA LA UVITA LA VICTORIA
## NA NA NA
## LABRANZAGRANDE MACANAL MARIPI
## NA NA 24790
## MIRAFLORES MONGUA MONGUI
## 64198 NA NA
## MONIQUIRA MOTAVITA MUZO
## 72480 35585 NA
## NOBSA NUEVO COLON OICATA
## NA NA 88005
## OTANCHE PACHAVITA PAEZ
## 36420 NA NA
## PAIPA PAJARITO PANQUEBA
## 308670 NA 18290
## PAUNA PAYA PAZ DE RIO
## 43680 9540 NA
## PESCA PISBA PUERTO BOYACA
## NA NA 507200
## QUIPAMA RAMIRIQUI RAQUIRA
## NA NA 36675
## RONDON SABOYA SACHICA
## NA NA NA
## SAMACA SAN EDUARDO SAN JOSE DE PARE
## 63860 21088 NA
## SAN LUIS DE GACENO SAN MATEO SAN MIGUEL DE SEMA
## NA NA 291700
## SAN PABLO DE BORBUR SANTA MARIA SANTA ROSA DE VITERBO
## NA NA 91120
## SANTA SOFIA SANTANA SATIVANORTE
## NA NA NA
## SATIVASUR SIACHOQUE SOATA
## 11161 39352 NA
## SOCHA SOCOTA SOGAMOSO
## NA NA 66505
## SOMONDOCO SORA SORACA
## NA NA 66880
## SOTAQUIRA SUSACON SUTAMARCHAN
## 324104 17910 NA
## SUTATENZA TASCO TENZA
## NA NA NA
## TIBANA TIBASOSA TINJACA
## NA 47420 18423
## TIPACOQUE TOCA TOGUI
## NA 81984 NA
## TOPAGA TOTA TUNJA
## NA NA NA
## TUNUNGUA TURMEQUE TUTA
## NA NA 189958
## TUTAZA UMBITA VENTAQUEMADA
## NA 24538 NA
## VILLA DE LEYVA VIRACACHA ZETAQUIRA
## NA 20710 NA
# se sumo el total de litros por departamento.
sort(regionleche, decreasing = TRUE)[1]
## PUERTO BOYACA
## 507200
# la region con mas produccion de leche es puerto boyaca.
# - ¿que tipo de explotacion produce mas leche?
datos %>%
group_by(`TIPO DE EXPLOTACION`) %>%
summarise(total = sum(`TOTAL LITROS/DÍA`))
# - ¿en que año se alcanzo mas produccion de leche ?
datos %>%
group_by(`AÑO`) %>%
summarise(total = sum(`TOTAL LITROS/DÍA`))
library(readr)
tabla <- read_csv("tabla r.csv")
tabla