library(openxlsx)
url3<-"https://docs.google.com/spreadsheets/d/e/2PACX-1vRjYC7zQcOD9IO11p0A67c0X25Ac4lqC_nC7tLEaLBJxxPzssDg0fTm_NQ9ygX7h3joYDgx_tnTp4PN/pub?output=xlsx"
df = read.xlsx(url3)
#head(df,5)
ver filas y columnas
dim(df)
## [1] 2113 40
nombre de columnas
names(df)
## [1] "FECHA.DE.REGISTRO" "MID.MONEDERO" "TERRITORIO"
## [4] "PERIODO" "MARCA" "SUBMARCA"
## [7] "PLACA" "DIA.1" "DIA.2"
## [10] "DIA.3" "DIA.4" "DIA.5"
## [13] "DIA.6" "DIA.7" "DIA.8"
## [16] "DIA.9" "DIA.10" "DIA.11"
## [19] "DIA.12" "DIA.13" "DIA.14"
## [22] "DIA.15" "DIA.16" "DIA.17"
## [25] "DIA.18" "DIA.19" "DIA.20"
## [28] "DIA.21" "DIA.22" "DIA.23"
## [31] "DIA.24" "DIA.25" "DIA.26"
## [34] "DIA.27" "DIA.28" "DIA.29"
## [37] "DIA.30" "DIA.31" "RECURSO.PROPIO"
## [40] "DUPLICADO"
*solo ver la estructura
#str(df)
Transformar a mayúsculas
df[,8]<- toupper(df[,8])
Quitar Acentos
df$DIA.1<- chartr("ÁÉÍÓÚ", "AEIOU", df$DIA.1)
Ciclo para transformar a mayúscula y quitar acentos
for(i in 9:38){
df[,i]<- toupper(df[,i])
df[,i]<- chartr("ÁÉÍÓÚ", "AEIOU",df[,i])
}
*ver como quedo son duplicados y sin acentos
#str(df)
Quitar columna “duplicado”
df$DUPLICADO<-NULL
Identificar duplicados por columnas
df[duplicated(df),]
## [1] FECHA.DE.REGISTRO MID.MONEDERO TERRITORIO PERIODO
## [5] MARCA SUBMARCA PLACA DIA.1
## [9] DIA.2 DIA.3 DIA.4 DIA.5
## [13] DIA.6 DIA.7 DIA.8 DIA.9
## [17] DIA.10 DIA.11 DIA.12 DIA.13
## [21] DIA.14 DIA.15 DIA.16 DIA.17
## [25] DIA.18 DIA.19 DIA.20 DIA.21
## [29] DIA.22 DIA.23 DIA.24 DIA.25
## [33] DIA.26 DIA.27 DIA.28 DIA.29
## [37] DIA.30 DIA.31 RECURSO.PROPIO
## <0 rows> (or 0-length row.names)
Eliminar duplicados
df <- df[!duplicated(df),]#eliminar duplicados
No se puede porque la columna fecha siempre será diferente
Vamos a crear una nueva columna que agrupe md.monedero y periodo
df2<-df
df2$unidos<-paste(df$PERIODO,df$MID.MONEDERO ,sep = "_")
#head(df2$unidos,5) #ver como quedan los varoles
*ver como queda con la nueva columna “unidos”
#head(df2,10)
exportar en csv para ver
#write.csv(df2,"C:/Users/HP/Desktop/BORRAR/df2.csv", row.names = FALSE)
llamar a la artilleria pesada
library(tidyverse)
Ver los duplicados que hay y guardarlo en “dfduplicados”, despues ordentar los duplicados
dfduplicados <- df2[duplicated(df2$unidos), ] #eliminar duplicados
dfduplicados <- arrange(dfduplicados,unidos) #ordenar duplicados
#head(dfduplicados,20)
exportar duplicados base
#write.csv(dfduplicados,"C:/Users/HP/Desktop/BORRAR/dfduplicados.csv", row.names = FALSE)
Eliminar duplicados por la columna unidos
df3 <- df2[!duplicated(df2$unidos), ]
dim(df3)
## [1] 1986 40
se redujeron de 2113 a 1986
*nuestro df3 ya no tiene duplicados
df3[duplicated(df3$unidos), ]
## [1] FECHA.DE.REGISTRO MID.MONEDERO TERRITORIO PERIODO
## [5] MARCA SUBMARCA PLACA DIA.1
## [9] DIA.2 DIA.3 DIA.4 DIA.5
## [13] DIA.6 DIA.7 DIA.8 DIA.9
## [17] DIA.10 DIA.11 DIA.12 DIA.13
## [21] DIA.14 DIA.15 DIA.16 DIA.17
## [25] DIA.18 DIA.19 DIA.20 DIA.21
## [29] DIA.22 DIA.23 DIA.24 DIA.25
## [33] DIA.26 DIA.27 DIA.28 DIA.29
## [37] DIA.30 DIA.31 RECURSO.PROPIO unidos
## <0 rows> (or 0-length row.names)
names(df3)
## [1] "FECHA.DE.REGISTRO" "MID.MONEDERO" "TERRITORIO"
## [4] "PERIODO" "MARCA" "SUBMARCA"
## [7] "PLACA" "DIA.1" "DIA.2"
## [10] "DIA.3" "DIA.4" "DIA.5"
## [13] "DIA.6" "DIA.7" "DIA.8"
## [16] "DIA.9" "DIA.10" "DIA.11"
## [19] "DIA.12" "DIA.13" "DIA.14"
## [22] "DIA.15" "DIA.16" "DIA.17"
## [25] "DIA.18" "DIA.19" "DIA.20"
## [28] "DIA.21" "DIA.22" "DIA.23"
## [31] "DIA.24" "DIA.25" "DIA.26"
## [34] "DIA.27" "DIA.28" "DIA.29"
## [37] "DIA.30" "DIA.31" "RECURSO.PROPIO"
## [40] "unidos"
vamos a cambiar el orden a tydi
df4 <- df3 %>% gather(key = NOMBRE_DIA, value = NOMBRE_ACTIVIDADES, 8:38)
nuevos nombres
names(df4)
## [1] "FECHA.DE.REGISTRO" "MID.MONEDERO" "TERRITORIO"
## [4] "PERIODO" "MARCA" "SUBMARCA"
## [7] "PLACA" "RECURSO.PROPIO" "unidos"
## [10] "NOMBRE_DIA" "NOMBRE_ACTIVIDADES"
exportar df4
#write.csv(df4,"C:/Users/HP/Desktop/BORRAR/df4.csv", row.names = FALSE)
Exportar en formato tidy
¿Hay valores raros? ver si hay que homogeneizar
names(table(df4$TERRITORIO))
## [1] "ACAYUCAN" "BALANCAN"
## [3] "CHIHUAHUA" "COLIMA"
## [5] "COMALCALCO" "CORDOBA"
## [7] "DURANGO" "GUERRERO"
## [9] "HIDALGO" "MICHOACAN"
## [11] "MORELOS" "NAYARIT"
## [13] "OAXACA (ISTMO)" "OAXACA (MIXTECA)"
## [15] "OCOSINGO" "PALENQUE"
## [17] "PAPANTLA" "PICHUCALCO"
## [19] "PUEBLA" "SAN CRISTOBAL"
## [21] "SAN LUIS POTOSI" "SINALOA"
## [23] "TAMAULIPAS" "TANTOYUCA"
## [25] "TAPACHULA" "TAPACHULA PESN"
## [27] "TAPACHULA Z.E.E" "TAPACHULA ZE"
## [29] "TEAPA" "TLAXCALA"
## [31] "TZUCACAB (OTHON P. BLANCO)" "XPUJIL (CAMPECHE)"
#ver numero de columnas
dim(df4)
## [1] 61566 11
names(df4)
## [1] "FECHA.DE.REGISTRO" "MID.MONEDERO" "TERRITORIO"
## [4] "PERIODO" "MARCA" "SUBMARCA"
## [7] "PLACA" "RECURSO.PROPIO" "unidos"
## [10] "NOMBRE_DIA" "NOMBRE_ACTIVIDADES"
reordenar las columnas
#seleccionar columnas menos isla,ancho_pico,
df5<-df4[,c(1,2,7,8,9,6,3,10,4,5,11)]
nombre columnas re-ordenadas
names(df5)
## [1] "FECHA.DE.REGISTRO" "MID.MONEDERO" "PLACA"
## [4] "RECURSO.PROPIO" "unidos" "SUBMARCA"
## [7] "TERRITORIO" "NOMBRE_DIA" "PERIODO"
## [10] "MARCA" "NOMBRE_ACTIVIDADES"
en ciclo for imprimir solo nombres
for(i in 7:10){
nombres <- names(table(df5[,i]))
print(nombres)
cat("\n\n##########################################################################\n\n")
}
## [1] "ACAYUCAN" "BALANCAN"
## [3] "CHIHUAHUA" "COLIMA"
## [5] "COMALCALCO" "CORDOBA"
## [7] "DURANGO" "GUERRERO"
## [9] "HIDALGO" "MICHOACAN"
## [11] "MORELOS" "NAYARIT"
## [13] "OAXACA (ISTMO)" "OAXACA (MIXTECA)"
## [15] "OCOSINGO" "PALENQUE"
## [17] "PAPANTLA" "PICHUCALCO"
## [19] "PUEBLA" "SAN CRISTOBAL"
## [21] "SAN LUIS POTOSI" "SINALOA"
## [23] "TAMAULIPAS" "TANTOYUCA"
## [25] "TAPACHULA" "TAPACHULA PESN"
## [27] "TAPACHULA Z.E.E" "TAPACHULA ZE"
## [29] "TEAPA" "TLAXCALA"
## [31] "TZUCACAB (OTHON P. BLANCO)" "XPUJIL (CAMPECHE)"
##
##
## ##########################################################################
##
## [1] "DIA.1" "DIA.10" "DIA.11" "DIA.12" "DIA.13" "DIA.14" "DIA.15" "DIA.16"
## [9] "DIA.17" "DIA.18" "DIA.19" "DIA.2" "DIA.20" "DIA.21" "DIA.22" "DIA.23"
## [17] "DIA.24" "DIA.25" "DIA.26" "DIA.27" "DIA.28" "DIA.29" "DIA.3" "DIA.30"
## [25] "DIA.31" "DIA.4" "DIA.5" "DIA.6" "DIA.7" "DIA.8" "DIA.9"
##
##
## ##########################################################################
##
## [1] "44501.0" "agosto 2021" "noviembre 2021" "octubre 2021"
## [5] "septiembre 2021"
##
##
## ##########################################################################
##
## [1] "-APOYO" "APOYO-APOYO"
## [3] "CHEVROLET-SILVERADO" "DODGE-RAM 1500"
## [5] "DODGE-RAM 1500 (NAC)" "DODGE-RAM 1500 4X4 V6"
## [7] "DODGE-RAM 2500" "DODGE-RAM 4000"
## [9] "DODGE-RAM1500" "DODGE-SILVERADO"
## [11] "DOGDE-RAM 1500" "FORD-RANGER"
## [13] "FORD -RANGER" "GENERAL MOTORS-CHEVROLET SILVERADO"
## [15] "MITSUBISHI-L200" "NISSAN-FRONTIER"
## [17] "NISSAN-NP300" "NO APLICA-NO APLICA"
## [19] "TOYOTA-HILUX" "VOLKSWAGEN-AMAROK"
##
##
## ##########################################################################
en ciclo for imprimir cuenta
for(i in 7:10){
nombres <- table(df5[,i])
print(nombres)
cat("\n\n##########################################################################\n\n")
}
##
## ACAYUCAN BALANCAN
## 2728 2604
## CHIHUAHUA COLIMA
## 2604 713
## COMALCALCO CORDOBA
## 2728 2604
## DURANGO GUERRERO
## 2604 4216
## HIDALGO MICHOACAN
## 1581 1488
## MORELOS NAYARIT
## 868 682
## OAXACA (ISTMO) OAXACA (MIXTECA)
## 2480 2480
## OCOSINGO PALENQUE
## 2356 2728
## PAPANTLA PICHUCALCO
## 1860 2728
## PUEBLA SAN CRISTOBAL
## 2108 124
## SAN LUIS POTOSI SINALOA
## 2511 1364
## TAMAULIPAS TANTOYUCA
## 744 2015
## TAPACHULA TAPACHULA PESN
## 2604 961
## TAPACHULA Z.E.E TAPACHULA ZE
## 31 620
## TEAPA TLAXCALA
## 2480 744
## TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
## 2635 2573
##
##
## ##########################################################################
##
##
## DIA.1 DIA.10 DIA.11 DIA.12 DIA.13 DIA.14 DIA.15 DIA.16 DIA.17 DIA.18 DIA.19
## 1986 1986 1986 1986 1986 1986 1986 1986 1986 1986 1986
## DIA.2 DIA.20 DIA.21 DIA.22 DIA.23 DIA.24 DIA.25 DIA.26 DIA.27 DIA.28 DIA.29
## 1986 1986 1986 1986 1986 1986 1986 1986 1986 1986 1986
## DIA.3 DIA.30 DIA.31 DIA.4 DIA.5 DIA.6 DIA.7 DIA.8 DIA.9
## 1986 1986 1986 1986 1986 1986 1986 1986 1986
##
##
## ##########################################################################
##
##
## 44501.0 agosto 2021 noviembre 2021 octubre 2021 septiembre 2021
## 62 15252 15345 15469 15438
##
##
## ##########################################################################
##
##
## -APOYO APOYO-APOYO
## 155 124
## CHEVROLET-SILVERADO DODGE-RAM 1500
## 12679 18910
## DODGE-RAM 1500 (NAC) DODGE-RAM 1500 4X4 V6
## 403 217
## DODGE-RAM 2500 DODGE-RAM 4000
## 62 248
## DODGE-RAM1500 DODGE-SILVERADO
## 2418 62
## DOGDE-RAM 1500 FORD-RANGER
## 589 1240
## FORD -RANGER GENERAL MOTORS-CHEVROLET SILVERADO
## 62 93
## MITSUBISHI-L200 NISSAN-FRONTIER
## 62 1860
## NISSAN-NP300 NO APLICA-NO APLICA
## 11036 62
## TOYOTA-HILUX VOLKSWAGEN-AMAROK
## 11222 62
##
##
## ##########################################################################
Vamos a hacer una nueva liempieza de datos
Hay varios caracteres que hay que transformar a factores para poder sacar el procentaje
str(df5)
## 'data.frame': 61566 obs. of 11 variables:
## $ FECHA.DE.REGISTRO : num 44441 44441 44448 44441 44441 ...
## $ MID.MONEDERO : chr "M-1860" "M-4955" "M-4542" "M-4872" ...
## $ PLACA : chr "NNN4822" "CY14422" "NTF3747" "CY14412" ...
## $ RECURSO.PROPIO : num 0 0 2903 0 0 ...
## $ unidos : chr "agosto 2021_M-1860" "agosto 2021_M-4955" "agosto 2021_M-4542" "agosto 2021_M-4872" ...
## $ SUBMARCA : chr "AFAHR6CA2LP108069" "3N6AD33A1LK813300" "3C65RBDGOMG622267" "3N6AD33A1LK815557" ...
## $ TERRITORIO : chr "BALANCAN" "TAPACHULA" "OCOSINGO" "TAPACHULA" ...
## $ NOMBRE_DIA : chr "DIA.1" "DIA.1" "DIA.1" "DIA.1" ...
## $ PERIODO : chr "agosto 2021" "agosto 2021" "agosto 2021" "agosto 2021" ...
## $ MARCA : chr "FORD-RANGER" "NISSAN-NP300" "DODGE-RAM 1500" "NISSAN-NP300" ...
## $ NOMBRE_ACTIVIDADES: chr "RECEPCION DE DOCUMENTOS" "SIN ACTIVIDAD" "SIN ACTIVIDAD,OTRAS COMISIONES" "SIN ACTIVIDAD" ...
homogeneizar , se debe hacer antes de convertir a factores
df5$PERIODO[df5$PERIODO == "44501.0"] <- "noviembre 2021"
df5$TERRITORIO[df5$TERRITORIO == "TAPACHULA Z.E.E"] <- "TAPACHULA ZE"
df5$MARCA[df5$MARCA == "FORD -RANGER"|df5$MARCA == "FORD-RANGER"] <- "FORD_RANGER"
df5$MARCA[df5$MARCA == "DODGE-SILVERADO"|
df5$MARCA =="GENERAL MOTORS-CHEVROLET SILVERADO"|
df5$MARCA == "DODGE-SILVERADO"|
df5$MARCA == "CHEVROLET-SILVERADO"] <- "CHEVROLET_SILVERADO"
df5$MARCA[df5$MARCA =="DODGE-RAM 1500" | df5$MARCA =="DODGE-RAM 1500 (NAC)" | df5$MARCA == "DODGE-RAM 1500 4X4 V6" | df5$MARCA == "DODGE-RAM1500" | df5$MARCA =="DOGDE-RAM 1500"] <- "DODGE_RAM_1500"
#eliminar filas con base acriterio
df5 <- df5[df5$MARCA != "NO APLICA-NO APLICA", ]
df5 <- df5[df5$MARCA != "-APOYO", ]
df5 <- df5[df5$MARCA != "APOYO-APOYO", ]
en ciclo for ajustados
for(i in 7:10){
nombres <- table(df5[,i])
print(nombres)
cat("\n\n##########################################################################\n\n")
}
##
## ACAYUCAN BALANCAN
## 2728 2604
## CHIHUAHUA COLIMA
## 2604 713
## COMALCALCO CORDOBA
## 2728 2604
## DURANGO GUERRERO
## 2604 4092
## HIDALGO MICHOACAN
## 1581 1488
## MORELOS NAYARIT
## 837 682
## OAXACA (ISTMO) OAXACA (MIXTECA)
## 2480 2480
## OCOSINGO PALENQUE
## 2356 2728
## PAPANTLA PICHUCALCO
## 1860 2728
## PUEBLA SAN CRISTOBAL
## 2108 124
## SAN LUIS POTOSI SINALOA
## 2418 1364
## TAMAULIPAS TANTOYUCA
## 744 2015
## TAPACHULA TAPACHULA PESN
## 2604 961
## TAPACHULA ZE TEAPA
## 620 2480
## TLAXCALA TZUCACAB (OTHON P. BLANCO)
## 744 2573
## XPUJIL (CAMPECHE)
## 2573
##
##
## ##########################################################################
##
##
## DIA.1 DIA.10 DIA.11 DIA.12 DIA.13 DIA.14 DIA.15 DIA.16 DIA.17 DIA.18 DIA.19
## 1975 1975 1975 1975 1975 1975 1975 1975 1975 1975 1975
## DIA.2 DIA.20 DIA.21 DIA.22 DIA.23 DIA.24 DIA.25 DIA.26 DIA.27 DIA.28 DIA.29
## 1975 1975 1975 1975 1975 1975 1975 1975 1975 1975 1975
## DIA.3 DIA.30 DIA.31 DIA.4 DIA.5 DIA.6 DIA.7 DIA.8 DIA.9
## 1975 1975 1975 1975 1975 1975 1975 1975 1975
##
##
## ##########################################################################
##
##
## agosto 2021 noviembre 2021 octubre 2021 septiembre 2021
## 15221 15283 15376 15345
##
##
## ##########################################################################
##
##
## CHEVROLET_SILVERADO DODGE-RAM 2500 DODGE-RAM 4000 DODGE_RAM_1500
## 12834 62 248 22537
## FORD_RANGER MITSUBISHI-L200 NISSAN-FRONTIER NISSAN-NP300
## 1302 62 1860 11036
## TOYOTA-HILUX VOLKSWAGEN-AMAROK
## 11222 62
##
##
## ##########################################################################
str(df5)
## 'data.frame': 61225 obs. of 11 variables:
## $ FECHA.DE.REGISTRO : num 44441 44441 44448 44441 44441 ...
## $ MID.MONEDERO : chr "M-1860" "M-4955" "M-4542" "M-4872" ...
## $ PLACA : chr "NNN4822" "CY14422" "NTF3747" "CY14412" ...
## $ RECURSO.PROPIO : num 0 0 2903 0 0 ...
## $ unidos : chr "agosto 2021_M-1860" "agosto 2021_M-4955" "agosto 2021_M-4542" "agosto 2021_M-4872" ...
## $ SUBMARCA : chr "AFAHR6CA2LP108069" "3N6AD33A1LK813300" "3C65RBDGOMG622267" "3N6AD33A1LK815557" ...
## $ TERRITORIO : chr "BALANCAN" "TAPACHULA" "OCOSINGO" "TAPACHULA" ...
## $ NOMBRE_DIA : chr "DIA.1" "DIA.1" "DIA.1" "DIA.1" ...
## $ PERIODO : chr "agosto 2021" "agosto 2021" "agosto 2021" "agosto 2021" ...
## $ MARCA : chr "FORD_RANGER" "NISSAN-NP300" "DODGE_RAM_1500" "NISSAN-NP300" ...
## $ NOMBRE_ACTIVIDADES: chr "RECEPCION DE DOCUMENTOS" "SIN ACTIVIDAD" "SIN ACTIVIDAD,OTRAS COMISIONES" "SIN ACTIVIDAD" ...
quitar algunas columnas
df6 <- df5[,c(-5,-6)]
#write.csv(df6,"C:/Users/HP/Desktop/BORRAR/df6.csv", row.names = FALSE)
Hay que checar la columnas nombre_actividades, todas las actividades estan juntas
head(df6$NOMBRE_ACTIVIDADES,20)
## [1] "RECEPCION DE DOCUMENTOS" "SIN ACTIVIDAD"
## [3] "SIN ACTIVIDAD,OTRAS COMISIONES" "SIN ACTIVIDAD"
## [5] "SIN ACTIVIDAD" "SIN ACTIVIDAD"
## [7] "VISITA A VIVEROS" "SIN ACTIVIDAD"
## [9] "SIN ACTIVIDAD" "SIN ACTIVIDAD"
## [11] "SIN ACTIVIDAD" "SIN ACTIVIDAD"
## [13] "SIN ACTIVIDAD" "VISITA A CACS"
## [15] "SIN ACTIVIDAD" "SIN ACTIVIDAD"
## [17] "SIN ACTIVIDAD" "OTRAS COMISIONES"
## [19] "SIN ACTIVIDAD" "SIN ACTIVIDAD"
Parentesis (ver la library string)
texto <- "esta es, una, cadena, e teexto"
sum(str_detect(texto,",")) #detectar las veces en las que esta la coma
## [1] 1
str_count(texto, "[aeiou]") #veces que aparecenlas vocales
## [1] 12
str_count(texto, ",") #veces que aparece la coma
## [1] 3
lo anterior nos servira para contar las actividades que hay dentro de la columna actividades, a df6 le vamos a agregar una columna con el numero de actividades que realizó, contando el número de comas
df6$actividades_diax <- str_count(df6$NOMBRE_ACTIVIDADES, ",")+1
#head(df6,30)
va a separar la columna “NOMBRE ACTIVIDADES” y va a hacer 10 nuevas columnas que empiecen con nombre A
df7 <- df6 %>%
separate(NOMBRE_ACTIVIDADES,paste("A",1:10),sep=',')
## Warning: Expected 10 pieces. Missing pieces filled with `NA` in 61225 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].
podemos ver que hay un aumento de columnas de 9 a 18
dim(df7)
## [1] 61225 19
sum(is.na(df7[,9:18]))
## [1] 528587
sum(is.na(df7[,9:18]))
## [1] 528587
ver los sin actividad
#df7[df7[,9:18]!="SIN ACTIVIDAD",]
ver como queda la base df7
#head(df7,10)
dim(df7)
## [1] 61225 19
Parentesis extra, contar valores válidos, longitud, menos nulos
length(df7[3,9:18])-sum(is.na(df7[3,9:18]))
## [1] 2
exportar el df7 para ver como vamos
#write.csv(df7,"C:/Users/HP/Desktop/BORRAR/df7.csv", row.names = FALSE)
Vamos ahora a aplicar lo de una sola columna formato tydi
names(df7)
## [1] "FECHA.DE.REGISTRO" "MID.MONEDERO" "PLACA"
## [4] "RECURSO.PROPIO" "TERRITORIO" "NOMBRE_DIA"
## [7] "PERIODO" "MARCA" "A 1"
## [10] "A 2" "A 3" "A 4"
## [13] "A 5" "A 6" "A 7"
## [16] "A 8" "A 9" "A 10"
## [19] "actividades_diax"
volvemos a aplicar a formato tidy
df8 <- df7 %>% gather(key = ACTIVIDAD , value = ACTIVIDADES_SEPARADAS, 9:18)
ahora si son un buen de filas, pero se redujeron las columnas
dim(df8)
## [1] 612250 11
library(mice) #para identificar valores perdidos
md.pattern(df8)
## FECHA.DE.REGISTRO MID.MONEDERO PLACA TERRITORIO NOMBRE_DIA PERIODO MARCA
## 79227 1 1 1 1 1 1 1
## 500783 1 1 1 1 1 1 1
## 4436 1 1 1 1 1 1 1
## 27804 1 1 1 1 1 1 1
## 0 0 0 0 0 0 0
## actividades_diax ACTIVIDAD RECURSO.PROPIO ACTIVIDADES_SEPARADAS
## 79227 1 1 1 1 0
## 500783 1 1 1 0 1
## 4436 1 1 0 1 1
## 27804 1 1 0 0 2
## 0 0 32240 528587 560827
En recurso propio encontró 32240 en actividades separadas 528587 lo que da una sume de 560827
#write.csv(df8,"C:/Users/HP/Desktop/BORRAR/df8.csv", row.names = FALSE)
Vamos a quedarnos con los datos distintos de nulo, concretamente en la columna “Actividades separadas”
df9 <- df8[!is.na(df8$ACTIVIDADES_SEPARADAS),]
reducimos las observaciones a 83663
dim(df9)
## [1] 83663 11
#write.csv(df9,"C:/Users/HP/Desktop/BORRAR/df9.csv", row.names = FALSE)
md.pattern(df9)
## FECHA.DE.REGISTRO MID.MONEDERO PLACA TERRITORIO NOMBRE_DIA PERIODO MARCA
## 79227 1 1 1 1 1 1 1
## 4436 1 1 1 1 1 1 1
## 0 0 0 0 0 0 0
## actividades_diax ACTIVIDAD ACTIVIDADES_SEPARADAS RECURSO.PROPIO
## 79227 1 1 1 1 0
## 4436 1 1 1 0 1
## 0 0 0 4436 4436
Aún hay 4436 en la columna recurso propio , el total es 4436
cambiar valores nulos por 0 en la columna recurso propio
df9$RECURSO.PROPIO[is.na(df9$RECURSO.PROPIO)] <- 0
listo, sin valores nulos
md.pattern(df9)
## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'
## FECHA.DE.REGISTRO MID.MONEDERO PLACA RECURSO.PROPIO TERRITORIO NOMBRE_DIA
## 83663 1 1 1 1 1 1
## 0 0 0 0 0 0
## PERIODO MARCA actividades_diax ACTIVIDAD ACTIVIDADES_SEPARADAS
## 83663 1 1 1 1 1 0
## 0 0 0 0 0 0
str(df9)
## 'data.frame': 83663 obs. of 11 variables:
## $ FECHA.DE.REGISTRO : num 44441 44441 44448 44441 44441 ...
## $ MID.MONEDERO : chr "M-1860" "M-4955" "M-4542" "M-4872" ...
## $ PLACA : chr "NNN4822" "CY14422" "NTF3747" "CY14412" ...
## $ RECURSO.PROPIO : num 0 0 2903 0 0 ...
## $ TERRITORIO : chr "BALANCAN" "TAPACHULA" "OCOSINGO" "TAPACHULA" ...
## $ NOMBRE_DIA : chr "DIA.1" "DIA.1" "DIA.1" "DIA.1" ...
## $ PERIODO : chr "agosto 2021" "agosto 2021" "agosto 2021" "agosto 2021" ...
## $ MARCA : chr "FORD_RANGER" "NISSAN-NP300" "DODGE_RAM_1500" "NISSAN-NP300" ...
## $ actividades_diax : num 1 1 2 1 1 1 1 1 1 1 ...
## $ ACTIVIDAD : chr "A 1" "A 1" "A 1" "A 1" ...
## $ ACTIVIDADES_SEPARADAS: chr "RECEPCION DE DOCUMENTOS" "SIN ACTIVIDAD" "SIN ACTIVIDAD" "SIN ACTIVIDAD" ...
exportar df9 para ver como vamos
#write.csv(df9,"C:/Users/HP/Desktop/BORRAR/df9.csv", row.names = FALSE)
el que tiene más categrias va primero
table(df9$ACTIVIDADES_SEPARADAS,df9$TERRITORIO,df9$PERIODO)
## , , = agosto 2021
##
##
## ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
## ASISTENCIA A TECNICOS 204 125 89 37 62 112
## DOCUMENTACION 2 0 0 0 0 0
## OTRAS COMISIONES 102 209 188 26 158 103
## RECEPCION DE DOCUMENTOS 192 178 176 14 49 122
## REUNION CACS 78 65 58 15 42 20
## SIN ACTIVIDAD 93 95 62 33 102 93
## SUPERVISION BIOFABRICA 110 17 13 3 27 21
## TALLERES Y CAPACITACION 76 57 40 8 77 80
## TRABAJO DE OFICINA 0 0 0 1 0 0
## VISITA A CACS 76 42 75 22 42 43
## VISITA A PARCELAS 162 68 38 38 122 51
## VISITA A VIVEROS 231 83 43 14 137 97
##
## DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
## ASISTENCIA A TECNICOS 72 128 76 46 80 29
## DOCUMENTACION 0 2 0 6 0 0
## OTRAS COMISIONES 156 226 121 101 62 31
## RECEPCION DE DOCUMENTOS 172 227 94 46 37 33
## REUNION CACS 72 100 18 21 23 7
## SIN ACTIVIDAD 108 141 52 46 16 33
## SUPERVISION BIOFABRICA 42 30 18 16 14 2
## TALLERES Y CAPACITACION 55 56 24 24 20 13
## TRABAJO DE OFICINA 0 0 0 0 0 0
## VISITA A CACS 79 144 36 43 19 15
## VISITA A PARCELAS 46 119 18 50 20 13
## VISITA A VIVEROS 129 114 46 47 27 16
##
## OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
## ASISTENCIA A TECNICOS 106 79 0 93
## DOCUMENTACION 0 7 0 3
## OTRAS COMISIONES 113 195 304 160
## RECEPCION DE DOCUMENTOS 133 140 0 124
## REUNION CACS 24 32 3 58
## SIN ACTIVIDAD 53 161 181 81
## SUPERVISION BIOFABRICA 9 16 2 51
## TALLERES Y CAPACITACION 66 32 10 55
## TRABAJO DE OFICINA 0 0 0 0
## VISITA A CACS 28 30 7 82
## VISITA A PARCELAS 112 22 36 53
## VISITA A VIVEROS 42 36 50 71
##
## PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
## ASISTENCIA A TECNICOS 59 111 62 0
## DOCUMENTACION 1 0 0 0
## OTRAS COMISIONES 174 137 161 27
## RECEPCION DE DOCUMENTOS 105 168 49 0
## REUNION CACS 25 46 36 0
## SIN ACTIVIDAD 55 81 60 4
## SUPERVISION BIOFABRICA 21 28 35 0
## TALLERES Y CAPACITACION 30 44 54 0
## TRABAJO DE OFICINA 0 0 0 0
## VISITA A CACS 62 88 107 0
## VISITA A PARCELAS 38 54 56 0
## VISITA A VIVEROS 77 58 70 0
##
## SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
## ASISTENCIA A TECNICOS 96 46 22 51
## DOCUMENTACION 0 5 0 1
## OTRAS COMISIONES 118 48 60 213
## RECEPCION DE DOCUMENTOS 88 95 47 49
## REUNION CACS 50 42 18 39
## SIN ACTIVIDAD 161 23 17 30
## SUPERVISION BIOFABRICA 24 20 11 19
## TALLERES Y CAPACITACION 63 29 8 20
## TRABAJO DE OFICINA 0 0 0 0
## VISITA A CACS 68 49 36 84
## VISITA A PARCELAS 53 32 12 38
## VISITA A VIVEROS 85 38 30 64
##
## TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
## ASISTENCIA A TECNICOS 66 0 3 112 7
## DOCUMENTACION 0 0 9 0 0
## OTRAS COMISIONES 149 139 92 154 29
## RECEPCION DE DOCUMENTOS 101 0 0 108 33
## REUNION CACS 55 0 0 64 12
## SIN ACTIVIDAD 108 47 42 92 26
## SUPERVISION BIOFABRICA 22 0 4 72 6
## TALLERES Y CAPACITACION 61 0 2 56 10
## TRABAJO DE OFICINA 0 0 0 0 0
## VISITA A CACS 56 0 0 61 12
## VISITA A PARCELAS 82 0 3 100 18
## VISITA A VIVEROS 63 0 11 134 54
##
## TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
## ASISTENCIA A TECNICOS 47 107
## DOCUMENTACION 0 0
## OTRAS COMISIONES 134 216
## RECEPCION DE DOCUMENTOS 233 172
## REUNION CACS 0 32
## SIN ACTIVIDAD 85 79
## SUPERVISION BIOFABRICA 14 13
## TALLERES Y CAPACITACION 40 64
## TRABAJO DE OFICINA 0 0
## VISITA A CACS 36 20
## VISITA A PARCELAS 22 32
## VISITA A VIVEROS 122 42
##
## , , = noviembre 2021
##
##
## ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
## ASISTENCIA A TECNICOS 169 107 108 42 77 79
## DOCUMENTACION 0 0 0 0 0 0
## OTRAS COMISIONES 68 199 177 60 105 121
## RECEPCION DE DOCUMENTOS 127 41 47 11 26 25
## REUNION CACS 110 127 75 22 83 31
## SIN ACTIVIDAD 39 80 43 18 115 162
## SUPERVISION BIOFABRICA 83 15 20 10 28 17
## TALLERES Y CAPACITACION 87 109 67 37 55 62
## TRABAJO DE OFICINA 321 191 219 46 165 132
## VISITA A CACS 152 94 85 22 99 42
## VISITA A PARCELAS 169 35 42 25 90 41
## VISITA A VIVEROS 203 79 78 47 141 89
##
## DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
## ASISTENCIA A TECNICOS 76 91 46 49 40 15
## DOCUMENTACION 0 0 0 0 0 0
## OTRAS COMISIONES 179 135 95 67 42 35
## RECEPCION DE DOCUMENTOS 45 31 10 23 3 10
## REUNION CACS 50 104 29 40 35 2
## SIN ACTIVIDAD 73 159 22 45 24 18
## SUPERVISION BIOFABRICA 27 46 18 19 22 1
## TALLERES Y CAPACITACION 102 101 24 35 29 19
## TRABAJO DE OFICINA 225 283 105 111 56 42
## VISITA A CACS 91 165 62 59 37 13
## VISITA A PARCELAS 44 77 43 24 44 12
## VISITA A VIVEROS 108 119 73 69 46 17
##
## OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
## ASISTENCIA A TECNICOS 65 102 39 90
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 82 131 102 127
## RECEPCION DE DOCUMENTOS 32 46 30 46
## REUNION CACS 38 35 70 73
## SIN ACTIVIDAD 68 83 133 85
## SUPERVISION BIOFABRICA 5 24 35 25
## TALLERES Y CAPACITACION 68 73 8 72
## TRABAJO DE OFICINA 163 202 141 225
## VISITA A CACS 73 54 65 65
## VISITA A PARCELAS 88 14 60 52
## VISITA A VIVEROS 69 61 80 58
##
## PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
## ASISTENCIA A TECNICOS 82 55 44 0
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 101 145 70 21
## RECEPCION DE DOCUMENTOS 13 17 6 0
## REUNION CACS 44 26 74 0
## SIN ACTIVIDAD 75 163 123 9
## SUPERVISION BIOFABRICA 18 18 20 0
## TALLERES Y CAPACITACION 53 32 60 0
## TRABAJO DE OFICINA 82 129 74 2
## VISITA A CACS 65 105 74 0
## VISITA A PARCELAS 60 56 38 0
## VISITA A VIVEROS 60 47 71 0
##
## SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
## ASISTENCIA A TECNICOS 110 29 21 51
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 176 49 35 119
## RECEPCION DE DOCUMENTOS 57 4 9 5
## REUNION CACS 61 28 28 34
## SIN ACTIVIDAD 104 56 18 80
## SUPERVISION BIOFABRICA 30 10 16 20
## TALLERES Y CAPACITACION 67 31 3 49
## TRABAJO DE OFICINA 173 105 61 77
## VISITA A CACS 97 67 53 95
## VISITA A PARCELAS 56 23 37 52
## VISITA A VIVEROS 113 57 53 78
##
## TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
## ASISTENCIA A TECNICOS 46 0 20 71 13
## DOCUMENTACION 0 0 0 0 0
## OTRAS COMISIONES 155 103 38 184 15
## RECEPCION DE DOCUMENTOS 17 29 0 30 6
## REUNION CACS 42 0 0 78 11
## SIN ACTIVIDAD 113 69 26 110 37
## SUPERVISION BIOFABRICA 12 6 3 16 9
## TALLERES Y CAPACITACION 78 38 6 84 20
## TRABAJO DE OFICINA 116 110 46 99 31
## VISITA A CACS 49 0 0 59 30
## VISITA A PARCELAS 52 0 9 44 13
## VISITA A VIVEROS 40 18 19 75 39
##
## TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
## ASISTENCIA A TECNICOS 96 96
## DOCUMENTACION 0 0
## OTRAS COMISIONES 188 203
## RECEPCION DE DOCUMENTOS 40 21
## REUNION CACS 45 59
## SIN ACTIVIDAD 93 60
## SUPERVISION BIOFABRICA 13 9
## TALLERES Y CAPACITACION 95 66
## TRABAJO DE OFICINA 213 150
## VISITA A CACS 60 54
## VISITA A PARCELAS 39 30
## VISITA A VIVEROS 86 45
##
## , , = octubre 2021
##
##
## ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
## ASISTENCIA A TECNICOS 173 127 75 52 58 64
## DOCUMENTACION 0 0 0 0 0 0
## OTRAS COMISIONES 117 205 172 70 130 105
## RECEPCION DE DOCUMENTOS 131 46 51 6 21 31
## REUNION CACS 129 61 54 19 56 36
## SIN ACTIVIDAD 7 80 36 28 124 90
## SUPERVISION BIOFABRICA 75 18 19 3 25 14
## TALLERES Y CAPACITACION 73 112 48 18 95 121
## TRABAJO DE OFICINA 334 216 225 40 137 155
## VISITA A CACS 120 56 87 33 104 61
## VISITA A PARCELAS 178 75 62 12 99 44
## VISITA A VIVEROS 217 106 98 27 131 74
##
## DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
## ASISTENCIA A TECNICOS 88 109 46 59 32 17
## DOCUMENTACION 0 0 0 0 0 0
## OTRAS COMISIONES 142 131 164 74 59 32
## RECEPCION DE DOCUMENTOS 45 36 25 13 5 5
## REUNION CACS 84 90 17 17 25 11
## SIN ACTIVIDAD 76 103 52 53 47 18
## SUPERVISION BIOFABRICA 30 41 8 15 14 8
## TALLERES Y CAPACITACION 105 152 26 47 20 17
## TRABAJO DE OFICINA 213 252 79 100 27 41
## VISITA A CACS 104 163 59 43 41 21
## VISITA A PARCELAS 50 83 35 29 31 5
## VISITA A VIVEROS 107 118 100 55 47 13
##
## OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
## ASISTENCIA A TECNICOS 60 78 14 72
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 107 157 158 181
## RECEPCION DE DOCUMENTOS 30 42 7 48
## REUNION CACS 41 37 80 95
## SIN ACTIVIDAD 70 71 149 68
## SUPERVISION BIOFABRICA 9 27 50 29
## TALLERES Y CAPACITACION 88 61 20 98
## TRABAJO DE OFICINA 127 166 62 159
## VISITA A CACS 56 72 86 66
## VISITA A PARCELAS 50 36 64 89
## VISITA A VIVEROS 63 71 70 63
##
## PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
## ASISTENCIA A TECNICOS 89 54 69 0
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 126 170 132 21
## RECEPCION DE DOCUMENTOS 20 18 4 0
## REUNION CACS 28 35 58 0
## SIN ACTIVIDAD 55 135 87 10
## SUPERVISION BIOFABRICA 13 18 26 0
## TALLERES Y CAPACITACION 72 54 50 0
## TRABAJO DE OFICINA 109 115 76 0
## VISITA A CACS 52 100 58 0
## VISITA A PARCELAS 47 48 40 0
## VISITA A VIVEROS 45 75 55 0
##
## SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
## ASISTENCIA A TECNICOS 93 59 14 80
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 183 21 38 98
## RECEPCION DE DOCUMENTOS 32 9 7 19
## REUNION CACS 41 36 21 52
## SIN ACTIVIDAD 108 22 13 23
## SUPERVISION BIOFABRICA 33 11 10 29
## TALLERES Y CAPACITACION 89 24 11 51
## TRABAJO DE OFICINA 152 149 40 100
## VISITA A CACS 77 49 49 97
## VISITA A PARCELAS 36 28 30 47
## VISITA A VIVEROS 86 56 40 65
##
## TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
## ASISTENCIA A TECNICOS 48 0 3 56 12
## DOCUMENTACION 0 0 0 0 0
## OTRAS COMISIONES 194 134 52 132 11
## RECEPCION DE DOCUMENTOS 25 34 9 17 1
## REUNION CACS 46 0 0 97 21
## SIN ACTIVIDAD 99 52 27 100 26
## SUPERVISION BIOFABRICA 17 0 0 12 4
## TALLERES Y CAPACITACION 53 42 6 132 14
## TRABAJO DE OFICINA 104 118 48 93 27
## VISITA A CACS 31 0 0 61 26
## VISITA A PARCELAS 47 0 7 69 23
## VISITA A VIVEROS 37 17 21 58 34
##
## TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
## ASISTENCIA A TECNICOS 72 95
## DOCUMENTACION 0 0
## OTRAS COMISIONES 161 191
## RECEPCION DE DOCUMENTOS 41 44
## REUNION CACS 41 43
## SIN ACTIVIDAD 106 78
## SUPERVISION BIOFABRICA 23 9
## TALLERES Y CAPACITACION 117 87
## TRABAJO DE OFICINA 212 149
## VISITA A CACS 51 38
## VISITA A PARCELAS 42 28
## VISITA A VIVEROS 103 28
##
## , , = septiembre 2021
##
##
## ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
## ASISTENCIA A TECNICOS 203 118 109 48 75 59
## DOCUMENTACION 0 0 0 0 0 0
## OTRAS COMISIONES 54 175 148 29 129 131
## RECEPCION DE DOCUMENTOS 108 74 52 7 27 34
## REUNION CACS 67 42 49 7 50 29
## SIN ACTIVIDAD 79 100 61 57 161 93
## SUPERVISION BIOFABRICA 82 34 18 6 38 18
## TALLERES Y CAPACITACION 69 89 50 18 45 98
## TRABAJO DE OFICINA 292 227 201 39 131 144
## VISITA A CACS 115 54 64 43 99 47
## VISITA A PARCELAS 119 80 32 23 110 32
## VISITA A VIVEROS 225 94 69 28 161 114
##
## DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
## ASISTENCIA A TECNICOS 94 95 61 53 36 31
## DOCUMENTACION 0 0 0 0 0 0
## OTRAS COMISIONES 133 238 96 58 52 24
## RECEPCION DE DOCUMENTOS 44 56 25 21 4 15
## REUNION CACS 94 77 33 35 38 14
## SIN ACTIVIDAD 75 122 56 79 22 61
## SUPERVISION BIOFABRICA 31 33 15 17 17 3
## TALLERES Y CAPACITACION 65 74 28 41 25 20
## TRABAJO DE OFICINA 198 248 111 103 37 49
## VISITA A CACS 96 109 65 58 52 12
## VISITA A PARCELAS 58 83 36 25 28 16
## VISITA A VIVEROS 138 98 92 61 55 18
##
## OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
## ASISTENCIA A TECNICOS 84 62 24 87
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 99 178 261 124
## RECEPCION DE DOCUMENTOS 13 14 3 51
## REUNION CACS 54 42 27 84
## SIN ACTIVIDAD 59 83 139 90
## SUPERVISION BIOFABRICA 7 15 11 38
## TALLERES Y CAPACITACION 110 37 5 46
## TRABAJO DE OFICINA 148 140 30 194
## VISITA A CACS 54 78 48 92
## VISITA A PARCELAS 47 32 26 67
## VISITA A VIVEROS 59 69 77 75
##
## PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
## ASISTENCIA A TECNICOS 67 45 69 0
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 156 164 115 10
## RECEPCION DE DOCUMENTOS 36 28 7 0
## REUNION CACS 28 45 60 0
## SIN ACTIVIDAD 66 114 109 22
## SUPERVISION BIOFABRICA 12 16 43 0
## TALLERES Y CAPACITACION 27 26 34 0
## TRABAJO DE OFICINA 92 108 63 0
## VISITA A CACS 48 102 80 0
## VISITA A PARCELAS 42 65 52 0
## VISITA A VIVEROS 62 61 84 0
##
## SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
## ASISTENCIA A TECNICOS 91 58 12 50
## DOCUMENTACION 0 0 0 0
## OTRAS COMISIONES 128 70 26 164
## RECEPCION DE DOCUMENTOS 29 33 4 36
## REUNION CACS 62 35 21 46
## SIN ACTIVIDAD 113 21 20 32
## SUPERVISION BIOFABRICA 33 16 3 21
## TALLERES Y CAPACITACION 52 26 5 29
## TRABAJO DE OFICINA 145 140 39 62
## VISITA A CACS 104 31 37 82
## VISITA A PARCELAS 67 23 20 42
## VISITA A VIVEROS 120 38 33 65
##
## TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
## ASISTENCIA A TECNICOS 48 2 4 74 15
## DOCUMENTACION 0 0 0 0 0
## OTRAS COMISIONES 133 119 112 142 19
## RECEPCION DE DOCUMENTOS 30 16 6 43 6
## REUNION CACS 48 0 3 55 11
## SIN ACTIVIDAD 116 81 22 98 52
## SUPERVISION BIOFABRICA 21 0 1 39 4
## TALLERES Y CAPACITACION 82 27 0 71 9
## TRABAJO DE OFICINA 91 70 37 95 26
## VISITA A CACS 73 0 0 70 31
## VISITA A PARCELAS 81 0 0 97 18
## VISITA A VIVEROS 61 12 10 127 24
##
## TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
## ASISTENCIA A TECNICOS 87 101
## DOCUMENTACION 0 0
## OTRAS COMISIONES 151 169
## RECEPCION DE DOCUMENTOS 49 32
## REUNION CACS 37 37
## SIN ACTIVIDAD 91 86
## SUPERVISION BIOFABRICA 21 10
## TALLERES Y CAPACITACION 98 35
## TRABAJO DE OFICINA 179 176
## VISITA A CACS 39 46
## VISITA A PARCELAS 38 36
## VISITA A VIVEROS 86 69
ver los nombres
names(df9)
## [1] "FECHA.DE.REGISTRO" "MID.MONEDERO" "PLACA"
## [4] "RECURSO.PROPIO" "TERRITORIO" "NOMBRE_DIA"
## [7] "PERIODO" "MARCA" "actividades_diax"
## [10] "ACTIVIDAD" "ACTIVIDADES_SEPARADAS"
ver los periodos
table(df9$PERIODO)
##
## agosto 2021 noviembre 2021 octubre 2021 septiembre 2021
## 19425 21633 21435 21170
names(table(df9$TERRITORIO))
## [1] "ACAYUCAN" "BALANCAN"
## [3] "CHIHUAHUA" "COLIMA"
## [5] "COMALCALCO" "CORDOBA"
## [7] "DURANGO" "GUERRERO"
## [9] "HIDALGO" "MICHOACAN"
## [11] "MORELOS" "NAYARIT"
## [13] "OAXACA (ISTMO)" "OAXACA (MIXTECA)"
## [15] "OCOSINGO" "PALENQUE"
## [17] "PAPANTLA" "PICHUCALCO"
## [19] "PUEBLA" "SAN CRISTOBAL"
## [21] "SAN LUIS POTOSI" "SINALOA"
## [23] "TAMAULIPAS" "TANTOYUCA"
## [25] "TAPACHULA" "TAPACHULA PESN"
## [27] "TAPACHULA ZE" "TEAPA"
## [29] "TLAXCALA" "TZUCACAB (OTHON P. BLANCO)"
## [31] "XPUJIL (CAMPECHE)"
cambiar los periodos
df10 <- df9
df10$PERIODO[df10$PERIODO == "agosto 2021"] <- "a- agosto 2021"
df10$PERIODO[df10$PERIODO == "septiembre 2021"] <- "b- septiembre 2021"
df10$PERIODO[df10$PERIODO == "octubre 2021"] <- "c- octubre 2021"
df10$PERIODO[df10$PERIODO == "noviembre 2021"] <- "d- noviembre 2021"
Aquí finaliza la limpieza
#write.csv(df10,"C:/Users/HP/Desktop/BORRAR/df10.csv", row.names = FALSE)