Importar la base de datos

library(openxlsx)
url3<-"https://docs.google.com/spreadsheets/d/e/2PACX-1vRjYC7zQcOD9IO11p0A67c0X25Ac4lqC_nC7tLEaLBJxxPzssDg0fTm_NQ9ygX7h3joYDgx_tnTp4PN/pub?output=xlsx"
df = read.xlsx(url3)
#head(df,5)

Limpiar la base

ver filas y columnas

dim(df)
## [1] 2113   40

nombre de columnas

names(df)
##  [1] "FECHA.DE.REGISTRO" "MID.MONEDERO"      "TERRITORIO"       
##  [4] "PERIODO"           "MARCA"             "SUBMARCA"         
##  [7] "PLACA"             "DIA.1"             "DIA.2"            
## [10] "DIA.3"             "DIA.4"             "DIA.5"            
## [13] "DIA.6"             "DIA.7"             "DIA.8"            
## [16] "DIA.9"             "DIA.10"            "DIA.11"           
## [19] "DIA.12"            "DIA.13"            "DIA.14"           
## [22] "DIA.15"            "DIA.16"            "DIA.17"           
## [25] "DIA.18"            "DIA.19"            "DIA.20"           
## [28] "DIA.21"            "DIA.22"            "DIA.23"           
## [31] "DIA.24"            "DIA.25"            "DIA.26"           
## [34] "DIA.27"            "DIA.28"            "DIA.29"           
## [37] "DIA.30"            "DIA.31"            "RECURSO.PROPIO"   
## [40] "DUPLICADO"

*solo ver la estructura

#str(df)

Transformar a mayúsculas

df[,8]<- toupper(df[,8])

Quitar Acentos

df$DIA.1<- chartr("ÁÉÍÓÚ", "AEIOU", df$DIA.1)

Ciclo para transformar a mayúscula y quitar acentos

for(i in 9:38){
  df[,i]<- toupper(df[,i])
  df[,i]<- chartr("ÁÉÍÓÚ", "AEIOU",df[,i])
}

*ver como quedo son duplicados y sin acentos

#str(df)

Quitar columna “duplicado”

df$DUPLICADO<-NULL

Identificar duplicados por columnas

df[duplicated(df),]
##  [1] FECHA.DE.REGISTRO MID.MONEDERO      TERRITORIO        PERIODO          
##  [5] MARCA             SUBMARCA          PLACA             DIA.1            
##  [9] DIA.2             DIA.3             DIA.4             DIA.5            
## [13] DIA.6             DIA.7             DIA.8             DIA.9            
## [17] DIA.10            DIA.11            DIA.12            DIA.13           
## [21] DIA.14            DIA.15            DIA.16            DIA.17           
## [25] DIA.18            DIA.19            DIA.20            DIA.21           
## [29] DIA.22            DIA.23            DIA.24            DIA.25           
## [33] DIA.26            DIA.27            DIA.28            DIA.29           
## [37] DIA.30            DIA.31            RECURSO.PROPIO   
## <0 rows> (or 0-length row.names)

Eliminar duplicados

df <- df[!duplicated(df),]#eliminar duplicados

No se puede porque la columna fecha siempre será diferente

Vamos a crear una nueva columna que agrupe md.monedero y periodo

df2<-df

df2$unidos<-paste(df$PERIODO,df$MID.MONEDERO ,sep = "_")

#head(df2$unidos,5) #ver como quedan los varoles

*ver como queda con la nueva columna “unidos”

#head(df2,10)

exportar en csv para ver

#write.csv(df2,"C:/Users/HP/Desktop/BORRAR/df2.csv", row.names = FALSE)

llamar a la artilleria pesada

library(tidyverse)

Ver los duplicados que hay y guardarlo en “dfduplicados”, despues ordentar los duplicados

dfduplicados <- df2[duplicated(df2$unidos), ] #eliminar duplicados
dfduplicados <- arrange(dfduplicados,unidos) #ordenar duplicados

#head(dfduplicados,20)

exportar duplicados base

#write.csv(dfduplicados,"C:/Users/HP/Desktop/BORRAR/dfduplicados.csv", row.names = FALSE)

Eliminar duplicados por la columna unidos

df3 <- df2[!duplicated(df2$unidos), ]
dim(df3)
## [1] 1986   40

se redujeron de 2113 a 1986


*nuestro df3 ya no tiene duplicados

df3[duplicated(df3$unidos), ]
##  [1] FECHA.DE.REGISTRO MID.MONEDERO      TERRITORIO        PERIODO          
##  [5] MARCA             SUBMARCA          PLACA             DIA.1            
##  [9] DIA.2             DIA.3             DIA.4             DIA.5            
## [13] DIA.6             DIA.7             DIA.8             DIA.9            
## [17] DIA.10            DIA.11            DIA.12            DIA.13           
## [21] DIA.14            DIA.15            DIA.16            DIA.17           
## [25] DIA.18            DIA.19            DIA.20            DIA.21           
## [29] DIA.22            DIA.23            DIA.24            DIA.25           
## [33] DIA.26            DIA.27            DIA.28            DIA.29           
## [37] DIA.30            DIA.31            RECURSO.PROPIO    unidos           
## <0 rows> (or 0-length row.names)
names(df3)
##  [1] "FECHA.DE.REGISTRO" "MID.MONEDERO"      "TERRITORIO"       
##  [4] "PERIODO"           "MARCA"             "SUBMARCA"         
##  [7] "PLACA"             "DIA.1"             "DIA.2"            
## [10] "DIA.3"             "DIA.4"             "DIA.5"            
## [13] "DIA.6"             "DIA.7"             "DIA.8"            
## [16] "DIA.9"             "DIA.10"            "DIA.11"           
## [19] "DIA.12"            "DIA.13"            "DIA.14"           
## [22] "DIA.15"            "DIA.16"            "DIA.17"           
## [25] "DIA.18"            "DIA.19"            "DIA.20"           
## [28] "DIA.21"            "DIA.22"            "DIA.23"           
## [31] "DIA.24"            "DIA.25"            "DIA.26"           
## [34] "DIA.27"            "DIA.28"            "DIA.29"           
## [37] "DIA.30"            "DIA.31"            "RECURSO.PROPIO"   
## [40] "unidos"

vamos a cambiar el orden a tydi

df4 <- df3 %>% gather(key = NOMBRE_DIA, value = NOMBRE_ACTIVIDADES, 8:38)

nuevos nombres

names(df4)
##  [1] "FECHA.DE.REGISTRO"  "MID.MONEDERO"       "TERRITORIO"        
##  [4] "PERIODO"            "MARCA"              "SUBMARCA"          
##  [7] "PLACA"              "RECURSO.PROPIO"     "unidos"            
## [10] "NOMBRE_DIA"         "NOMBRE_ACTIVIDADES"

exportar df4

#write.csv(df4,"C:/Users/HP/Desktop/BORRAR/df4.csv", row.names = FALSE)

Exportar en formato tidy

¿Hay valores raros? ver si hay que homogeneizar

names(table(df4$TERRITORIO))
##  [1] "ACAYUCAN"                   "BALANCAN"                  
##  [3] "CHIHUAHUA"                  "COLIMA"                    
##  [5] "COMALCALCO"                 "CORDOBA"                   
##  [7] "DURANGO"                    "GUERRERO"                  
##  [9] "HIDALGO"                    "MICHOACAN"                 
## [11] "MORELOS"                    "NAYARIT"                   
## [13] "OAXACA (ISTMO)"             "OAXACA (MIXTECA)"          
## [15] "OCOSINGO"                   "PALENQUE"                  
## [17] "PAPANTLA"                   "PICHUCALCO"                
## [19] "PUEBLA"                     "SAN CRISTOBAL"             
## [21] "SAN LUIS POTOSI"            "SINALOA"                   
## [23] "TAMAULIPAS"                 "TANTOYUCA"                 
## [25] "TAPACHULA"                  "TAPACHULA PESN"            
## [27] "TAPACHULA Z.E.E"            "TAPACHULA ZE"              
## [29] "TEAPA"                      "TLAXCALA"                  
## [31] "TZUCACAB (OTHON P. BLANCO)" "XPUJIL (CAMPECHE)"
#ver numero de columnas
dim(df4)
## [1] 61566    11
names(df4)
##  [1] "FECHA.DE.REGISTRO"  "MID.MONEDERO"       "TERRITORIO"        
##  [4] "PERIODO"            "MARCA"              "SUBMARCA"          
##  [7] "PLACA"              "RECURSO.PROPIO"     "unidos"            
## [10] "NOMBRE_DIA"         "NOMBRE_ACTIVIDADES"

reordenar las columnas

#seleccionar columnas menos isla,ancho_pico,
df5<-df4[,c(1,2,7,8,9,6,3,10,4,5,11)]

nombre columnas re-ordenadas

names(df5)
##  [1] "FECHA.DE.REGISTRO"  "MID.MONEDERO"       "PLACA"             
##  [4] "RECURSO.PROPIO"     "unidos"             "SUBMARCA"          
##  [7] "TERRITORIO"         "NOMBRE_DIA"         "PERIODO"           
## [10] "MARCA"              "NOMBRE_ACTIVIDADES"

en ciclo for imprimir solo nombres

for(i in 7:10){
  nombres <- names(table(df5[,i]))
  print(nombres)
  cat("\n\n##########################################################################\n\n")

}
##  [1] "ACAYUCAN"                   "BALANCAN"                  
##  [3] "CHIHUAHUA"                  "COLIMA"                    
##  [5] "COMALCALCO"                 "CORDOBA"                   
##  [7] "DURANGO"                    "GUERRERO"                  
##  [9] "HIDALGO"                    "MICHOACAN"                 
## [11] "MORELOS"                    "NAYARIT"                   
## [13] "OAXACA (ISTMO)"             "OAXACA (MIXTECA)"          
## [15] "OCOSINGO"                   "PALENQUE"                  
## [17] "PAPANTLA"                   "PICHUCALCO"                
## [19] "PUEBLA"                     "SAN CRISTOBAL"             
## [21] "SAN LUIS POTOSI"            "SINALOA"                   
## [23] "TAMAULIPAS"                 "TANTOYUCA"                 
## [25] "TAPACHULA"                  "TAPACHULA PESN"            
## [27] "TAPACHULA Z.E.E"            "TAPACHULA ZE"              
## [29] "TEAPA"                      "TLAXCALA"                  
## [31] "TZUCACAB (OTHON P. BLANCO)" "XPUJIL (CAMPECHE)"         
## 
## 
## ##########################################################################
## 
##  [1] "DIA.1"  "DIA.10" "DIA.11" "DIA.12" "DIA.13" "DIA.14" "DIA.15" "DIA.16"
##  [9] "DIA.17" "DIA.18" "DIA.19" "DIA.2"  "DIA.20" "DIA.21" "DIA.22" "DIA.23"
## [17] "DIA.24" "DIA.25" "DIA.26" "DIA.27" "DIA.28" "DIA.29" "DIA.3"  "DIA.30"
## [25] "DIA.31" "DIA.4"  "DIA.5"  "DIA.6"  "DIA.7"  "DIA.8"  "DIA.9" 
## 
## 
## ##########################################################################
## 
## [1] "44501.0"         "agosto 2021"     "noviembre 2021"  "octubre 2021"   
## [5] "septiembre 2021"
## 
## 
## ##########################################################################
## 
##  [1] "-APOYO"                             "APOYO-APOYO"                       
##  [3] "CHEVROLET-SILVERADO"                "DODGE-RAM 1500"                    
##  [5] "DODGE-RAM 1500 (NAC)"               "DODGE-RAM 1500 4X4 V6"             
##  [7] "DODGE-RAM 2500"                     "DODGE-RAM 4000"                    
##  [9] "DODGE-RAM1500"                      "DODGE-SILVERADO"                   
## [11] "DOGDE-RAM 1500"                     "FORD-RANGER"                       
## [13] "FORD -RANGER"                       "GENERAL MOTORS-CHEVROLET SILVERADO"
## [15] "MITSUBISHI-L200"                    "NISSAN-FRONTIER"                   
## [17] "NISSAN-NP300"                       "NO APLICA-NO APLICA"               
## [19] "TOYOTA-HILUX"                       "VOLKSWAGEN-AMAROK"                 
## 
## 
## ##########################################################################

en ciclo for imprimir cuenta

for(i in 7:10){
  nombres <- table(df5[,i])
  print(nombres)
  cat("\n\n##########################################################################\n\n")

}
## 
##                   ACAYUCAN                   BALANCAN 
##                       2728                       2604 
##                  CHIHUAHUA                     COLIMA 
##                       2604                        713 
##                 COMALCALCO                    CORDOBA 
##                       2728                       2604 
##                    DURANGO                   GUERRERO 
##                       2604                       4216 
##                    HIDALGO                  MICHOACAN 
##                       1581                       1488 
##                    MORELOS                    NAYARIT 
##                        868                        682 
##             OAXACA (ISTMO)           OAXACA (MIXTECA) 
##                       2480                       2480 
##                   OCOSINGO                   PALENQUE 
##                       2356                       2728 
##                   PAPANTLA                 PICHUCALCO 
##                       1860                       2728 
##                     PUEBLA              SAN CRISTOBAL 
##                       2108                        124 
##            SAN LUIS POTOSI                    SINALOA 
##                       2511                       1364 
##                 TAMAULIPAS                  TANTOYUCA 
##                        744                       2015 
##                  TAPACHULA             TAPACHULA PESN 
##                       2604                        961 
##            TAPACHULA Z.E.E               TAPACHULA ZE 
##                         31                        620 
##                      TEAPA                   TLAXCALA 
##                       2480                        744 
## TZUCACAB (OTHON P. BLANCO)          XPUJIL (CAMPECHE) 
##                       2635                       2573 
## 
## 
## ##########################################################################
## 
## 
##  DIA.1 DIA.10 DIA.11 DIA.12 DIA.13 DIA.14 DIA.15 DIA.16 DIA.17 DIA.18 DIA.19 
##   1986   1986   1986   1986   1986   1986   1986   1986   1986   1986   1986 
##  DIA.2 DIA.20 DIA.21 DIA.22 DIA.23 DIA.24 DIA.25 DIA.26 DIA.27 DIA.28 DIA.29 
##   1986   1986   1986   1986   1986   1986   1986   1986   1986   1986   1986 
##  DIA.3 DIA.30 DIA.31  DIA.4  DIA.5  DIA.6  DIA.7  DIA.8  DIA.9 
##   1986   1986   1986   1986   1986   1986   1986   1986   1986 
## 
## 
## ##########################################################################
## 
## 
##         44501.0     agosto 2021  noviembre 2021    octubre 2021 septiembre 2021 
##              62           15252           15345           15469           15438 
## 
## 
## ##########################################################################
## 
## 
##                             -APOYO                        APOYO-APOYO 
##                                155                                124 
##                CHEVROLET-SILVERADO                     DODGE-RAM 1500 
##                              12679                              18910 
##               DODGE-RAM 1500 (NAC)              DODGE-RAM 1500 4X4 V6 
##                                403                                217 
##                     DODGE-RAM 2500                     DODGE-RAM 4000 
##                                 62                                248 
##                      DODGE-RAM1500                    DODGE-SILVERADO 
##                               2418                                 62 
##                     DOGDE-RAM 1500                        FORD-RANGER 
##                                589                               1240 
##                       FORD -RANGER GENERAL MOTORS-CHEVROLET SILVERADO 
##                                 62                                 93 
##                    MITSUBISHI-L200                    NISSAN-FRONTIER 
##                                 62                               1860 
##                       NISSAN-NP300                NO APLICA-NO APLICA 
##                              11036                                 62 
##                       TOYOTA-HILUX                  VOLKSWAGEN-AMAROK 
##                              11222                                 62 
## 
## 
## ##########################################################################

Vamos a hacer una nueva liempieza de datos
Hay varios caracteres que hay que transformar a factores para poder sacar el procentaje

str(df5)
## 'data.frame':    61566 obs. of  11 variables:
##  $ FECHA.DE.REGISTRO : num  44441 44441 44448 44441 44441 ...
##  $ MID.MONEDERO      : chr  "M-1860" "M-4955" "M-4542" "M-4872" ...
##  $ PLACA             : chr  "NNN4822" "CY14422" "NTF3747" "CY14412" ...
##  $ RECURSO.PROPIO    : num  0 0 2903 0 0 ...
##  $ unidos            : chr  "agosto 2021_M-1860" "agosto 2021_M-4955" "agosto 2021_M-4542" "agosto 2021_M-4872" ...
##  $ SUBMARCA          : chr  "AFAHR6CA2LP108069" "3N6AD33A1LK813300" "3C65RBDGOMG622267" "3N6AD33A1LK815557" ...
##  $ TERRITORIO        : chr  "BALANCAN" "TAPACHULA" "OCOSINGO" "TAPACHULA" ...
##  $ NOMBRE_DIA        : chr  "DIA.1" "DIA.1" "DIA.1" "DIA.1" ...
##  $ PERIODO           : chr  "agosto 2021" "agosto 2021" "agosto 2021" "agosto 2021" ...
##  $ MARCA             : chr  "FORD-RANGER" "NISSAN-NP300" "DODGE-RAM 1500" "NISSAN-NP300" ...
##  $ NOMBRE_ACTIVIDADES: chr  "RECEPCION DE DOCUMENTOS" "SIN ACTIVIDAD" "SIN ACTIVIDAD,OTRAS COMISIONES" "SIN ACTIVIDAD" ...

homogeneizar , se debe hacer antes de convertir a factores

df5$PERIODO[df5$PERIODO == "44501.0"] <- "noviembre 2021"
df5$TERRITORIO[df5$TERRITORIO == "TAPACHULA Z.E.E"] <- "TAPACHULA ZE"


df5$MARCA[df5$MARCA == "FORD -RANGER"|df5$MARCA == "FORD-RANGER"] <- "FORD_RANGER"

df5$MARCA[df5$MARCA == "DODGE-SILVERADO"|
            df5$MARCA =="GENERAL MOTORS-CHEVROLET SILVERADO"|
            df5$MARCA == "DODGE-SILVERADO"|
            df5$MARCA == "CHEVROLET-SILVERADO"] <- "CHEVROLET_SILVERADO" 

df5$MARCA[df5$MARCA =="DODGE-RAM 1500" | df5$MARCA =="DODGE-RAM 1500 (NAC)" | df5$MARCA == "DODGE-RAM 1500 4X4 V6" | df5$MARCA == "DODGE-RAM1500"  | df5$MARCA =="DOGDE-RAM 1500"] <- "DODGE_RAM_1500" 

#eliminar filas con base acriterio

df5 <- df5[df5$MARCA != "NO APLICA-NO APLICA", ]
df5 <- df5[df5$MARCA != "-APOYO", ]
df5 <- df5[df5$MARCA != "APOYO-APOYO", ]

en ciclo for ajustados

for(i in 7:10){
  nombres <- table(df5[,i])
  print(nombres)
  cat("\n\n##########################################################################\n\n")

}
## 
##                   ACAYUCAN                   BALANCAN 
##                       2728                       2604 
##                  CHIHUAHUA                     COLIMA 
##                       2604                        713 
##                 COMALCALCO                    CORDOBA 
##                       2728                       2604 
##                    DURANGO                   GUERRERO 
##                       2604                       4092 
##                    HIDALGO                  MICHOACAN 
##                       1581                       1488 
##                    MORELOS                    NAYARIT 
##                        837                        682 
##             OAXACA (ISTMO)           OAXACA (MIXTECA) 
##                       2480                       2480 
##                   OCOSINGO                   PALENQUE 
##                       2356                       2728 
##                   PAPANTLA                 PICHUCALCO 
##                       1860                       2728 
##                     PUEBLA              SAN CRISTOBAL 
##                       2108                        124 
##            SAN LUIS POTOSI                    SINALOA 
##                       2418                       1364 
##                 TAMAULIPAS                  TANTOYUCA 
##                        744                       2015 
##                  TAPACHULA             TAPACHULA PESN 
##                       2604                        961 
##               TAPACHULA ZE                      TEAPA 
##                        620                       2480 
##                   TLAXCALA TZUCACAB (OTHON P. BLANCO) 
##                        744                       2573 
##          XPUJIL (CAMPECHE) 
##                       2573 
## 
## 
## ##########################################################################
## 
## 
##  DIA.1 DIA.10 DIA.11 DIA.12 DIA.13 DIA.14 DIA.15 DIA.16 DIA.17 DIA.18 DIA.19 
##   1975   1975   1975   1975   1975   1975   1975   1975   1975   1975   1975 
##  DIA.2 DIA.20 DIA.21 DIA.22 DIA.23 DIA.24 DIA.25 DIA.26 DIA.27 DIA.28 DIA.29 
##   1975   1975   1975   1975   1975   1975   1975   1975   1975   1975   1975 
##  DIA.3 DIA.30 DIA.31  DIA.4  DIA.5  DIA.6  DIA.7  DIA.8  DIA.9 
##   1975   1975   1975   1975   1975   1975   1975   1975   1975 
## 
## 
## ##########################################################################
## 
## 
##     agosto 2021  noviembre 2021    octubre 2021 septiembre 2021 
##           15221           15283           15376           15345 
## 
## 
## ##########################################################################
## 
## 
## CHEVROLET_SILVERADO      DODGE-RAM 2500      DODGE-RAM 4000      DODGE_RAM_1500 
##               12834                  62                 248               22537 
##         FORD_RANGER     MITSUBISHI-L200     NISSAN-FRONTIER        NISSAN-NP300 
##                1302                  62                1860               11036 
##        TOYOTA-HILUX   VOLKSWAGEN-AMAROK 
##               11222                  62 
## 
## 
## ##########################################################################
str(df5)
## 'data.frame':    61225 obs. of  11 variables:
##  $ FECHA.DE.REGISTRO : num  44441 44441 44448 44441 44441 ...
##  $ MID.MONEDERO      : chr  "M-1860" "M-4955" "M-4542" "M-4872" ...
##  $ PLACA             : chr  "NNN4822" "CY14422" "NTF3747" "CY14412" ...
##  $ RECURSO.PROPIO    : num  0 0 2903 0 0 ...
##  $ unidos            : chr  "agosto 2021_M-1860" "agosto 2021_M-4955" "agosto 2021_M-4542" "agosto 2021_M-4872" ...
##  $ SUBMARCA          : chr  "AFAHR6CA2LP108069" "3N6AD33A1LK813300" "3C65RBDGOMG622267" "3N6AD33A1LK815557" ...
##  $ TERRITORIO        : chr  "BALANCAN" "TAPACHULA" "OCOSINGO" "TAPACHULA" ...
##  $ NOMBRE_DIA        : chr  "DIA.1" "DIA.1" "DIA.1" "DIA.1" ...
##  $ PERIODO           : chr  "agosto 2021" "agosto 2021" "agosto 2021" "agosto 2021" ...
##  $ MARCA             : chr  "FORD_RANGER" "NISSAN-NP300" "DODGE_RAM_1500" "NISSAN-NP300" ...
##  $ NOMBRE_ACTIVIDADES: chr  "RECEPCION DE DOCUMENTOS" "SIN ACTIVIDAD" "SIN ACTIVIDAD,OTRAS COMISIONES" "SIN ACTIVIDAD" ...

quitar algunas columnas

df6 <- df5[,c(-5,-6)]
#write.csv(df6,"C:/Users/HP/Desktop/BORRAR/df6.csv", row.names = FALSE)

Hay que checar la columnas nombre_actividades, todas las actividades estan juntas

head(df6$NOMBRE_ACTIVIDADES,20)
##  [1] "RECEPCION DE DOCUMENTOS"        "SIN ACTIVIDAD"                 
##  [3] "SIN ACTIVIDAD,OTRAS COMISIONES" "SIN ACTIVIDAD"                 
##  [5] "SIN ACTIVIDAD"                  "SIN ACTIVIDAD"                 
##  [7] "VISITA A VIVEROS"               "SIN ACTIVIDAD"                 
##  [9] "SIN ACTIVIDAD"                  "SIN ACTIVIDAD"                 
## [11] "SIN ACTIVIDAD"                  "SIN ACTIVIDAD"                 
## [13] "SIN ACTIVIDAD"                  "VISITA A CACS"                 
## [15] "SIN ACTIVIDAD"                  "SIN ACTIVIDAD"                 
## [17] "SIN ACTIVIDAD"                  "OTRAS COMISIONES"              
## [19] "SIN ACTIVIDAD"                  "SIN ACTIVIDAD"

Parentesis (ver la library string)

texto <- "esta es, una, cadena, e teexto"
sum(str_detect(texto,",")) #detectar las veces en las que esta la coma
## [1] 1
str_count(texto, "[aeiou]") #veces que aparecenlas vocales
## [1] 12
str_count(texto, ",") #veces que aparece la coma
## [1] 3

lo anterior nos servira para contar las actividades que hay dentro de la columna actividades, a df6 le vamos a agregar una columna con el numero de actividades que realizó, contando el número de comas

df6$actividades_diax <- str_count(df6$NOMBRE_ACTIVIDADES, ",")+1
#head(df6,30)

va a separar la columna “NOMBRE ACTIVIDADES” y va a hacer 10 nuevas columnas que empiecen con nombre A

df7 <- df6 %>%
    separate(NOMBRE_ACTIVIDADES,paste("A",1:10),sep=',')
## Warning: Expected 10 pieces. Missing pieces filled with `NA` in 61225 rows [1,
## 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].

podemos ver que hay un aumento de columnas de 9 a 18

dim(df7)
## [1] 61225    19
sum(is.na(df7[,9:18]))
## [1] 528587
sum(is.na(df7[,9:18]))
## [1] 528587

ver los sin actividad

#df7[df7[,9:18]!="SIN ACTIVIDAD",]

ver como queda la base df7

#head(df7,10)
dim(df7)
## [1] 61225    19

Parentesis extra, contar valores válidos, longitud, menos nulos

length(df7[3,9:18])-sum(is.na(df7[3,9:18]))
## [1] 2

exportar el df7 para ver como vamos

#write.csv(df7,"C:/Users/HP/Desktop/BORRAR/df7.csv", row.names = FALSE)

Vamos ahora a aplicar lo de una sola columna formato tydi

names(df7)
##  [1] "FECHA.DE.REGISTRO" "MID.MONEDERO"      "PLACA"            
##  [4] "RECURSO.PROPIO"    "TERRITORIO"        "NOMBRE_DIA"       
##  [7] "PERIODO"           "MARCA"             "A 1"              
## [10] "A 2"               "A 3"               "A 4"              
## [13] "A 5"               "A 6"               "A 7"              
## [16] "A 8"               "A 9"               "A 10"             
## [19] "actividades_diax"

volvemos a aplicar a formato tidy

df8 <- df7 %>% gather(key = ACTIVIDAD , value = ACTIVIDADES_SEPARADAS, 9:18)

ahora si son un buen de filas, pero se redujeron las columnas

dim(df8)
## [1] 612250     11
library(mice) #para identificar valores perdidos
md.pattern(df8)

##        FECHA.DE.REGISTRO MID.MONEDERO PLACA TERRITORIO NOMBRE_DIA PERIODO MARCA
## 79227                  1            1     1          1          1       1     1
## 500783                 1            1     1          1          1       1     1
## 4436                   1            1     1          1          1       1     1
## 27804                  1            1     1          1          1       1     1
##                        0            0     0          0          0       0     0
##        actividades_diax ACTIVIDAD RECURSO.PROPIO ACTIVIDADES_SEPARADAS       
## 79227                 1         1              1                     1      0
## 500783                1         1              1                     0      1
## 4436                  1         1              0                     1      1
## 27804                 1         1              0                     0      2
##                       0         0          32240                528587 560827

En recurso propio encontró 32240 en actividades separadas 528587 lo que da una sume de 560827

#write.csv(df8,"C:/Users/HP/Desktop/BORRAR/df8.csv", row.names = FALSE)

Vamos a quedarnos con los datos distintos de nulo, concretamente en la columna “Actividades separadas”

df9 <- df8[!is.na(df8$ACTIVIDADES_SEPARADAS),]

reducimos las observaciones a 83663

dim(df9)
## [1] 83663    11
#write.csv(df9,"C:/Users/HP/Desktop/BORRAR/df9.csv", row.names = FALSE)
md.pattern(df9)

##       FECHA.DE.REGISTRO MID.MONEDERO PLACA TERRITORIO NOMBRE_DIA PERIODO MARCA
## 79227                 1            1     1          1          1       1     1
## 4436                  1            1     1          1          1       1     1
##                       0            0     0          0          0       0     0
##       actividades_diax ACTIVIDAD ACTIVIDADES_SEPARADAS RECURSO.PROPIO     
## 79227                1         1                     1              1    0
## 4436                 1         1                     1              0    1
##                      0         0                     0           4436 4436

Aún hay 4436 en la columna recurso propio , el total es 4436


cambiar valores nulos por 0 en la columna recurso propio

 df9$RECURSO.PROPIO[is.na(df9$RECURSO.PROPIO)] <- 0

listo, sin valores nulos

md.pattern(df9)
##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

##       FECHA.DE.REGISTRO MID.MONEDERO PLACA RECURSO.PROPIO TERRITORIO NOMBRE_DIA
## 83663                 1            1     1              1          1          1
##                       0            0     0              0          0          0
##       PERIODO MARCA actividades_diax ACTIVIDAD ACTIVIDADES_SEPARADAS  
## 83663       1     1                1         1                     1 0
##             0     0                0         0                     0 0
str(df9)
## 'data.frame':    83663 obs. of  11 variables:
##  $ FECHA.DE.REGISTRO    : num  44441 44441 44448 44441 44441 ...
##  $ MID.MONEDERO         : chr  "M-1860" "M-4955" "M-4542" "M-4872" ...
##  $ PLACA                : chr  "NNN4822" "CY14422" "NTF3747" "CY14412" ...
##  $ RECURSO.PROPIO       : num  0 0 2903 0 0 ...
##  $ TERRITORIO           : chr  "BALANCAN" "TAPACHULA" "OCOSINGO" "TAPACHULA" ...
##  $ NOMBRE_DIA           : chr  "DIA.1" "DIA.1" "DIA.1" "DIA.1" ...
##  $ PERIODO              : chr  "agosto 2021" "agosto 2021" "agosto 2021" "agosto 2021" ...
##  $ MARCA                : chr  "FORD_RANGER" "NISSAN-NP300" "DODGE_RAM_1500" "NISSAN-NP300" ...
##  $ actividades_diax     : num  1 1 2 1 1 1 1 1 1 1 ...
##  $ ACTIVIDAD            : chr  "A 1" "A 1" "A 1" "A 1" ...
##  $ ACTIVIDADES_SEPARADAS: chr  "RECEPCION DE DOCUMENTOS" "SIN ACTIVIDAD" "SIN ACTIVIDAD" "SIN ACTIVIDAD" ...

exportar df9 para ver como vamos

#write.csv(df9,"C:/Users/HP/Desktop/BORRAR/df9.csv", row.names = FALSE)

EXPLORAR LA BASE

el que tiene más categrias va primero

table(df9$ACTIVIDADES_SEPARADAS,df9$TERRITORIO,df9$PERIODO)
## , ,  = agosto 2021
## 
##                          
##                           ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
##   ASISTENCIA A TECNICOS        204      125        89     37         62     112
##   DOCUMENTACION                  2        0         0      0          0       0
##   OTRAS COMISIONES             102      209       188     26        158     103
##   RECEPCION DE DOCUMENTOS      192      178       176     14         49     122
##   REUNION CACS                  78       65        58     15         42      20
##   SIN ACTIVIDAD                 93       95        62     33        102      93
##   SUPERVISION BIOFABRICA       110       17        13      3         27      21
##   TALLERES Y CAPACITACION       76       57        40      8         77      80
##   TRABAJO DE OFICINA             0        0         0      1          0       0
##   VISITA A CACS                 76       42        75     22         42      43
##   VISITA A PARCELAS            162       68        38     38        122      51
##   VISITA A VIVEROS             231       83        43     14        137      97
##                          
##                           DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
##   ASISTENCIA A TECNICOS        72      128      76        46      80      29
##   DOCUMENTACION                 0        2       0         6       0       0
##   OTRAS COMISIONES            156      226     121       101      62      31
##   RECEPCION DE DOCUMENTOS     172      227      94        46      37      33
##   REUNION CACS                 72      100      18        21      23       7
##   SIN ACTIVIDAD               108      141      52        46      16      33
##   SUPERVISION BIOFABRICA       42       30      18        16      14       2
##   TALLERES Y CAPACITACION      55       56      24        24      20      13
##   TRABAJO DE OFICINA            0        0       0         0       0       0
##   VISITA A CACS                79      144      36        43      19      15
##   VISITA A PARCELAS            46      119      18        50      20      13
##   VISITA A VIVEROS            129      114      46        47      27      16
##                          
##                           OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
##   ASISTENCIA A TECNICOS              106               79        0       93
##   DOCUMENTACION                        0                7        0        3
##   OTRAS COMISIONES                   113              195      304      160
##   RECEPCION DE DOCUMENTOS            133              140        0      124
##   REUNION CACS                        24               32        3       58
##   SIN ACTIVIDAD                       53              161      181       81
##   SUPERVISION BIOFABRICA               9               16        2       51
##   TALLERES Y CAPACITACION             66               32       10       55
##   TRABAJO DE OFICINA                   0                0        0        0
##   VISITA A CACS                       28               30        7       82
##   VISITA A PARCELAS                  112               22       36       53
##   VISITA A VIVEROS                    42               36       50       71
##                          
##                           PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
##   ASISTENCIA A TECNICOS         59        111     62             0
##   DOCUMENTACION                  1          0      0             0
##   OTRAS COMISIONES             174        137    161            27
##   RECEPCION DE DOCUMENTOS      105        168     49             0
##   REUNION CACS                  25         46     36             0
##   SIN ACTIVIDAD                 55         81     60             4
##   SUPERVISION BIOFABRICA        21         28     35             0
##   TALLERES Y CAPACITACION       30         44     54             0
##   TRABAJO DE OFICINA             0          0      0             0
##   VISITA A CACS                 62         88    107             0
##   VISITA A PARCELAS             38         54     56             0
##   VISITA A VIVEROS              77         58     70             0
##                          
##                           SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
##   ASISTENCIA A TECNICOS                96      46         22        51
##   DOCUMENTACION                         0       5          0         1
##   OTRAS COMISIONES                    118      48         60       213
##   RECEPCION DE DOCUMENTOS              88      95         47        49
##   REUNION CACS                         50      42         18        39
##   SIN ACTIVIDAD                       161      23         17        30
##   SUPERVISION BIOFABRICA               24      20         11        19
##   TALLERES Y CAPACITACION              63      29          8        20
##   TRABAJO DE OFICINA                    0       0          0         0
##   VISITA A CACS                        68      49         36        84
##   VISITA A PARCELAS                    53      32         12        38
##   VISITA A VIVEROS                     85      38         30        64
##                          
##                           TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
##   ASISTENCIA A TECNICOS          66              0            3   112        7
##   DOCUMENTACION                   0              0            9     0        0
##   OTRAS COMISIONES              149            139           92   154       29
##   RECEPCION DE DOCUMENTOS       101              0            0   108       33
##   REUNION CACS                   55              0            0    64       12
##   SIN ACTIVIDAD                 108             47           42    92       26
##   SUPERVISION BIOFABRICA         22              0            4    72        6
##   TALLERES Y CAPACITACION        61              0            2    56       10
##   TRABAJO DE OFICINA              0              0            0     0        0
##   VISITA A CACS                  56              0            0    61       12
##   VISITA A PARCELAS              82              0            3   100       18
##   VISITA A VIVEROS               63              0           11   134       54
##                          
##                           TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
##   ASISTENCIA A TECNICOS                           47               107
##   DOCUMENTACION                                    0                 0
##   OTRAS COMISIONES                               134               216
##   RECEPCION DE DOCUMENTOS                        233               172
##   REUNION CACS                                     0                32
##   SIN ACTIVIDAD                                   85                79
##   SUPERVISION BIOFABRICA                          14                13
##   TALLERES Y CAPACITACION                         40                64
##   TRABAJO DE OFICINA                               0                 0
##   VISITA A CACS                                   36                20
##   VISITA A PARCELAS                               22                32
##   VISITA A VIVEROS                               122                42
## 
## , ,  = noviembre 2021
## 
##                          
##                           ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
##   ASISTENCIA A TECNICOS        169      107       108     42         77      79
##   DOCUMENTACION                  0        0         0      0          0       0
##   OTRAS COMISIONES              68      199       177     60        105     121
##   RECEPCION DE DOCUMENTOS      127       41        47     11         26      25
##   REUNION CACS                 110      127        75     22         83      31
##   SIN ACTIVIDAD                 39       80        43     18        115     162
##   SUPERVISION BIOFABRICA        83       15        20     10         28      17
##   TALLERES Y CAPACITACION       87      109        67     37         55      62
##   TRABAJO DE OFICINA           321      191       219     46        165     132
##   VISITA A CACS                152       94        85     22         99      42
##   VISITA A PARCELAS            169       35        42     25         90      41
##   VISITA A VIVEROS             203       79        78     47        141      89
##                          
##                           DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
##   ASISTENCIA A TECNICOS        76       91      46        49      40      15
##   DOCUMENTACION                 0        0       0         0       0       0
##   OTRAS COMISIONES            179      135      95        67      42      35
##   RECEPCION DE DOCUMENTOS      45       31      10        23       3      10
##   REUNION CACS                 50      104      29        40      35       2
##   SIN ACTIVIDAD                73      159      22        45      24      18
##   SUPERVISION BIOFABRICA       27       46      18        19      22       1
##   TALLERES Y CAPACITACION     102      101      24        35      29      19
##   TRABAJO DE OFICINA          225      283     105       111      56      42
##   VISITA A CACS                91      165      62        59      37      13
##   VISITA A PARCELAS            44       77      43        24      44      12
##   VISITA A VIVEROS            108      119      73        69      46      17
##                          
##                           OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
##   ASISTENCIA A TECNICOS               65              102       39       90
##   DOCUMENTACION                        0                0        0        0
##   OTRAS COMISIONES                    82              131      102      127
##   RECEPCION DE DOCUMENTOS             32               46       30       46
##   REUNION CACS                        38               35       70       73
##   SIN ACTIVIDAD                       68               83      133       85
##   SUPERVISION BIOFABRICA               5               24       35       25
##   TALLERES Y CAPACITACION             68               73        8       72
##   TRABAJO DE OFICINA                 163              202      141      225
##   VISITA A CACS                       73               54       65       65
##   VISITA A PARCELAS                   88               14       60       52
##   VISITA A VIVEROS                    69               61       80       58
##                          
##                           PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
##   ASISTENCIA A TECNICOS         82         55     44             0
##   DOCUMENTACION                  0          0      0             0
##   OTRAS COMISIONES             101        145     70            21
##   RECEPCION DE DOCUMENTOS       13         17      6             0
##   REUNION CACS                  44         26     74             0
##   SIN ACTIVIDAD                 75        163    123             9
##   SUPERVISION BIOFABRICA        18         18     20             0
##   TALLERES Y CAPACITACION       53         32     60             0
##   TRABAJO DE OFICINA            82        129     74             2
##   VISITA A CACS                 65        105     74             0
##   VISITA A PARCELAS             60         56     38             0
##   VISITA A VIVEROS              60         47     71             0
##                          
##                           SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
##   ASISTENCIA A TECNICOS               110      29         21        51
##   DOCUMENTACION                         0       0          0         0
##   OTRAS COMISIONES                    176      49         35       119
##   RECEPCION DE DOCUMENTOS              57       4          9         5
##   REUNION CACS                         61      28         28        34
##   SIN ACTIVIDAD                       104      56         18        80
##   SUPERVISION BIOFABRICA               30      10         16        20
##   TALLERES Y CAPACITACION              67      31          3        49
##   TRABAJO DE OFICINA                  173     105         61        77
##   VISITA A CACS                        97      67         53        95
##   VISITA A PARCELAS                    56      23         37        52
##   VISITA A VIVEROS                    113      57         53        78
##                          
##                           TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
##   ASISTENCIA A TECNICOS          46              0           20    71       13
##   DOCUMENTACION                   0              0            0     0        0
##   OTRAS COMISIONES              155            103           38   184       15
##   RECEPCION DE DOCUMENTOS        17             29            0    30        6
##   REUNION CACS                   42              0            0    78       11
##   SIN ACTIVIDAD                 113             69           26   110       37
##   SUPERVISION BIOFABRICA         12              6            3    16        9
##   TALLERES Y CAPACITACION        78             38            6    84       20
##   TRABAJO DE OFICINA            116            110           46    99       31
##   VISITA A CACS                  49              0            0    59       30
##   VISITA A PARCELAS              52              0            9    44       13
##   VISITA A VIVEROS               40             18           19    75       39
##                          
##                           TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
##   ASISTENCIA A TECNICOS                           96                96
##   DOCUMENTACION                                    0                 0
##   OTRAS COMISIONES                               188               203
##   RECEPCION DE DOCUMENTOS                         40                21
##   REUNION CACS                                    45                59
##   SIN ACTIVIDAD                                   93                60
##   SUPERVISION BIOFABRICA                          13                 9
##   TALLERES Y CAPACITACION                         95                66
##   TRABAJO DE OFICINA                             213               150
##   VISITA A CACS                                   60                54
##   VISITA A PARCELAS                               39                30
##   VISITA A VIVEROS                                86                45
## 
## , ,  = octubre 2021
## 
##                          
##                           ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
##   ASISTENCIA A TECNICOS        173      127        75     52         58      64
##   DOCUMENTACION                  0        0         0      0          0       0
##   OTRAS COMISIONES             117      205       172     70        130     105
##   RECEPCION DE DOCUMENTOS      131       46        51      6         21      31
##   REUNION CACS                 129       61        54     19         56      36
##   SIN ACTIVIDAD                  7       80        36     28        124      90
##   SUPERVISION BIOFABRICA        75       18        19      3         25      14
##   TALLERES Y CAPACITACION       73      112        48     18         95     121
##   TRABAJO DE OFICINA           334      216       225     40        137     155
##   VISITA A CACS                120       56        87     33        104      61
##   VISITA A PARCELAS            178       75        62     12         99      44
##   VISITA A VIVEROS             217      106        98     27        131      74
##                          
##                           DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
##   ASISTENCIA A TECNICOS        88      109      46        59      32      17
##   DOCUMENTACION                 0        0       0         0       0       0
##   OTRAS COMISIONES            142      131     164        74      59      32
##   RECEPCION DE DOCUMENTOS      45       36      25        13       5       5
##   REUNION CACS                 84       90      17        17      25      11
##   SIN ACTIVIDAD                76      103      52        53      47      18
##   SUPERVISION BIOFABRICA       30       41       8        15      14       8
##   TALLERES Y CAPACITACION     105      152      26        47      20      17
##   TRABAJO DE OFICINA          213      252      79       100      27      41
##   VISITA A CACS               104      163      59        43      41      21
##   VISITA A PARCELAS            50       83      35        29      31       5
##   VISITA A VIVEROS            107      118     100        55      47      13
##                          
##                           OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
##   ASISTENCIA A TECNICOS               60               78       14       72
##   DOCUMENTACION                        0                0        0        0
##   OTRAS COMISIONES                   107              157      158      181
##   RECEPCION DE DOCUMENTOS             30               42        7       48
##   REUNION CACS                        41               37       80       95
##   SIN ACTIVIDAD                       70               71      149       68
##   SUPERVISION BIOFABRICA               9               27       50       29
##   TALLERES Y CAPACITACION             88               61       20       98
##   TRABAJO DE OFICINA                 127              166       62      159
##   VISITA A CACS                       56               72       86       66
##   VISITA A PARCELAS                   50               36       64       89
##   VISITA A VIVEROS                    63               71       70       63
##                          
##                           PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
##   ASISTENCIA A TECNICOS         89         54     69             0
##   DOCUMENTACION                  0          0      0             0
##   OTRAS COMISIONES             126        170    132            21
##   RECEPCION DE DOCUMENTOS       20         18      4             0
##   REUNION CACS                  28         35     58             0
##   SIN ACTIVIDAD                 55        135     87            10
##   SUPERVISION BIOFABRICA        13         18     26             0
##   TALLERES Y CAPACITACION       72         54     50             0
##   TRABAJO DE OFICINA           109        115     76             0
##   VISITA A CACS                 52        100     58             0
##   VISITA A PARCELAS             47         48     40             0
##   VISITA A VIVEROS              45         75     55             0
##                          
##                           SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
##   ASISTENCIA A TECNICOS                93      59         14        80
##   DOCUMENTACION                         0       0          0         0
##   OTRAS COMISIONES                    183      21         38        98
##   RECEPCION DE DOCUMENTOS              32       9          7        19
##   REUNION CACS                         41      36         21        52
##   SIN ACTIVIDAD                       108      22         13        23
##   SUPERVISION BIOFABRICA               33      11         10        29
##   TALLERES Y CAPACITACION              89      24         11        51
##   TRABAJO DE OFICINA                  152     149         40       100
##   VISITA A CACS                        77      49         49        97
##   VISITA A PARCELAS                    36      28         30        47
##   VISITA A VIVEROS                     86      56         40        65
##                          
##                           TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
##   ASISTENCIA A TECNICOS          48              0            3    56       12
##   DOCUMENTACION                   0              0            0     0        0
##   OTRAS COMISIONES              194            134           52   132       11
##   RECEPCION DE DOCUMENTOS        25             34            9    17        1
##   REUNION CACS                   46              0            0    97       21
##   SIN ACTIVIDAD                  99             52           27   100       26
##   SUPERVISION BIOFABRICA         17              0            0    12        4
##   TALLERES Y CAPACITACION        53             42            6   132       14
##   TRABAJO DE OFICINA            104            118           48    93       27
##   VISITA A CACS                  31              0            0    61       26
##   VISITA A PARCELAS              47              0            7    69       23
##   VISITA A VIVEROS               37             17           21    58       34
##                          
##                           TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
##   ASISTENCIA A TECNICOS                           72                95
##   DOCUMENTACION                                    0                 0
##   OTRAS COMISIONES                               161               191
##   RECEPCION DE DOCUMENTOS                         41                44
##   REUNION CACS                                    41                43
##   SIN ACTIVIDAD                                  106                78
##   SUPERVISION BIOFABRICA                          23                 9
##   TALLERES Y CAPACITACION                        117                87
##   TRABAJO DE OFICINA                             212               149
##   VISITA A CACS                                   51                38
##   VISITA A PARCELAS                               42                28
##   VISITA A VIVEROS                               103                28
## 
## , ,  = septiembre 2021
## 
##                          
##                           ACAYUCAN BALANCAN CHIHUAHUA COLIMA COMALCALCO CORDOBA
##   ASISTENCIA A TECNICOS        203      118       109     48         75      59
##   DOCUMENTACION                  0        0         0      0          0       0
##   OTRAS COMISIONES              54      175       148     29        129     131
##   RECEPCION DE DOCUMENTOS      108       74        52      7         27      34
##   REUNION CACS                  67       42        49      7         50      29
##   SIN ACTIVIDAD                 79      100        61     57        161      93
##   SUPERVISION BIOFABRICA        82       34        18      6         38      18
##   TALLERES Y CAPACITACION       69       89        50     18         45      98
##   TRABAJO DE OFICINA           292      227       201     39        131     144
##   VISITA A CACS                115       54        64     43         99      47
##   VISITA A PARCELAS            119       80        32     23        110      32
##   VISITA A VIVEROS             225       94        69     28        161     114
##                          
##                           DURANGO GUERRERO HIDALGO MICHOACAN MORELOS NAYARIT
##   ASISTENCIA A TECNICOS        94       95      61        53      36      31
##   DOCUMENTACION                 0        0       0         0       0       0
##   OTRAS COMISIONES            133      238      96        58      52      24
##   RECEPCION DE DOCUMENTOS      44       56      25        21       4      15
##   REUNION CACS                 94       77      33        35      38      14
##   SIN ACTIVIDAD                75      122      56        79      22      61
##   SUPERVISION BIOFABRICA       31       33      15        17      17       3
##   TALLERES Y CAPACITACION      65       74      28        41      25      20
##   TRABAJO DE OFICINA          198      248     111       103      37      49
##   VISITA A CACS                96      109      65        58      52      12
##   VISITA A PARCELAS            58       83      36        25      28      16
##   VISITA A VIVEROS            138       98      92        61      55      18
##                          
##                           OAXACA (ISTMO) OAXACA (MIXTECA) OCOSINGO PALENQUE
##   ASISTENCIA A TECNICOS               84               62       24       87
##   DOCUMENTACION                        0                0        0        0
##   OTRAS COMISIONES                    99              178      261      124
##   RECEPCION DE DOCUMENTOS             13               14        3       51
##   REUNION CACS                        54               42       27       84
##   SIN ACTIVIDAD                       59               83      139       90
##   SUPERVISION BIOFABRICA               7               15       11       38
##   TALLERES Y CAPACITACION            110               37        5       46
##   TRABAJO DE OFICINA                 148              140       30      194
##   VISITA A CACS                       54               78       48       92
##   VISITA A PARCELAS                   47               32       26       67
##   VISITA A VIVEROS                    59               69       77       75
##                          
##                           PAPANTLA PICHUCALCO PUEBLA SAN CRISTOBAL
##   ASISTENCIA A TECNICOS         67         45     69             0
##   DOCUMENTACION                  0          0      0             0
##   OTRAS COMISIONES             156        164    115            10
##   RECEPCION DE DOCUMENTOS       36         28      7             0
##   REUNION CACS                  28         45     60             0
##   SIN ACTIVIDAD                 66        114    109            22
##   SUPERVISION BIOFABRICA        12         16     43             0
##   TALLERES Y CAPACITACION       27         26     34             0
##   TRABAJO DE OFICINA            92        108     63             0
##   VISITA A CACS                 48        102     80             0
##   VISITA A PARCELAS             42         65     52             0
##   VISITA A VIVEROS              62         61     84             0
##                          
##                           SAN LUIS POTOSI SINALOA TAMAULIPAS TANTOYUCA
##   ASISTENCIA A TECNICOS                91      58         12        50
##   DOCUMENTACION                         0       0          0         0
##   OTRAS COMISIONES                    128      70         26       164
##   RECEPCION DE DOCUMENTOS              29      33          4        36
##   REUNION CACS                         62      35         21        46
##   SIN ACTIVIDAD                       113      21         20        32
##   SUPERVISION BIOFABRICA               33      16          3        21
##   TALLERES Y CAPACITACION              52      26          5        29
##   TRABAJO DE OFICINA                  145     140         39        62
##   VISITA A CACS                       104      31         37        82
##   VISITA A PARCELAS                    67      23         20        42
##   VISITA A VIVEROS                    120      38         33        65
##                          
##                           TAPACHULA TAPACHULA PESN TAPACHULA ZE TEAPA TLAXCALA
##   ASISTENCIA A TECNICOS          48              2            4    74       15
##   DOCUMENTACION                   0              0            0     0        0
##   OTRAS COMISIONES              133            119          112   142       19
##   RECEPCION DE DOCUMENTOS        30             16            6    43        6
##   REUNION CACS                   48              0            3    55       11
##   SIN ACTIVIDAD                 116             81           22    98       52
##   SUPERVISION BIOFABRICA         21              0            1    39        4
##   TALLERES Y CAPACITACION        82             27            0    71        9
##   TRABAJO DE OFICINA             91             70           37    95       26
##   VISITA A CACS                  73              0            0    70       31
##   VISITA A PARCELAS              81              0            0    97       18
##   VISITA A VIVEROS               61             12           10   127       24
##                          
##                           TZUCACAB (OTHON P. BLANCO) XPUJIL (CAMPECHE)
##   ASISTENCIA A TECNICOS                           87               101
##   DOCUMENTACION                                    0                 0
##   OTRAS COMISIONES                               151               169
##   RECEPCION DE DOCUMENTOS                         49                32
##   REUNION CACS                                    37                37
##   SIN ACTIVIDAD                                   91                86
##   SUPERVISION BIOFABRICA                          21                10
##   TALLERES Y CAPACITACION                         98                35
##   TRABAJO DE OFICINA                             179               176
##   VISITA A CACS                                   39                46
##   VISITA A PARCELAS                               38                36
##   VISITA A VIVEROS                                86                69

EXPLORAR LA BASE don dplyr

ver los nombres

names(df9)
##  [1] "FECHA.DE.REGISTRO"     "MID.MONEDERO"          "PLACA"                
##  [4] "RECURSO.PROPIO"        "TERRITORIO"            "NOMBRE_DIA"           
##  [7] "PERIODO"               "MARCA"                 "actividades_diax"     
## [10] "ACTIVIDAD"             "ACTIVIDADES_SEPARADAS"

ver los periodos

table(df9$PERIODO)
## 
##     agosto 2021  noviembre 2021    octubre 2021 septiembre 2021 
##           19425           21633           21435           21170
names(table(df9$TERRITORIO))
##  [1] "ACAYUCAN"                   "BALANCAN"                  
##  [3] "CHIHUAHUA"                  "COLIMA"                    
##  [5] "COMALCALCO"                 "CORDOBA"                   
##  [7] "DURANGO"                    "GUERRERO"                  
##  [9] "HIDALGO"                    "MICHOACAN"                 
## [11] "MORELOS"                    "NAYARIT"                   
## [13] "OAXACA (ISTMO)"             "OAXACA (MIXTECA)"          
## [15] "OCOSINGO"                   "PALENQUE"                  
## [17] "PAPANTLA"                   "PICHUCALCO"                
## [19] "PUEBLA"                     "SAN CRISTOBAL"             
## [21] "SAN LUIS POTOSI"            "SINALOA"                   
## [23] "TAMAULIPAS"                 "TANTOYUCA"                 
## [25] "TAPACHULA"                  "TAPACHULA PESN"            
## [27] "TAPACHULA ZE"               "TEAPA"                     
## [29] "TLAXCALA"                   "TZUCACAB (OTHON P. BLANCO)"
## [31] "XPUJIL (CAMPECHE)"

cambiar los periodos

df10 <- df9

df10$PERIODO[df10$PERIODO == "agosto 2021"] <- "a- agosto 2021"
df10$PERIODO[df10$PERIODO == "septiembre 2021"] <- "b- septiembre 2021"
df10$PERIODO[df10$PERIODO == "octubre 2021"] <- "c- octubre 2021"
df10$PERIODO[df10$PERIODO == "noviembre 2021"] <- "d- noviembre 2021"

Aquí finaliza la limpieza

#write.csv(df10,"C:/Users/HP/Desktop/BORRAR/df10.csv", row.names = FALSE)