Importar base datos
bd <- read.csv("/Users/georginamartinez/Documents/Tec/Séptimo Semestre/Analítica para negocios, de los datos a decisiones/Base de datos FORM/BD externa/ACTIVIDAD 2.2 (1).csv")
bd1 <- bd
bd1<-subset(bd1,select=-c(ID))
str(bd1)
## 'data.frame': 1436 obs. of 5 variables:
## $ Unidad._Económica : chr "AGI SHOREWOOD MEXICO S DE RL DE CV" "BIO PAPPEL" "CAJAS CON CARTON" "CAJAS CORRUGADAS DE AGUASCALIENTES" ...
## $ Clase._de_actividad : chr "Fabricación de envases de cartón" "Fabricación de envases de cartón" "Fabricación de envases de cartón" "Fabricación de envases de cartón" ...
## $ Descripcion.estrato.personal: chr "101 a 250 personas" "0 a 5 personas" "0 a 5 personas" "11 a 30 personas" ...
## $ Estado : chr "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" "AGUASCALIENTES" ...
## $ Tipo_establecimiento : chr "Fijo" "Fijo" "Fijo" "Fijo" ...
bd1 [duplicated(bd1),]
## Unidad._Económica
## 37 SOLUCIONES EN EMPAQUE Y LOGISTICA
## 49 CELULOSA Y CORRUGADOS DE SONORA SA DE CV
## 63 EMPAQUES PRECISOS DE MEXICALI
## 89 SINIL INDUSTRY SA DE CV
## 119 DANHIL DE MEXICO SA DE CV
## 172 DURABOX
## 211 BIO PAPPEL
## 251 FABRICACIÓN DE ENVASES DE CARTÓN
## 372 CORRUWAX
## 383 EMPAQUES 06
## 390 ENVASES MICROONDA
## 481 PROCESOS ESPECIALIZADOS DE CARTON DE MEXICO
## 670 PRAKTICAJA
## 698 BIO PAPPEL
## 703 BIO PAPPEL SAB DE CV
## 728 CAJAS Y EMPAQUES MODERNOS SA DE CV
## 736 CARTONERA
## 803 FABRICACION DE CAJAS DE CARTON
## 804 FABRICACION DE CAJAS DE CARTON
## 805 FABRICACION DE CAJAS DE CARTON
## 818 GRUPO TENSA
## 919 HVM GROUP
## 955 BRECEPACK
## 963 CAJAS DE CARTON SULTANA
## 980 CARTOLITO SA DE CV
## 1021 EMPAQUES CONFIABLES
## 1047 FABRICACIÓN DE ENVASES DE CARTÓN
## 1052 FECSA
## 1068 HEXAGONOS MEXICANOS
## 1091 LITOGRAFICA ROBERTSON
## 1224 CORRUEMPAQUES
## 1226 CORRUGADOS ESPECIALIZADOS
## 1241 ESK
## 1281 CAJAS MIL USOS
## 1286 CARDBOARD & BOXES
## 1302 EMPAQUES Y ENVOLTURAS SA DE CV
## 1338 CELULOSA Y CORRUGADOS DE SONORA SA DE CV
## 1339 CELULOSA Y CORRUGADOS DE SONORA SA DE CV
## 1340 CELULOSA Y CORRUGADOS DE SONORA SA DE CV
## 1341 CELULOSA Y CORRUGADOS DE SONORA SA DE CV
## 1374 EMPAQUES RIO GRANDE SA DE CV
## 1403 HEXAGONOS MEXICANOS
## Clase._de_actividad Descripcion.estrato.personal
## 37 Fabricación de envases de cartón 11 a 30 personas
## 49 Fabricación de envases de cartón 0 a 5 personas
## 63 Fabricación de envases de cartón 0 a 5 personas
## 89 Fabricación de envases de cartón 251 y más personas
## 119 Fabricación de envases de cartón 31 a 50 personas
## 172 Fabricación de envases de cartón 101 a 250 personas
## 211 Fabricación de envases de cartón 31 a 50 personas
## 251 Fabricación de envases de cartón 0 a 5 personas
## 372 Fabricación de envases de cartón 0 a 5 personas
## 383 Fabricación de envases de cartón 6 a 10 personas
## 390 Fabricación de envases de cartón 0 a 5 personas
## 481 Fabricación de envases de cartón 11 a 30 personas
## 670 Fabricación de envases de cartón 11 a 30 personas
## 698 Fabricación de envases de cartón 31 a 50 personas
## 703 Fabricación de envases de cartón 251 y más personas
## 728 Fabricación de envases de cartón 101 a 250 personas
## 736 Fabricación de envases de cartón 0 a 5 personas
## 803 Fabricación de envases de cartón 0 a 5 personas
## 804 Fabricación de envases de cartón 0 a 5 personas
## 805 Fabricación de envases de cartón 0 a 5 personas
## 818 Fabricación de envases de cartón 0 a 5 personas
## 919 Fabricación de envases de cartón 0 a 5 personas
## 955 Fabricación de envases de cartón 31 a 50 personas
## 963 Fabricación de envases de cartón 51 a 100 personas
## 980 Fabricación de envases de cartón 11 a 30 personas
## 1021 Fabricación de envases de cartón 0 a 5 personas
## 1047 Fabricación de envases de cartón 0 a 5 personas
## 1052 Fabricación de envases de cartón 0 a 5 personas
## 1068 Fabricación de envases de cartón 11 a 30 personas
## 1091 Fabricación de envases de cartón 11 a 30 personas
## 1224 Fabricación de envases de cartón 11 a 30 personas
## 1226 Fabricación de envases de cartón 6 a 10 personas
## 1241 Fabricación de envases de cartón 11 a 30 personas
## 1281 Fabricación de envases de cartón 0 a 5 personas
## 1286 Fabricación de envases de cartón 0 a 5 personas
## 1302 Fabricación de envases de cartón 0 a 5 personas
## 1338 Fabricación de envases de cartón 0 a 5 personas
## 1339 Fabricación de envases de cartón 0 a 5 personas
## 1340 Fabricación de envases de cartón 0 a 5 personas
## 1341 Fabricación de envases de cartón 0 a 5 personas
## 1374 Fabricación de envases de cartón 51 a 100 personas
## 1403 Fabricación de envases de cartón 31 a 50 personas
## Estado Tipo_establecimiento
## 37 AGUASCALIENTES Fijo
## 49 BAJA CALIFORNIA Fijo
## 63 BAJA CALIFORNIA Fijo
## 89 BAJA CALIFORNIA Fijo
## 119 COAHUILA DE ZARAGOZA Fijo
## 172 CHIHUAHUA Fijo
## 211 CIUDAD DE MÉXICO Fijo
## 251 CIUDAD DE MÉXICO Fijo
## 372 GUANAJUATO Fijo
## 383 GUANAJUATO Fijo
## 390 GUANAJUATO Fijo
## 481 GUANAJUATO Fijo
## 670 JALISCO Fijo
## 698 MÉXICO Fijo
## 703 MÉXICO Fijo
## 728 MÉXICO Fijo
## 736 MÉXICO Fijo
## 803 MÉXICO Fijo
## 804 MÉXICO Fijo
## 805 MÉXICO Fijo
## 818 MÉXICO Fijo
## 919 MICHOACÁN DE OCAMPO Fijo
## 955 NUEVO LEÓN Fijo
## 963 NUEVO LEÓN Fijo
## 980 NUEVO LEÓN Fijo
## 1021 NUEVO LEÓN Fijo
## 1047 NUEVO LEÓN Fijo
## 1052 NUEVO LEÓN Fijo
## 1068 NUEVO LEÓN Fijo
## 1091 NUEVO LEÓN Fijo
## 1224 QUERÉTARO Fijo
## 1226 QUERÉTARO Fijo
## 1241 QUERÉTARO Fijo
## 1281 SAN LUIS POTOSÍ Fijo
## 1286 SAN LUIS POTOSÍ Fijo
## 1302 SAN LUIS POTOSÍ Fijo
## 1338 SONORA Fijo
## 1339 SONORA Fijo
## 1340 SONORA Fijo
## 1341 SONORA Fijo
## 1374 TAMAULIPAS Fijo
## 1403 TLAXCALA Fijo
sum(duplicated(bd1))
## [1] 42
bd2 <- bd1
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
bd2 <- distinct (bd2)
Librerías requeridas
library(foreign)
library(dplyr) # data manipulation
library(forcats) # to work with categorical variables
library(ggplot2) # data visualization
library(janitor) # data exploration and cleaning
#install.packages("psych")
library(corrplot) # correlation plots
library(lmtest) # diagnostic checks - linear regression analysis
library(car) # diagnostic checks - linear regression analysis
Tablas cruzada
cruzada1<-table(bd2$Tipo_establecimiento,bd2$Clase._de_actividad)
knitr::kable(cruzada1)
cruzada2<-table(bd2$Estado,bd2$Tipo_establecimiento)
knitr::kable(cruzada2)
| AGUASCALIENTES |
37 |
0 |
| BAJA CALIFORNIA |
57 |
0 |
| CHIAPAS |
1 |
0 |
| CHIHUAHUA |
48 |
0 |
| CIUDAD DE MÉXICO |
103 |
0 |
| COAHUILA DE ZARAGOZA |
50 |
0 |
| COLIMA |
3 |
0 |
| DURANGO |
11 |
0 |
| GUANAJUATO |
191 |
0 |
| GUERRERO |
5 |
0 |
| HIDALGO |
19 |
0 |
| JALISCO |
151 |
1 |
| MÉXICO |
192 |
0 |
| MICHOACÁN DE OCAMPO |
36 |
0 |
| MORELOS |
5 |
0 |
| NUEVO LEÓN |
214 |
1 |
| OAXACA |
2 |
0 |
| PUEBLA |
47 |
0 |
| QUERÉTARO |
69 |
0 |
| QUINTANA ROO |
1 |
0 |
| SAN LUIS POTOSÍ |
38 |
0 |
| SINALOA |
12 |
0 |
| SONORA |
22 |
0 |
| TAMAULIPAS |
39 |
0 |
| TLAXCALA |
9 |
0 |
| VERACRUZ DE IGNACIO DE LA LLAVE |
15 |
0 |
| YUCATÁN |
12 |
0 |
| ZACATECAS |
3 |
0 |
Gráficos de datos cualitativos y cuantitativos
Datos cualitativos
barplot(prop.table(table(bd2$Estado)),col=c("orange","blue","red","green"),main="Fabricante por estado", ylab ="Frecuencias",las=1)

pie(prop.table(table(bd2$Tipo_establecimiento)),col=c("pink","blue"),main="Empresa", ylab ="Frecuencias",las=1)

Gráficos de dispersión
Scatterplot y boxplots
summary(bd2)
## Unidad._Económica Clase._de_actividad Descripcion.estrato.personal
## Length:1394 Length:1394 Length:1394
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
## Estado Tipo_establecimiento
## Length:1394 Length:1394
## Class :character Class :character
## Mode :character Mode :character
bd3<-group_by(bd2,Descripcion.estrato.personal)%>%tally()
plot(bd3$n, xlab = "Estrato personal", ylab = "N", main = "Descripcion de estrato personal" )
