Importar el archivo en formato sav (SPSS) y verificando la estructura del mismo.
library(foreign)
chicles<- read.spss("C:/Users/LENOVO/Desktop/F3RNANDO/INV. DE MERCADOS II/UNIDAD 2/chicles.sav")
## re-encoding from UTF-8
chicles<- as.data.frame(chicles)
#estructura del data frame
str(chicles)
## 'data.frame': 23 obs. of 4 variables:
## $ id : num 1 2 3 4 5 6 7 8 9 10 ...
## $ sexo : Factor w/ 2 levels "femenino","masculino": 1 1 2 1 1 1 2 1 2 2 ...
## $ consumo: Factor w/ 2 levels "sí","no": 1 1 2 1 1 1 1 2 1 1 ...
## $ oficio : Factor w/ 5 levels "obrero","administrativo",..: 2 3 4 2 3 2 3 5 3 3 ...
summary(chicles)
## id sexo consumo oficio
## Min. : 1.0 femenino :15 sí:18 obrero :4
## 1st Qu.: 6.5 masculino: 8 no: 5 administrativo :7
## Median :12.0 gerencia :9
## Mean :12.0 labores_de_casa:2
## 3rd Qu.:17.5 otros :1
## Max. :23.0
dim(chicles)
## [1] 23 4
colSums(is.na(chicles))
## id sexo consumo oficio
## 0 0 0 0
attach(chicles)
consumo_oficio<- table(consumo, oficio)
consumo_oficio
## oficio
## consumo obrero administrativo gerencia labores_de_casa otros
## sí 1 7 9 1 0
## no 3 0 0 1 1
Se genera una tabla bidimensional con las frecuencias cruzadas entre ambas variables.
H0: Independencia “consumo”-“oficio” H1: Dependencia “consumo”-“oficio”
chi1<- chisq.test(consumo_oficio)
## Warning in chisq.test(consumo_oficio): Chi-squared approximation may be
## incorrect
chi1
##
## Pearson's Chi-squared test
##
## data: consumo_oficio
## X-squared = 15.653, df = 4, p-value = 0.003522
Se rechaza H0, con una significancia del 5%, se evidencia una asociación entre el “consumo de chicles” y el “oficio del encuestado”. Es decir, existe relación o influencia entre el consumir chicles y el oficio de la persona.
Se utiliza los estadísticos: V de Cramér y Coeficiente de contingencia.
library(vcd)
## Loading required package: grid
assocstats(consumo_oficio)
## X^2 df P(> X^2)
## Likelihood Ratio 16.814 4 0.0021009
## Pearson 15.653 4 0.0035223
##
## Phi-Coefficient : NA
## Contingency Coeff.: 0.636
## Cramer's V : 0.825
La intensidad de la asociación o relación entre las variables es media alta (considerando el Coeficiente de Contingencia) o Alta (V de Cramér); lo que es un indicador de que si se realiza una estrategia de marketing enficada en el oficio del público meta, sí se generaría un impacto o efecto en el nivel de consumo de chicles.
chi1$stdres
## oficio
## consumo obrero administrativo gerencia labores_de_casa otros
## sí -2.841397 1.671867 2.026609 -1.014055 -1.940009
## no 2.841397 -1.671867 -2.026609 1.014055 1.940009
El valor de Z (Variable tipificada según el 5% de significancia) es igual a 1,96. Comparando los residuos tipificados ajustados marginales se aprecia que las fuentes o categorías que llevan a la situación de dependencia entre variables son el oficio de “obrero” (ya que 2,84>1,96) y oficio en el área de “gerencia” (2,02>1,96). Por tanto, los obreros y los del área de gerencia generan la relación o asociación entre el consumo de chicle y el oficio.