CASO “CHICLES”

Importar el archivo en formato sav (SPSS) y verificando la estructura del mismo.

library(foreign)
chicles<- read.spss("C:/Users/LENOVO/Desktop/F3RNANDO/INV. DE MERCADOS II/UNIDAD 2/chicles.sav")
## re-encoding from UTF-8
chicles<- as.data.frame(chicles)

#estructura del data frame
str(chicles)
## 'data.frame':    23 obs. of  4 variables:
##  $ id     : num  1 2 3 4 5 6 7 8 9 10 ...
##  $ sexo   : Factor w/ 2 levels "femenino","masculino": 1 1 2 1 1 1 2 1 2 2 ...
##  $ consumo: Factor w/ 2 levels "sí","no": 1 1 2 1 1 1 1 2 1 1 ...
##  $ oficio : Factor w/ 5 levels "obrero","administrativo",..: 2 3 4 2 3 2 3 5 3 3 ...
summary(chicles)
##        id              sexo    consumo             oficio 
##  Min.   : 1.0   femenino :15   sí:18   obrero         :4  
##  1st Qu.: 6.5   masculino: 8   no: 5   administrativo :7  
##  Median :12.0                          gerencia       :9  
##  Mean   :12.0                          labores_de_casa:2  
##  3rd Qu.:17.5                          otros          :1  
##  Max.   :23.0
dim(chicles)
## [1] 23  4
colSums(is.na(chicles))
##      id    sexo consumo  oficio 
##       0       0       0       0

1. REALIZAR EL CRUCE DE VARIABLES: “CONSUMO DE CHICLES” - “OFICIO DEL ENCUESTADO”

attach(chicles)
consumo_oficio<- table(consumo, oficio)
consumo_oficio
##        oficio
## consumo obrero administrativo gerencia labores_de_casa otros
##      sí      1              7        9               1     0
##      no      3              0        0               1     1

Se genera una tabla bidimensional con las frecuencias cruzadas entre ambas variables.

2. PRUEBA DE CHI CUADRADO DE PEARSON

H0: Independencia “consumo”-“oficio” H1: Dependencia “consumo”-“oficio”

chi1<- chisq.test(consumo_oficio)
## Warning in chisq.test(consumo_oficio): Chi-squared approximation may be
## incorrect
chi1
## 
##  Pearson's Chi-squared test
## 
## data:  consumo_oficio
## X-squared = 15.653, df = 4, p-value = 0.003522

Se rechaza H0, con una significancia del 5%, se evidencia una asociación entre el “consumo de chicles” y el “oficio del encuestado”. Es decir, existe relación o influencia entre el consumir chicles y el oficio de la persona.

3. MEDICIÓN DE LA INTENSIDAD DE LA ASOCIACIÓN

Se utiliza los estadísticos: V de Cramér y Coeficiente de contingencia.

library(vcd)
## Loading required package: grid
assocstats(consumo_oficio)
##                     X^2 df  P(> X^2)
## Likelihood Ratio 16.814  4 0.0021009
## Pearson          15.653  4 0.0035223
## 
## Phi-Coefficient   : NA 
## Contingency Coeff.: 0.636 
## Cramer's V        : 0.825

La intensidad de la asociación o relación entre las variables es media alta (considerando el Coeficiente de Contingencia) o Alta (V de Cramér); lo que es un indicador de que si se realiza una estrategia de marketing enficada en el oficio del público meta, sí se generaría un impacto o efecto en el nivel de consumo de chicles.

4. ANÁLISIS DE FUENTES DE ASOCIACIÓN MEDIANTE LOS RESIDUOS TIPIFICADOS AJUSTADOS

chi1$stdres
##        oficio
## consumo    obrero administrativo  gerencia labores_de_casa     otros
##      sí -2.841397       1.671867  2.026609       -1.014055 -1.940009
##      no  2.841397      -1.671867 -2.026609        1.014055  1.940009

El valor de Z (Variable tipificada según el 5% de significancia) es igual a 1,96. Comparando los residuos tipificados ajustados marginales se aprecia que las fuentes o categorías que llevan a la situación de dependencia entre variables son el oficio de “obrero” (ya que 2,84>1,96) y oficio en el área de “gerencia” (2,02>1,96). Por tanto, los obreros y los del área de gerencia generan la relación o asociación entre el consumo de chicle y el oficio.