Ejercicio 2

Enunciado

En un estudio de mercado se desea investigar los principales factores que pueden influir en aumentar la probabilidad de que un nuevo producto sea introducido con éxito en el mercado. Con esta finalidad, se ha aplicado una encuesta a 240 empresas industriales de las cuales 156 declararon haber intentado introducir en el mercado un nuevo producto. Entonces, el objetivo es explicar el comportamiento en términos de probabilidad de una
variable dependiente dicotómica (éxito o fracaso en el lanzamiento de un nuevo producto), en función de un conjunto de variables predictoras.

1.Realizar un análisis completo.

#Importar base de datos
library(readxl)
datos <- read_excel(file.choose())

#visualización de datos
head(datos)

##Identificar la ecuación
modelo_Logit2= glm(exito ~ . ,
data=datos, family="binomial")
summary(modelo_Logit2)


Call:
glm(formula = exito ~ ., family = "binomial", data = datos)

Coefficients:
                       Estimate Std. Error z value Pr(>|z|)    
(Intercept)             -9.2364     2.2282  -4.145 3.39e-05 ***
publicid                 2.0206     0.5000   4.042 5.31e-05 ***
gradnoveProd Nuevos     -1.2305     0.5377  -2.288  0.02211 *  
tipoConsumo industrial   0.1633     0.7813   0.209  0.83442    
imasdSi                  3.5647     1.3678   2.606  0.00915 ** 
sectecngBaja            -2.1564     0.8265  -2.609  0.00908 ** 
sectecngMedia           -0.6872     0.8638  -0.796  0.42632    
personal                 0.4214     0.1490   2.829  0.00467 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 211.91  on 155  degrees of freedom
Residual deviance: 104.43  on 148  degrees of freedom
AIC: 120.43

Number of Fisher Scoring iterations: 8

Validación Global

Ho: B1 = B2=B3=B4=B5=B6

H1: al menos un Bi es Diferente

```r
with(modelo_Logit2,
pchisq(null.deviance - deviance,
df.null - df.residual,
lower.tail = FALSE)
)
```

```
[1] 3.05507e-20
```

P-valor aprox 0 < alfa(0.05)

Rechazo Ho

Conclusión : Al menos un coeficiente de regresión aporta significativamente al modelo Logístico.

B. Validación Individual

Ho: Bi= 0

H1: Bi dif 0 Para todo i = 1,2,3,4,5,6

summary(modelo_Logit2)


Call:
glm(formula = exito ~ ., family = "binomial", data = datos)

Coefficients:
                       Estimate Std. Error z value Pr(>|z|)    
(Intercept)             -9.2364     2.2282  -4.145 3.39e-05 ***
publicid                 2.0206     0.5000   4.042 5.31e-05 ***
gradnoveProd Nuevos     -1.2305     0.5377  -2.288  0.02211 *  
tipoConsumo industrial   0.1633     0.7813   0.209  0.83442    
imasdSi                  3.5647     1.3678   2.606  0.00915 ** 
sectecngBaja            -2.1564     0.8265  -2.609  0.00908 ** 
sectecngMedia           -0.6872     0.8638  -0.796  0.42632    
personal                 0.4214     0.1490   2.829  0.00467 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 211.91  on 155  degrees of freedom
Residual deviance: 104.43  on 148  degrees of freedom
AIC: 120.43

Number of Fisher Scoring iterations: 8

Conclusión: Sector teconológico y Tipo de consumo resultan no significativo.

Precaución : Revisar posteriormente cual es el mejor modelo.

C. Tabla de clasificación

predicciones <- ifelse(test=modelo_Logit2$fitted.values >0.5 , yes=1,no=0)
tabla = table(modelo_Logit2$model$exito,predicciones ,
dnn =c("observaciones","predicciones"))
tabla

             predicciones
observaciones  0  1
            0 52 13
            1 10 81

prop.table(tabla)*100

             predicciones
observaciones         0         1
            0 33.333333  8.333333
            1  6.410256 51.923077

Tenemos un 33.33+ 51.92 = 85.25 % de correcta clasificación.

d. Coeficiente determinación

library(DescTools)
PseudoR2(modelo_Logit2, c("McFadden", "CoxSnell" , "Nagelkerke"))

  McFadden   CoxSnell Nagelkerke 
 0.5072108  0.4979163  0.6702109

Clasificar a una empresa que tenga un gasto en publicidad de 6.25 , consumo industrial, tenga mejoras suntanciales , no posea depto. de Investigación, tenga grado de novedad medio y 20 personas laborando.

##Creando el data frame con las nuevas observaciones[Rose y Jack]
prediccion_2= data.frame(
"publicid"=c(6.25),
"gradnove"=c('Mejoras Sustanciales'),
"tipo" =c('Consumo industrial'),
"imasd" = c('No')         ,
"sectecng"= c('Media')       ,
"personal"=c(20)
)
prediccion_2

prediccion=predict(modelo_Logit2, newdata = prediccion_2,type = "response")
prediccion ##Probabilidad de supervivencia

        1 
0.9999876

LS0tDQp0aXRsZTogIkVqZXJjaWNpbyAyIC0gIFJMQiINCm91dHB1dDogaHRtbF9ub3RlYm9vaw0KLS0tDQoNCioqRW51bmNpYWRvKioNCg0KRW4gdW4gZXN0dWRpbyBkZSBtZXJjYWRvIHNlIGRlc2VhIGludmVzdGlnYXIgbG9zIHByaW5jaXBhbGVzIGZhY3RvcmVzIHF1ZSBwdWVkZW4gaW5mbHVpciBlbiBhdW1lbnRhciBsYSBwcm9iYWJpbGlkYWQgZGUgcXVlIHVuIG51ZXZvIHByb2R1Y3RvIHNlYSBpbnRyb2R1Y2lkbyBjb24gw6l4aXRvIGVuIGVsIG1lcmNhZG8uIENvbiBlc3RhIGZpbmFsaWRhZCwgc2UgaGEgYXBsaWNhZG8gdW5hIGVuY3Vlc3RhIGEgMjQwIGVtcHJlc2FzIGluZHVzdHJpYWxlcyBkZSBsYXMgY3VhbGVzIDE1NiBkZWNsYXJhcm9uIGhhYmVyIGludGVudGFkbyBpbnRyb2R1Y2lyIGVuIGVsIG1lcmNhZG8gdW4gbnVldm8gcHJvZHVjdG8uIEVudG9uY2VzLCBlbCBvYmpldGl2byBlcyBleHBsaWNhciBlbCBjb21wb3J0YW1pZW50byBlbiB0w6lybWlub3MgZGUgcHJvYmFiaWxpZGFkIGRlIHVuYVwNCnZhcmlhYmxlIGRlcGVuZGllbnRlIGRpY290w7NtaWNhICjDqXhpdG8gbyBmcmFjYXNvIGVuIGVsIGxhbnphbWllbnRvIGRlIHVuIG51ZXZvIHByb2R1Y3RvKSwgZW4gZnVuY2nDs24gZGUgdW4gY29uanVudG8gZGUgdmFyaWFibGVzIHByZWRpY3RvcmFzLlwNCg0KMS5SZWFsaXphciB1biBhbsOhbGlzaXMgY29tcGxldG8uXA0KDQpgYGB7cn0NCiNJbXBvcnRhciBiYXNlIGRlIGRhdG9zDQpsaWJyYXJ5KHJlYWR4bCkNCmRhdG9zIDwtIHJlYWRfZXhjZWwoZmlsZS5jaG9vc2UoKSkNCmBgYA0KDQpgYGB7cn0NCiN2aXN1YWxpemFjacOzbiBkZSBkYXRvcw0KaGVhZChkYXRvcykNCmBgYA0KDQpgYGB7cn0NCiMjSWRlbnRpZmljYXIgbGEgZWN1YWNpw7NuDQptb2RlbG9fTG9naXQyPSBnbG0oZXhpdG8gfiAuICwNCmRhdGE9ZGF0b3MsIGZhbWlseT0iYmlub21pYWwiKQ0Kc3VtbWFyeShtb2RlbG9fTG9naXQyKQ0KYGBgDQoNCi0gICBWYWxpZGFjacOzbiBHbG9iYWwNCg0KICAgIEhvOiBCMSA9IEIyPUIzPUI0PUI1PUI2DQoNCiAgICBIMTogYWwgbWVub3MgdW4gQmkgZXMgRGlmZXJlbnRlDQoNCiAgICBgYGB7cn0NCiAgICB3aXRoKG1vZGVsb19Mb2dpdDIsDQogICAgcGNoaXNxKG51bGwuZGV2aWFuY2UgLSBkZXZpYW5jZSwNCiAgICBkZi5udWxsIC0gZGYucmVzaWR1YWwsDQogICAgbG93ZXIudGFpbCA9IEZBTFNFKQ0KICAgICkNCiAgICBgYGANCg0KUC12YWxvciBhcHJveCAwIFw8IGFsZmEoMC4wNSkNCg0KKipSZWNoYXpvIEhvKioNCg0KKipDb25jbHVzacOzbiA6KiogQWwgbWVub3MgdW4gY29lZmljaWVudGUgZGUgcmVncmVzacOzbiBhcG9ydGEgc2lnbmlmaWNhdGl2YW1lbnRlIGFsIG1vZGVsbyBMb2fDrXN0aWNvLg0KDQpCLiBWYWxpZGFjacOzbiBJbmRpdmlkdWFsDQoNCkhvOiBCaT0gMA0KDQpIMTogQmkgZGlmIDAgUGFyYSB0b2RvIGkgPSAxLDIsMyw0LDUsNg0KDQpgYGB7cn0NCnN1bW1hcnkobW9kZWxvX0xvZ2l0MikNCmBgYA0KDQoqKkNvbmNsdXNpw7NuOioqIFNlY3RvciB0ZWNvbm9sw7NnaWNvIHkgVGlwbyBkZSBjb25zdW1vIHJlc3VsdGFuIG5vIHNpZ25pZmljYXRpdm8uDQoNClByZWNhdWNpw7NuIDogUmV2aXNhciBwb3N0ZXJpb3JtZW50ZSBjdWFsIGVzIGVsIG1lam9yIG1vZGVsby4NCg0KKipDLiBUYWJsYSBkZSBjbGFzaWZpY2FjacOzbioqDQoNCmBgYHtyfQ0KcHJlZGljY2lvbmVzIDwtIGlmZWxzZSh0ZXN0PW1vZGVsb19Mb2dpdDIkZml0dGVkLnZhbHVlcyA+MC41ICwgeWVzPTEsbm89MCkNCnRhYmxhID0gdGFibGUobW9kZWxvX0xvZ2l0MiRtb2RlbCRleGl0byxwcmVkaWNjaW9uZXMgLA0KZG5uID1jKCJvYnNlcnZhY2lvbmVzIiwicHJlZGljY2lvbmVzIikpDQp0YWJsYQ0KYGBgDQoNCmBgYHtyfQ0KcHJvcC50YWJsZSh0YWJsYSkqMTAwDQpgYGANCg0KVGVuZW1vcyB1biAzMy4zMysgNTEuOTIgPSA4NS4yNSAlIGRlIGNvcnJlY3RhIGNsYXNpZmljYWNpw7NuLg0KDQoqKmQuIENvZWZpY2llbnRlIGRldGVybWluYWNpw7NuKioNCg0KYGBge3J9DQpsaWJyYXJ5KERlc2NUb29scykNClBzZXVkb1IyKG1vZGVsb19Mb2dpdDIsIGMoIk1jRmFkZGVuIiwgIkNveFNuZWxsIiAsICJOYWdlbGtlcmtlIikpDQpgYGANCg0KMi4gIENsYXNpZmljYXIgYSB1bmEgZW1wcmVzYSBxdWUgdGVuZ2EgdW4gZ2FzdG8gZW4gcHVibGljaWRhZCBkZSA2LjI1ICwgY29uc3VtbyBpbmR1c3RyaWFsLCB0ZW5nYSBtZWpvcmFzIHN1bnRhbmNpYWxlcyAsIG5vIHBvc2VhIGRlcHRvLiBkZSBJbnZlc3RpZ2FjacOzbiwgdGVuZ2EgZ3JhZG8gZGUgbm92ZWRhZCBtZWRpbyB5IDIwIHBlcnNvbmFzIGxhYm9yYW5kby5cDQoNCmBgYHtyfQ0KIyNDcmVhbmRvIGVsIGRhdGEgZnJhbWUgY29uIGxhcyBudWV2YXMgb2JzZXJ2YWNpb25lc1tSb3NlIHkgSmFja10NCnByZWRpY2Npb25fMj0gZGF0YS5mcmFtZSgNCiJwdWJsaWNpZCI9Yyg2LjI1KSwNCiJncmFkbm92ZSI9YygnTWVqb3JhcyBTdXN0YW5jaWFsZXMnKSwNCiJ0aXBvIiA9YygnQ29uc3VtbyBpbmR1c3RyaWFsJyksDQoiaW1hc2QiID0gYygnTm8nKSAgICAgICAgICwNCiJzZWN0ZWNuZyI9IGMoJ01lZGlhJykgICAgICAgLA0KInBlcnNvbmFsIj1jKDIwKQ0KKQ0KcHJlZGljY2lvbl8yDQpgYGANCg0KYGBge3J9DQpwcmVkaWNjaW9uPXByZWRpY3QobW9kZWxvX0xvZ2l0MiwgbmV3ZGF0YSA9IHByZWRpY2Npb25fMix0eXBlID0gInJlc3BvbnNlIikNCnByZWRpY2Npb24gIyNQcm9iYWJpbGlkYWQgZGUgc3VwZXJ2aXZlbmNpYQ0KYGBgDQoNCg0K

Ejercicio 2 - RLB