2024-07-21

Disposiciones iniciales

Primeramente se iniciaran la paqueteria en RStudio para poder extraer la base de datos de la nube y poder cargarla en el software Spss:

library(readr)
library(lattice)
library(ggplot2)
library(caret)
## Warning: package 'caret' was built under R version 4.3.3
library(readxl)
library(openxlsx)

Crear la base de datos a trabajar

una vez creado la base, se procede a extraerla de la nube y guardarla para trabjarla en SPSS la urla de la base utilizada es:

https://raw.githubusercontent.com/Statology/Python-Guides/main/default.csv

datos<-read_csv("https://raw.githubusercontent.com/Statology/Python-Guides/main/default.csv",col_types = cols(default=col_integer(),student=col_integer()))
head(datos,3)
## # A tibble: 3 × 4
##   default student balance income
##     <int>   <int>   <dbl>  <dbl>
## 1       0       0    730. 44362.
## 2       0       1    817. 12106.
## 3       0       0   1074. 31767.

Trasformación

Conversion de la base de datos en dataframe y posteriormente exportarla escribiendo un CSV

tabla=as.data.frame(datos)
class(tabla)
## [1] "data.frame"
#write_csv(tabla, "C:\\Users\\DELL\\Desktop\\Curso de especializacion\\bases modulo 3\\tabla2.csv")

Carga de Base en SPSS

Carga de Base en SPSS

Ejecución del análisis

En los menús seleccione: Analizar > Regresión > Logística binaria …

Ejecución del análisis

  • Seleccionar una variable dependiente dicotómica. Esta variable puede ser numérica o de cadena.
  • En el Bloque 1 de 1 seleccionar una o varias varibales independientes
  • En seleccionar variable elegir LR como método

Ejecución del análisis

  • En la opción categórica seleccionar las variables que son cualitativas.Pulsar guardar y continuar

Ejecución del análisis

  • En la opcion de guardar seleccionar, Probabilidades en el grupo Valores pronosticados, Cook’s en el grupo Influencia y Estudentizado en el grupo Residuos.

Ejecución del análisis

  • Seleccionar Gráficos de clasificación y bondad de ajuste de Hosmer-Lemeshow. Pulsar Continuar y Aceptar

Diagnósticos del modelo

Después de crear un modelo, debe determinar si se aproxima razonablemente al comportamiento de los datos.

  • Pruebas de ajuste del modelo. El procedimiento de bondad de ajuste es el de Hosmer-Lemeshow.

  • Gráficos de residuos. Utilizando las variables especificadas en el cuadro de diálogo Guardar, puede construir varios gráficos de diagnóstico.

Pruebas de ajuste del modelo

El estadístico de Hosmer-Lemeshow indica un ajuste deficiente si el valor de significación es menor que 0,05.

Selección de Variables

Las variables que se han dejado fuera del análisis en el último paso tienen valores de significación mayores que 0,05, por lo que no se añaden más.

Clasificación

Selección del modelo correcto

Normalmente hay varios modelos que pasan las comprobaciones de diagnóstico, por lo que necesita herramientas para elegir entre ellos.

  • Selección de variable automatizada.
  • Estadísticos pseudo R cuadrado.
  • Clasificación y validación.

Coeficientes de Regresión

Modelo formal según estructura \(y=a_0+a_1x_1+a_2x_2+a_3x_3\) \(y=-10.749+0.06 x_1-0.715x_2\)