COMPRESIÓN DEL NEGOCIO
Primera base de datos: Marketing Bancario
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
Banco_2 <- read_excel("Banco 2.xlsx")
head(Banco_2)
## # A tibble: 6 × 17
## age job marital education default balance housing loan contact day
## <dbl> <chr> <chr> <chr> <chr> <dbl> <chr> <chr> <chr> <dbl>
## 1 58 management married tertiary no 2143 yes no unknown 5
## 2 44 technician single secondary no 29 yes no unknown 5
## 3 33 entrepren… married secondary no 2 yes yes unknown 5
## 4 47 blue-coll… married unknown no 1506 yes no unknown 5
## 5 33 unknown single unknown no 1 no no unknown 5
## 6 35 management married tertiary no 231 yes no unknown 5
## # ℹ 7 more variables: month <chr>, duration <dbl>, campaign <dbl>, pdays <dbl>,
## # previous <dbl>, poutcome <chr>, y <chr>
Descripción de cada variable
Edad: Edad del cliente (numérico).
Trabajo: Tipo de ocupación (categoría:
administrativo, tecnico, retirado, etc.).
Estado civil: Casado, soltero o
divorciado/viudo.
Educación: Nivel educativo (primaria, secundaria,
terciaria, desconocido).
Morosidad: Tiene deudas impagas en créditos
anteriores (sí/no).
Saldo: Saldo medio anual en euros (numérico).
Vivienda: ¿Tiene préstamo hipotecario?
(sí/no).
Préstamo: ¿Tiene préstamo personal? (sí/no).
Contacto: Medio usado para el contacto (teléfono,
celular o desconocido).
Día: Día del último contacto (numérico).
Mes: Mes del último contacto (ene a dic).
Duración: Duración de la última llamada, en
segundos.
Campaña: Número de contactos durante la campaña
actual.
Pdays: Días desde el último contacto previo (-1 si
nunca fue contactado).
Anterior: Número de contactos antes de esta
campaña.
Poutcome: Resultado de la campaña anterior (éxito,
fracaso, desconocido, otro).
y: Variable objetivo: indica si contrató un
depósito a plazo (sí/no).
Las variables X son como la edad del cliente (age), su tipo de
trabajo (job), su estado civil (marital), el nivel educativo
(education), ¿Tiene deudas impagas en créditos anteriores? (default), el
balance promedio anual (balance), si tiene préstamos de vivienda
(housing), si tiene un préstamo personal (loan), el tipo de contacto
realizado (contact), el día y mes del último contacto (day y month), la
duración del último contacto (duration), el número de contactos en la
campaña (campaign), los días desde el último contacto (pdays), el número
de contactos previos (previous) y el resultado de la campaña anterior
(poutcome). Por otro lado, la variable Y es el resultado que se desea
predecir, en este caso, si el cliente ha suscrito o no un depósito a
plazo (y), que es una variable binaria (“yes” o “no”).
Por lo tanto, nuestro problema estadistico para esta base de datos
sera ¿Qué características de los clientes influyen
significativamente en la probabilidad de que suscriban un depósito a
plazo fijo?
Segunda base de datos: Rendimiento estudiantil en
un examen de ingreso
library(readxl)
Rendimiento_2 <- read_excel("Rendimiento_2.xlsx")
head(Rendimiento_2)
## # A tibble: 6 × 12
## Gender Caste coaching Class_ten_education twelve_education medium
## <chr> <chr> <chr> <chr> <chr> <chr>
## 1 male General NO SEBA AHSEC ENGLISH
## 2 male OBC WA SEBA AHSEC OTHERS
## 3 male OBC OA OTHERS CBSE ENGLISH
## 4 male General WA SEBA AHSEC OTHERS
## 5 male General OA SEBA CBSE ENGLISH
## 6 male General WA CBSE CBSE ENGLISH
## # ℹ 6 more variables: Class_X_Percentage <chr>, Class_XII_Percentage <chr>,
## # Father_occupation <chr>, Mother_occupation <chr>, time <chr>,
## # Performance <chr>
Examination Performance: Resultado del estudiante
en el examen de admisión.
Sex: Género del candidato.
Caste: Clasificación de casta del candidato.
Coaching Details: Tipo de clases preparatorias
asistidas por el candidato.
Board Details: Consejo educativo en los grados X y
XII.
Medium of Instruction: Idioma de enseñanza en el
grado XII.
Class X Percentage: Calificación porcentual en el
grado X.
Class XII Percentage: Calificación porcentual en el
grado XII.
Father’s Occupation / Mother’s Occupation:
Profesión de los padres del candidato
En este conjunto de datos, la variable dependiente (Y) es
Examination Performance, ya que representa el resultado del examen que
se desea predecir. Las variables independientes (X), que pueden influir
en ese resultado, incluyen el género, casta, tipo de preparación,
consejo educativo, idioma de enseñanza, calificaciones en grados X y
XII, y la ocupación de los padres. Estas variables permiten analizar
cómo factores académicos y socioeconómicos afectan el desempeño en
exámenes de admisión.
Por lo que, nuestro problema estadistico para esta base de datos
sera ¿Qué factores personales, educativos y familiares influyen
significativamente en el rendimiento de los estudiantes en el examen de
ingreso universitario?