INTRODUCCIÓN

Marketing Bancario

Este conjunto de datos proviene de campañas de marketing directo realizadas por una entidad bancaria portuguesa. Las campañas se desarrollaron mediante llamadas telefónicas con el objetivo de promover un producto financiero específico: depósitos a plazo fijo. A lo largo de las campañas, los agentes debían contactar en múltiples ocasiones con los clientes para evaluar su disposición a contratar el producto. La variable principal de interés es la suscripción del depósito, registrada como una respuesta binaria (“sí” o “no”), lo que permite analizar los factores que influyen en la aceptación de la oferta por parte de los clientes

Rendimiento estudiantil en un examen de ingreso

Este conjunto de datos reúne información sobre el desempeño de candidatos en un examen de admisión, junto con datos demográficos y académicos. Su propósito es facilitar el análisis de los factores que influyen en el éxito en exámenes competitivos.

COMPRESIÓN DEL NEGOCIO

Primera base de datos: Marketing Bancario

library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
Banco_2 <- read_excel("Banco 2.xlsx")
head(Banco_2)
## # A tibble: 6 × 17
##     age job        marital education default balance housing loan  contact   day
##   <dbl> <chr>      <chr>   <chr>     <chr>     <dbl> <chr>   <chr> <chr>   <dbl>
## 1    58 management married tertiary  no         2143 yes     no    unknown     5
## 2    44 technician single  secondary no           29 yes     no    unknown     5
## 3    33 entrepren… married secondary no            2 yes     yes   unknown     5
## 4    47 blue-coll… married unknown   no         1506 yes     no    unknown     5
## 5    33 unknown    single  unknown   no            1 no      no    unknown     5
## 6    35 management married tertiary  no          231 yes     no    unknown     5
## # ℹ 7 more variables: month <chr>, duration <dbl>, campaign <dbl>, pdays <dbl>,
## #   previous <dbl>, poutcome <chr>, y <chr>

Descripción de cada variable

Edad: Edad del cliente (numérico).

Trabajo: Tipo de ocupación (categoría: administrativo, tecnico, retirado, etc.).

Estado civil: Casado, soltero o divorciado/viudo.

Educación: Nivel educativo (primaria, secundaria, terciaria, desconocido).

Morosidad: Tiene deudas impagas en créditos anteriores (sí/no).

Saldo: Saldo medio anual en euros (numérico).

Vivienda: ¿Tiene préstamo hipotecario? (sí/no).

Préstamo: ¿Tiene préstamo personal? (sí/no).

Contacto: Medio usado para el contacto (teléfono, celular o desconocido).

Día: Día del último contacto (numérico).

Mes: Mes del último contacto (ene a dic).

Duración: Duración de la última llamada, en segundos.

Campaña: Número de contactos durante la campaña actual.

Pdays: Días desde el último contacto previo (-1 si nunca fue contactado).

Anterior: Número de contactos antes de esta campaña.

Poutcome: Resultado de la campaña anterior (éxito, fracaso, desconocido, otro).

y: Variable objetivo: indica si contrató un depósito a plazo (sí/no).

Las variables X son como la edad del cliente (age), su tipo de trabajo (job), su estado civil (marital), el nivel educativo (education), ¿Tiene deudas impagas en créditos anteriores? (default), el balance promedio anual (balance), si tiene préstamos de vivienda (housing), si tiene un préstamo personal (loan), el tipo de contacto realizado (contact), el día y mes del último contacto (day y month), la duración del último contacto (duration), el número de contactos en la campaña (campaign), los días desde el último contacto (pdays), el número de contactos previos (previous) y el resultado de la campaña anterior (poutcome). Por otro lado, la variable Y es el resultado que se desea predecir, en este caso, si el cliente ha suscrito o no un depósito a plazo (y), que es una variable binaria (“yes” o “no”).

Por lo tanto, nuestro problema estadistico para esta base de datos sera ¿Qué características de los clientes influyen significativamente en la probabilidad de que suscriban un depósito a plazo fijo?

Segunda base de datos: Rendimiento estudiantil en un examen de ingreso

library(readxl)
Rendimiento_2 <- read_excel("Rendimiento_2.xlsx")
head(Rendimiento_2)
## # A tibble: 6 × 12
##   Gender Caste   coaching Class_ten_education twelve_education medium 
##   <chr>  <chr>   <chr>    <chr>               <chr>            <chr>  
## 1 male   General NO       SEBA                AHSEC            ENGLISH
## 2 male   OBC     WA       SEBA                AHSEC            OTHERS 
## 3 male   OBC     OA       OTHERS              CBSE             ENGLISH
## 4 male   General WA       SEBA                AHSEC            OTHERS 
## 5 male   General OA       SEBA                CBSE             ENGLISH
## 6 male   General WA       CBSE                CBSE             ENGLISH
## # ℹ 6 more variables: Class_X_Percentage <chr>, Class_XII_Percentage <chr>,
## #   Father_occupation <chr>, Mother_occupation <chr>, time <chr>,
## #   Performance <chr>

Examination Performance: Resultado del estudiante en el examen de admisión.

Sex: Género del candidato.

Caste: Clasificación de casta del candidato.

Coaching Details: Tipo de clases preparatorias asistidas por el candidato.

Board Details: Consejo educativo en los grados X y XII.

Medium of Instruction: Idioma de enseñanza en el grado XII.

Class X Percentage: Calificación porcentual en el grado X.

Class XII Percentage: Calificación porcentual en el grado XII.

Father’s Occupation / Mother’s Occupation: Profesión de los padres del candidato

En este conjunto de datos, la variable dependiente (Y) es Examination Performance, ya que representa el resultado del examen que se desea predecir. Las variables independientes (X), que pueden influir en ese resultado, incluyen el género, casta, tipo de preparación, consejo educativo, idioma de enseñanza, calificaciones en grados X y XII, y la ocupación de los padres. Estas variables permiten analizar cómo factores académicos y socioeconómicos afectan el desempeño en exámenes de admisión.

Por lo que, nuestro problema estadistico para esta base de datos sera ¿Qué factores personales, educativos y familiares influyen significativamente en el rendimiento de los estudiantes en el examen de ingreso universitario?