En este informe, se resuelve el Caso 2. Probabilidad e Inferencia Estadística donde se evaluan riesgos financieros y se analizan datos utilizando conceptos de probabilidad, inferencia estadística y series temporales. El trabajo se divide en dos partes:
La empresa XYZ quiere evaluar cómo se distribuyen los puntajes de riesgo crediticio de sus clientes para tomar decisiones estratégicas, como identificar clientes con mayor riesgo y premiar a los mejores. Sabemos que los puntajes siguen una distribución normal con una media de 600 y una desviación estándar de 50 puntos. Aquí analizamos:
A. ¿Cuál es la probabilidad de que un cliente tenga un puntaje menor a (<550)? Esta información permite identificar clientes en riesgo, posibilitando ajustar políticas preventivas.
#Semilla
set.seed(123) # Para reproducibilidad
# 1**Parámetros de la distribución**
media <- 600
desviacion <- 50
# a. Probabilidad de puntaje < 550
prob_550 <- pnorm(550, mean = media, sd = desviacion)
prob_550*100# Convertir a porcentaje
## [1] 15.86553
Interpretación: Aproximadamente el 15,8% de los clientes tiene un puntaje menor a 550. Para minimizar el impacto financiero de este grupo, la empresa puede reforzar sus políticas de crédito y diseñar estrategias proactivas que permitan reducir el riesgo de incumplimiento. A largo plazo, estas acciones mejorarán tanto la estabilidad financiera de la cartera como la confianza en el sistema de crédito.
B. ¿Qué porcentaje tiene puntajes promedio entre (580-620)? Aquí medimos el tamaño del segmento con riesgos moderados.
#b. Porcentaje de clientes con puntajes entre 580 y 620
prob_580_620 <- pnorm(620, mean = media, sd = desviacion) - pnorm(580, mean = media, sd = desviacion)
prob_580_620 * 100 # Convertir a porcentaje
## [1] 31.08435
Interpretación: Cerca del 31% de los clientes se encuentra en el rango de riesgo moderado. Aunque no es mucho riesgo, tampoco es completamente confiable. Se puede incentivar este segmento a migrar hacia el rango superior a través de beneficios graduales, como tasas de interés más bajas al mejorar su historial.
C. ¿Cuál es el puntaje mínimo para ser considerado en el 5% de los clientes con mayores puntajes? Esto determina el puntaje a partir del cual otorgar beneficios adicionales.
percentil_95 <- qnorm(0.95, mean = media, sd = desviacion)
percentil_95
## [1] 682.2427
Interpretación: Los beneficios se otorgarán a clientes con un puntaje superior a 682. Este grupo representa a los clientes más confiables y valiosos para la empresa. Es de utilidad identificar este segmento para campañas de fidelización.
Se estima que la probabilidad de que un cliente no pague su crédito es del 15%. En una muestra de 20 clientes. Analizamos los escenarios posibles para diseñar estrategias de mitigación.
A. Probabilidad de incumplimiento de que exactamente 3 clientes incumplan. Esto permite dimensionar casos específicos para simular el impacto financiero.
# Parámetros
n <- 20 # Tamaño de muestra
p <- 0.15 # Probabilidad de incumplimiento
# a. Probabilidad de exactamente 3 incumplimientos
prob_3 <- dbinom(3, size = n, prob = p)
prob_3* 100 # Convertir a porcentaje
## [1] 24.28289
Interpretación: La probabilidad de que exactamente 3 clientes incumplan en una muestra de 20 es del 24,2%. Esto indica que este escenario es relativamente poco probable, pero no imposible. Se puede considerar este escenario en la planificación de pérdidas esperadas para no afectar la liquidez de la empresa.
B. ¿Qué tan probable es que al menos 5 clientes incumplan?
# b. Probabilidad de que al menos 5 clientes incumplan
prob_al_menos_5 <- 1 - pbinom(4, size = n, prob = p)
prob_al_menos_5* 100 # Convertir a porcentaje
## [1] 17.01532
Interpretación: La probabilidad de que al menos 5 clientes incumplan es 17%. Este escenario refleja un riesgo más severo, pero menos probable en comparación con incumplimientos menores.En este caso de puede implementar sistemas de alerta temprana y monitoreo para identificar clientes que puedan estar cerca de incumplir.
C. ¿Cuántos clientes incumplidores podemos esperar en el 90% de los casos? Esto nos ayuda a establecer límites realistas en escenarios de planeación.
# c. Número máximo de clientes incumplidores esperados en el 90% de los casos
percentil_90 <- qbinom(0.9, size = n, prob = p)
percentil_90
## [1] 5
Interpretación: En el 90% de los casos, el número máximo de clientes que incumplirán es 5. Este valor motiva a establecer límites realistas para la planeación financiera y la gestión de riesgos. La empresa debe asegurarse de que las provisiones para pérdidas sean suficientes para cubrir hasta 5 incumplimientos en situaciones normales.
La empresa quiere analizar los días promedio de pagos atrasados en la cartera. Utilizando la muestra de 50 clientes, con un promedio de pagos atrasados de 3 días y una desviación estándar de 1.5 días.
A. Intervalo de confianza al 95%: Permite comprender la variabilidad del promedio estimado.
set.seed(123)
muestra <- rnorm(50, mean = 3, sd = 1.5) # Simulación de la muestra con media 3 y desviación estándar 1.5
# a. Intervalo de confianza 95%
t.test(muestra, conf.level = 0.95)
##
## One Sample t-test
##
## data: muestra
## t = 15.537, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 2.656911 3.446299
## sample estimates:
## mean of x
## 3.051605
ci=t.test(muestra)$conf.int
ci
## [1] 2.656911 3.446299
## attr(,"conf.level")
## [1] 0.95
Dado que el límite superior del intervalo está muy cerca de los objetivos establecidos por la empresa, podría ser necesario reforzar los incentivos para pagos puntuales. Este intervalo también es útil para evaluar si las políticas actuales están logrando reducir los días de atraso o si se necesita intervención adicional.
B. ¿Podría la empresa afirmar con un 99% de confianza que el promedio real es mayor a 2.5 días?
Prueba de hipótesis:
H₀: El promedio real de días de pago atrasado es igual a 2.5 días (μ=2.5).
H₁: El promedio real de días de pago atrasado es mayor a 2.5 días (μ>2.5).
Se realiza una prueba de hipótesis unidireccional con un nivel de significancia del 1% (α=0.01) para evaluar si H0 puede rechazarse a favor de H 1 .
#b. 99% Prueba de hipótesis: ¿El promedio real es mayor a 2.5 días?
# Prueba de hipótesis unilateral #H0:μ=2.5, H1:μ>2.5
t.test(muestra, mu = 2.5, alternative = "greater")
##
## One Sample t-test
##
## data: muestra
## t = 2.8085, df = 49, p-value = 0.003564
## alternative hypothesis: true mean is greater than 2.5
## 95 percent confidence interval:
## 2.72232 Inf
## sample estimates:
## mean of x
## 3.051605
Interpretación: La prueba muestra evidencia estadísticamente significativa para concluir que el promedio real de días de atraso es mayor a 2.5 días con un nivel de confianza del 99%. Lo cual refuerza la decisión de rechazar H0. Esto sugiere que los atrasos en los pagos están por encima del umbral esperado, lo que podría indicar problemas en la gestión crediticia o en el comportamiento de los clientes.
Planteamiento de hipótesis:
H₀: El promedio real de días de atraso es igual a 5 días (μ=5).
H₁: El promedio real de días de atraso es mayor a 5 días (μ>5).
# Generamos una muestra simulada
set.seed(123)
muestra <- rnorm(40, mean = 5.4, sd = 1.2)
# Prueba de hipótesis
t.test(muestra, mu = 5, alternative = "greater")
##
## One Sample t-test
##
## data: muestra
## t = 2.6665, df = 39, p-value = 0.005549
## alternative hypothesis: true mean is greater than 5
## 95 percent confidence interval:
## 5.167214 Inf
## sample estimates:
## mean of x
## 5.45422
Interpretación: el promedio real de días de atraso es mayor a 5 días, con un nivel de confianza del 95%.Esto implica que los clientes tienen un mayor retraso en los pagos de lo que la empresa consideraría aceptable, aumentando el riesgo financiero.
Análisis de una serie temporal de precios de una acción de GOOGLE para estudiar su rentabilidad.
library(quantmod)
# 1MERO.Descarga de la serie de interés desde Yahoo
accion <- getSymbols('GOOG', src = 'yahoo', auto.assign = FALSE, from = '2015-01-01')
# Extraer precios de cierre
precios_cierre <- accion$GOOG.Close
# Grafico de los precios de cierre
plot(precios_cierre, main = 'Precios de Cierre de GOOG', col = 'blue', lwd = 2)
Interpretación: El gráfico muestra la evolución del precio de cierre de las acciones de Google desde 2015. Se pueden observar tanto la tendencia general de los precios como los picos significativos y caídas abruptas, lo que refleja la volatilidad del mercado y el comportamiento de los inversores a lo largo del tiempo.
Además, desde el año 2019, se ha evidenciado un notable incremento en los precios, con un rango cada vez más elevado que se mantiene hasta el cierre de 2024. Este ascenso sostenido podría estar influenciado por diversos factores, como el lanzamiento de nuevos productos y servicios innovadores, el crecimiento de los ingresos publicitarios y la capacidad de Google para adaptarse y prosperar en un entorno económico cambiante.
En resumen, el gráfico no solo ilustra la volatilidad histórica y el comportamiento de los inversores, sino que también destaca la fortaleza y el crecimiento continuo de Google en los últimos años, reflejados en el aumento constante de sus precios de cierre desde 2019 hasta 2024.Como por ejemplo el pico mas alto en la gráfica se observo el 19 de noviembre del año en curso.
# 2DO.Grafico de Rentabilidad
rentabilidad <- diff(log(precios_cierre))
plot(rentabilidad, main = 'Rentabilidad Diaria', col = 'green', lwd = 2)
Interpretación del gráfico y su comportamiento Según la gráfica, podemos identificar que en el año 2020, Google experimentó un notable aumento en sus consultas. Este incremento se debe principalmente a la pandemia de COVID-19, durante la cual las personas, al estar confinadas en sus hogares, recurrieron más a esta plataforma tanto para entretenimiento como para consultas relacionadas con sus estudios.
Analizando la rentabilidad diaria del uso de Google desde 2019 hasta 2024, observamos que el año 2020 marcó un punto de inflexión significativo. La demanda por servicios de búsqueda y aplicaciones de Google creció exponencialmente, lo que se reflejó en un aumento considerable de su rentabilidad diaria. Este patrón de crecimiento continuó, aunque con fluctuaciones, en los años posteriores. En particular, se observan picos en la rentabilidad durante eventos globales importantes y lanzamientos de productos innovadores por parte de Google.
En resumen, la pandemia no solo impulsó el uso de Google en 2020, sino que también estableció una tendencia de creciente dependencia de los servicios digitales en los años subsiguientes. Este aumento en la rentabilidad diaria destaca la resiliencia y la adaptabilidad de Google en un entorno global en constante cambio.
hist(rentabilidad, breaks = 50, probability = TRUE, main = "Distribución de Rentabilidad", col = "gray")
curve(dnorm(x, mean = mean(rentabilidad, na.rm = TRUE), sd = sd(rentabilidad, na.rm = TRUE)),
col = "red", lwd = 2, add = TRUE)
El histograma muestra la distribución de la rentabilidad diaria de las acciones de Google. La curva roja superpuesta representa una distribución normal basada en la media y la desviación estándar de la rentabilidad diaria.
Teniendo en cuenta la distribución obtenida en el gráfico y ajustando la rentabilidad a una curva normal, podemos visualizar la variabilidad en la rentabilidad. En particular, observamos una rentabilidad baja; de 20 a 30 puntos en los picos más altos de rentabilidad.
summary(rentabilidad)
## Index GOOG.Close
## Min. :2015-01-02 Min. :-0.1176672
## 1st Qu.:2017-06-22 1st Qu.:-0.0071814
## Median :2019-12-11 Median : 0.0012502
## Mean :2019-12-12 Mean : 0.0007691
## 3rd Qu.:2022-06-01 3rd Qu.: 0.0094061
## Max. :2024-11-20 Max. : 0.1488718
## NA's :1
sd(rentabilidad$GOOG.Close,na.rm = TRUE)
## [1] 0.01787105
## rentabilidada estandar 0.01960405
###promedio = 0.0008124
# DESVIACIÓN ESTANDAR #
pnorm(0.0008124, mean=0.0008124,sd=0.01960405)
## [1] 0.5
#menor al promedio 0.5
Interpretación:
La probabilidad de que la rentabilidad diaria sea menor al promedio es aproximadamente 50%, lo cual es esperado si los datos siguen una distribución normal.
#intervalos de confianza
intervalo_confianza_goog<-t.test(rentabilidad$GOOG.Close, conf.level = 0.95)
intervalo_confianza_goog
##
## One Sample t-test
##
## data: rentabilidad$GOOG.Close
## t = 2.1466, df = 2487, p-value = 0.03193
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 0.0000665099 0.0014716333
## sample estimates:
## mean of x
## 0.0007690716
Interpretación:
Este rango refleja que, con un 95% de confianza, el promedio real de la rentabilidad diaria se encuentra entre 0.0072% y 0.1477%. Esto significa que si realizáramos múltiples muestras de la población y calculáramos los intervalos de confianza para cada una, aproximadamente el 95% de esos intervalos incluirían la verdadera media de la rentabilidad diaria.El análisis proporciona una estimación del rango en el que puede caer la media de la rentabilidad diaria, considerando la variabilidad de los datos. Este intervalo de confianza es fundamental para entender la consistencia y la expectativa de rentabilidad a lo largo del tiempo, permitiendo hacer inferencias sobre el rendimiento futuro basado en los datos históricos.
H₀: La rentabilidad promedio diaria es igual a 0 (μ=0).
H₁: La rentabilidad promedio diaria es distinta de 0 (𝜇≠0).
Prueba_hipotesis<-t.test(rentabilidad$GOOG.Close,conf.level = 0.95, mu=0)
Prueba_hipotesis
##
## One Sample t-test
##
## data: rentabilidad$GOOG.Close
## t = 2.1466, df = 2487, p-value = 0.03193
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 0.0000665099 0.0014716333
## sample estimates:
## mean of x
## 0.0007690716
#mu es diferente a cero = hipotesys 1 es diferente a la hipotesys Nula(hipotesys cero)
Con un p-valor de 0.0308, que es menor al nivel de significancia usual (α=0.05), rechazamos H0 .
Concluimos que hay evidencia estadísticamente significativa para afirmar que la rentabilidad promedio diaria es distinta de 0.
Esto sugiere que, en promedio, la rentabilidad diaria de las acciones analizadas es positiva.
Aunque el promedio de rentabilidad diaria es pequeño (0.077%), se debe recordar que son cifras en millones y en estrategias de inversión a largo plazo, este rendimiento puede ser aun mas significativo gracias al efecto compuesto.
Este resultado sugiere que las acciones analizadas presentan un desempeño estable y positivo, convirtiéndolas en una opción viable para estrategias conservadoras o moderadas de inversión a largo plazo. Sin embargo, los inversores deben también considerar otros factores, como la volatilidad y el contexto del mercado, para optimizar su portafolio y gestionar riesgos de manera efectiva.