Descripción

Este informe desarrolla análisis estadísticos aplicados a una muestra de 67 empresas del sector de servicios financieros que hacen parte del índice S&P 500. El objetivo es aplicar conceptos de intervalos de confianza y pruebas de hipótesis sobre variables cuantitativas y proporciones.
La variable cualitativa “City” fue recodificada en dos grupos: Top 5 ciudades con mayor frecuencia y Otras ciudades. A partir de esta clasificación, se comparan dos subpoblaciones.

- Definición de variables cuantitativas.

A continuación, se identifican las variables cuantitativas seleccionadas para el análisis estadístico. Estas variables contienen información financiera clave de las empresas del sector de servicios financieros y serán utilizadas para estimaciones puntuales, intervalos de confianza y pruebas de hipótesis:
x1 = DatosNuevos3$Currentprice
x2 = DatosNuevos3$Marketcap
x3 = DatosNuevos3$Revenuegrowth
x4 = DatosNuevos3$Weight
Estas variables permiten evaluar el comportamiento financiero de las compañías y comparar resultados entre los grupos definidos por la variable cualitativa City

- Se asume normalidad.

Como segundo punto, se asume normalidad de las variables cuantitativas con fines metodológicos, a pesar de que los datos no presentan una distribución normal según las pruebas realizadas. Esta decisión permite aplicar procedimientos paramétricos que simplifican el desarrollo del trabajo y mantienen coherencia con los contenidos abordados en clase.

- Nivel de confianza y nivel de significancia.

Se adopta un nivel de confianza del 95%, lo que implica un nivel de significancia (α) del 5% para todas las pruebas estadísticas realizadas.

Estimaciones puntuales y por intervalos del promedio y la desviación estándar

Cálculo e interpretación de las estimaciones puntuales de una población

Se presentan las estimaciones puntuales del promedio y la desviación estándar para las variables cuantitativas analizadas, con el fin de caracterizar la muestra en términos de magnitud y dispersión. Estas medidas permiten comprender el comportamiento financiero de las empresas del sector y sirven como base para los análisis inferenciales posteriores.
- Currentprice presenta un precio promedio de aproximadamente 202.39 USD, con una desviación estándar de 183.82 USD, lo que indica una alta variabilidad entre los precios de las acciones dentro del sector financiero. Esta dispersión sugiere la coexistencia de empresas con valores bursátiles muy distintos.
- Marketcap tiene un promedio de 106.09 mil millones USD, con una desviación estándar de 167.01 mil millones USD, reflejando una amplia dispersión en el tamaño de las empresas analizadas. Esto evidencia la presencia de compañías tanto de gran escala como de menor capitalización dentro del conjunto de datos.
- Revenuegrowth muestra un crecimiento promedio de 12.30%, con una desviación estándar de 24.40%, lo que sugiere diferencias significativas en el desempeño de ingresos entre compañías. Esta variabilidad puede estar asociada a factores como el modelo de negocio, la etapa de desarrollo o el entorno competitivo.
- Weight tiene un promedio de 0.00191, con una desviación estándar de 0.00300, lo que indica que la mayoría de las empresas tienen un peso relativamente bajo dentro del índice S&P 500, aunque con algunas excepciones notables que poseen una influencia considerable en el mercado.

Cálculo e interpretación de las estimaciones por intervalos de una población

Los siguientes intervalos de confianza del 95% permiten estimar con mayor precisión los parámetros poblacionales de las variables cuantitativas analizadas. Cada intervalo refleja el rango dentro del cual se espera que se encuentre el valor verdadero del parámetro, considerando la variabilidad de la muestra y el nivel de confianza establecido.
Promedio
En cuanto al precio actual de las acciones (Currentprice), se estima que el valor medio poblacional se encuentra entre 158.38 USD y 246.41 USD, lo que indica una dispersión moderada en los precios de las acciones dentro del sector financiero.
Para la capitalización de mercado (Marketcap), el promedio poblacional se ubica entre 66.10 mil millones USD y 146.08 mil millones USD, lo que refleja una alta heterogeneidad en el tamaño de las empresas analizadas.
En relación con el crecimiento de ingresos (Revenuegrowth), se estima que el crecimiento medio poblacional se encuentra entre 6.45% y 18.14%, lo que sugiere un comportamiento financiero variable entre las compañías del sector.
Respecto al peso en el índice (Weight), el promedio poblacional se encuentra entre 0.00119 y 0.00263, lo que confirma que la mayoría de las empresas tienen una participación baja en el índice S&P 500, aunque con algunas diferencias entre ellas.
Desviación estándar
En cuanto a la desviación estándar del precio actual de las acciones, se estima que el parámetro poblacional se encuentra entre 157.11 USD y 221.55 USD, lo que indica una alta dispersión en los precios de las acciones dentro del sector.
Para la capitalización de mercado, el intervalo de confianza para la desviación estándar va de 142.74 mil millones USD a 201.29 mil millones USD, evidenciando una gran variabilidad en el tamaño de las empresas incluidas en la muestra.
En el caso del crecimiento de ingresos, la desviación estándar poblacional se encuentra entre 20.86% y 29.41%, lo que muestra diferencias significativas en el desempeño financiero de las compañías analizadas.
Finalmente, la desviación estándar del peso en el índice se estima entre 0.00257 y 0.00362, lo que indica que, aunque la mayoría de las empresas tienen un peso reducido, existen algunas con una influencia relativa considerablemente mayor dentro del índice.

Cálculo e interpretación de las estimaciones puntuales de dos población

Se comparan las estimaciones puntuales del promedio y la desviación estándar de las variables cuantitativas entre dos subpoblaciones definidas por la variable cualitativa City: empresas ubicadas en las Top 5 ciudades y aquellas en Otras ciudades. Esta comparación permite identificar diferencias relevantes en magnitud y dispersión entre los grupos.
Promedio (media)
En relación con el precio actual de las acciones, las empresas en las Top 5 ciudades presentan un promedio de 220.67 USD, superior al de las empresas en otras ciudades, que es de 188.45 USD. Esta diferencia sugiere una mayor valoración bursátil en los principales centros financieros.
Para la capitalización de mercado, el promedio en las Top 5 ciudades alcanza los 112.78 mil millones USD, mientras que en otras ciudades es de 100.99 mil millones USD. Aunque la diferencia es moderada, se observa una ligera concentración de empresas de mayor tamaño en las ciudades principales.
En cuanto al crecimiento de ingresos, se presenta un comportamiento inverso: las empresas en otras ciudades tienen un promedio de 13.40%, superior al 10.85% observado en las Top 5. Esto podría indicar un mayor dinamismo en mercados menos concentrados o en expansión.
Respecto al peso en el índice, las empresas en las Top 5 ciudades tienen un promedio de 0.00203, mientras que en otras ciudades es de 0.00182. Esta diferencia refleja una mayor influencia relativa de las empresas ubicadas en los principales centros dentro del índice S&P 500.
Desviación estándar
En cuanto a la variabilidad del precio actual de las acciones, las empresas en las Top 5 ciudades presentan una desviación estándar de 222.14 USD, frente a 149.89 USD en otras ciudades. Esto indica una gama más amplia de valores bursátiles en los principales centros financieros.
Para la capitalización de mercado, la dispersión es considerablemente mayor en otras ciudades, con una desviación estándar de 190.69 mil millones USD, en comparación con 132.70 mil millones USD en las Top 5. Esto sugiere una mayor heterogeneidad en el tamaño de las empresas fuera de los principales núcleos.
En el caso del crecimiento de ingresos, la variabilidad es más alta en otras ciudades (29.65%) que en las Top 5 (15.43%), lo que refuerza la idea de un comportamiento más diverso en mercados secundarios, posiblemente influenciado por factores regionales o sectoriales.
Finalmente, la dispersión del peso en el índice también es mayor en otras ciudades, con una desviación estándar de 0.00343, frente a 0.00239 en las Top 5. Esto indica una distribución más desigual de la influencia relativa en el índice fuera de los principales centros financieros.

Cálculo e interpretación de las estimaciones por intervalos de dos poblaciones

Se presentan los intervalos de confianza del 95% para la media de cada variable cuantitativa, diferenciando entre empresas ubicadas en las Top 5 ciudades y aquellas en Otras ciudades. Estos intervalos permiten estimar el valor medio poblacional con un margen de precisión, considerando la variabilidad de cada grupo.
En cuanto al precio actual de las acciones, las empresas ubicadas en las Top 5 ciudades presentan un intervalo de confianza de [167.47, 273.86] USD, mientras que las empresas en otras ciudades tienen un intervalo de [152.55, 224.34] USD. Aunque los rangos se superponen parcialmente, se observa una tendencia hacia precios más altos en las principales ciudades.
Para la capitalización de mercado, el intervalo de confianza en las Top 5 ciudades es de [81,002,764,516, 144,554,222,011] USD, mientras que en otras ciudades es de [55,328,295,930, 146,649,948,058] USD. A pesar de que los límites superiores son similares, las empresas en las Top 5 presentan una capitalización mínima más elevada, lo que sugiere una mayor concentración de grandes empresas en esos centros financieros.
En relación con el crecimiento de ingresos, las empresas en las Top 5 ciudades tienen un intervalo de [0.0716, 0.1455], mientras que las de otras ciudades presentan un rango más amplio de [0.0630, 0.2050]. Esto indica una mayor variabilidad y potencial de crecimiento en las empresas ubicadas fuera de los principales centros financieros.
Respecto al peso en el índice, el intervalo para las Top 5 ciudades es de [0.00146, 0.00260], y para las otras ciudades es de [0.00100, 0.00264]. Aunque los rangos son similares, las empresas en las Top 5 tienden a tener un peso ligeramente más alto en promedio dentro del índice S&P 500.
Por otro lado, los intervalos de confianza del 95% para la desviación estándar permiten estimar la variabilidad poblacional de cada variable cuantitativa, diferenciando entre los mismos dos grupos. Estos rangos reflejan el grado de dispersión de los datos dentro de cada subpoblación.
Para el precio actual de las acciones, la desviación estándar en las Top 5 ciudades se encuentra entre [189.86, 267.75] USD, mientras que en otras ciudades va de [128.11, 180.66] USD. Esto sugiere una mayor dispersión de precios en las principales ciudades, posiblemente debido a la presencia de empresas con valores bursátiles más extremos.
En cuanto a la capitalización de mercado, el intervalo en las Top 5 ciudades es de [113,421,491,218, 159,948,000,000] USD, y en otras ciudades de [162,983,484,140, 229,840,817,866] USD. La mayor dispersión en otras ciudades indica una mayor heterogeneidad en el tamaño de las empresas fuera de los principales centros financieros.
Para el crecimiento de ingresos, las Top 5 ciudades presentan un intervalo de desviación estándar entre [0.1319, 0.1860], mientras que en otras ciudades el rango es de [0.2534, 0.3574]. Esta diferencia refleja una mayor variabilidad en el desempeño financiero de las empresas fuera de las ciudades principales.
Finalmente, en el caso del peso en el índice, el intervalo de desviación estándar en las Top 5 ciudades es de [0.00204, 0.00288], mientras que en otras ciudades es de [0.00293, 0.00414]. Esto indica que las empresas fuera de las Top 5 presentan una distribución más desigual en su influencia relativa dentro del índice S&P 500.

Estimación puntual y por intervalos de la proporción de acuerdo a la variable cualitativa

Se presenta la estimación puntual y por intervalo de la proporción de empresas según la variable cualitativa City, que clasifica las observaciones en dos grupos: Top 5 ciudades y Otras ciudades. Esta proporción permite conocer la distribución relativa de las empresas dentro de cada subpoblación geográfica y sirve como base para los análisis comparativos posteriores.
La estimación puntual indica que el 56.72% de las empresas pertenecen al grupo de Otras ciudades, mientras que el 43.28% se encuentran en las Top 5 ciudades. Esta diferencia revela que, dentro del conjunto de datos analizado, existe una mayor representación de empresas ubicadas fuera de los principales centros financieros.
Para complementar, se calcula el intervalo de confianza del 95% para la proporción de empresas en las Top 5 ciudades, obteniendo un rango de [0.3142, 0.5515]. Esto significa que, con un 95% de confianza, se espera que la proporción real de empresas en las Top 5 ciudades se encuentre entre 31.42% y 55.15%. Este intervalo refleja la incertidumbre asociada a la estimación muestral y permite realizar inferencias sobre la distribución poblacional del sector financiero.

Diferencia entre las proporciones de las variables cuantitativas, con base en la variable cualitativa

Usando la variable cuantitativa Currentprice se define el éxito cómo:
Yi = Precio de la acción superior a 400 USD.
1 va a ser Top 5 de ciudades, 2 va a ser Otras ciudades.
Se busca saber si existe una diferencia significativa entre las proporciones de empresas exitosas ubicadas en las Top 5 ciudades frente a aquellas en Otras ciudades, dentro del sector de servicios financieros.
Se presenta el intervalo de confianza del 95% para la diferencia de proporciones entre dos subpoblaciones definidas por la variable cualitativa City. Esta estimación permite evaluar si existe una diferencia significativa en la proporción de éxito (según el criterio definido previamente) entre empresas ubicadas en las Top 5 ciudades y aquellas en Otras ciudades.
El intervalo obtenido para la diferencia de proporciones es [–0.0805, 0.1622]. Este rango incluye el valor cero, lo que indica que no se puede afirmar con un 95% de confianza que exista una diferencia estadísticamente significativa entre las proporciones de éxito de los dos grupos.
Esto significa que, aunque se observa una diferencia en las proporciones muestrales, dicha diferencia podría deberse al azar o a la variabilidad inherente a la muestra. Por lo tanto, no hay evidencia suficiente para concluir que la ubicación geográfica (Top 5 vs Otras ciudades) influya de manera significativa en la proporción de empresas exitosas bajo el criterio establecido.

Pruebas de hipótesis para los parámetros de una población y de dos poblaciones

Prueba de hipótesis para verificar la normalidad de la variable cuantitativa “Currentprice”
H0: Los datos provienen de una normal.
H1: Los datos no provienen de una normal
Dado que el valor p es menor que el nivel de significancia (1.063e-07 < α = 0.05), se rechaza la hipótesis nula.
Se concluye que los datos de la variable Currentprice no provienen de una distribución normal.
Prueba de hipótesis para una población: Marketcap
H0: μ = 90,000,000,000
H1: μ > 90,000,000,000
Se realiza una prueba de hipótesis para una sola población con el objetivo de evaluar si la capitalización promedio de mercado (Marketcap) de las empresas del sector financiero supera los 90,000 millones USD. Para ello, se plantea una hipótesis nula (H0) que establece que el valor medio poblacional es igual a 90,000 millones USD, frente a una hipótesis alternativa (H1) que propone que dicho valor es mayor.
La prueba se lleva a cabo bajo el supuesto de normalidad, utilizando una prueba t para una muestra con cola derecha. El valor observado del estadístico t es 0.7887 y se obtiene un valor p de 0.2166.
Dado que el valor p (0.2166) es mayor que el nivel de significancia α = 0.05, no se rechaza la hipótesis nula. Por lo tanto, no se cuenta con evidencia estadística suficiente para afirmar que la capitalización promedio de mercado de las empresas del sector financiero sea superior a 90,000 millones USD.
Prueba de hipótesis para dos poblaciones
Paso 1. Definir si las varianzas son iguales o diferentes (Razón de varianzas)
H0: σ₁²/σ₂² = 1→ Las varianzas poblacionales son iguales.
H1: σ₁²/σ₂² ≠ 1→ Las varianzas poblacionales son diferentes.
El valor del estadístico F obtenido es 2.1964 y un valor p de 0.02558. Dado que este valor p es menor que el nivel de significancia α = 0.05, se rechaza la hipótesis nula que plantea igualdad de varianzas entre los dos grupos.
Por lo tanto, se concluye que existe una diferencia estadísticamente significativa entre las varianzas de los precios actuales de las acciones en empresas ubicadas en las Top 5 ciudades y aquellas en Otras ciudades.
En consecuencia, para la prueba de diferencia de medias entre ambos grupos, se debe aplicar la prueba t con varianzas desiguales.
Paso 2. Realizar la prueba de hipótesis de diferencia de medias.
H0: μ₁ - μ₂ = 0 → No hay diferencia en el promedio de Currentprice entre los dos grupos.
H1: μ₁ - μ₂ ≠ 0 → Existe una diferencia en el promedio de Currentprice entre los dos grupos.
Dado que en el paso anterior se concluyó que las varianzas son diferentes, se aplica la prueba t de Welch para muestras independientes con varianzas desiguales. El resultado arroja un estadístico t de 0.67288 y un valor p de 0.5043.
Como el valor p es mayor que el nivel de significancia α = 0.05, no se rechaza la hipótesis nula. Esto indica que no hay evidencia estadística suficiente para afirmar que existe una diferencia significativa en el promedio de Currentprice entre los dos grupos.
Además, el intervalo de confianza del 95% para la diferencia de medias es [–64.13, 128.57], lo que incluye el valor cero y refuerza la conclusión de que la diferencia observada podría deberse al azar o a la variabilidad muestral. Por lo tanto, se considera que los precios promedio de las acciones son estadísticamente similares entre empresas ubicadas en las Top 5 ciudades y aquellas en otras ciudades.