Introducción

Un fondo de inversion (mutual fund) es un producto financiero compuesto por el dinero de varios inversionistas, recaudado con el fin de invertir en valores como acciones, bonos, instrumentos del mercado monetario y otros activos. Los fondos de inversión son operados por administradores de fondos profesionales, quienes invierten los activos del fondo para producir ganancias de capital e ingresos para los inversionistas. Así, cada accionista participa proporcionalmente en las ganancias o pérdidas del fondo. Por lo general, los fondos invierten en una gran cantidad de valores, y el rendimiento se suele rastrear como el cambio en la capitalización de mercado total del fondo, derivado del rendimiento agregado de las inversiones subyacentes. El objetivo de este caso es estudiar descriptiva y probabilísticamene la estructura de los fondos, primordialmente en términos de riesgo.

Base de datos

El archivo Bond Funds contiene información sobre \(p=9\) variables de una muestra de \(n=184\) fondos de inversión:

  • Número de fondo (Fund number): número de identificación de cada fondo.
  • Tipo (Type): tipo de fondo (intermediado por el gobierno o corporativo a corto plazo).
  • Activos (Assets): activos en millones de dólares.
  • Cargos (Fees): cargos de venta (no o sí).
  • Relación de gastos (Expense ratio): proporción de gastos a activos netos en porcentaje.
  • Retorno en 2009 (Return 2009): rendimiento a doce meses en 2009.
  • Retorno a tres años (3 year return): rendimiento anualizado, 2007-2009.
  • Retorno a cinco años (5 year return): rendimiento anualizado, 2005-2009.
  • Riesgo (Risk): riesgo de pérdida del fondo (abajo promedio, promedio o por encima del promedio).

Base de datos tomada de Berenson et al., 2012 (Basic Business Statistics, Twelfth Edition, Prentice Hall).

# establecer directorio de trabajo
#setwd("C:/Users/Juan Camilo/Dropbox/UE/Metodos Cuantitativos 1 - II-2020/caso 1")
# importar conjunto de datos
#datos <- read.delim2("Bond Funds.txt")
datos<- read.delim2("C:/Users/HI/Downloads/Bond Funds.txt")
# renombrar las variables
colnames(datos) <- c("id","tipo","activos","cargos","relacion",
                     "retorno09","retorno3", "retorno5","riesgo")

Nota: el retorno (rendimiento) de cualquier inversión, medido en un período de tiempo dado, es simplemente la suma de su apreciación de capital y cualquier ingreso generado dividido por el monto original de la inversión, que se expresa como un porcentaje.

Análisis descriptivo

  1. Clasificar las variables según su naturaleza (cualitativa/cuantitativa discreta/cuantitativa continua).

Según su naturaleza las variables dentro del estudio, se pueden clasificar como se presentan en la Tabla 1.

Tabla 1. Operacionalización de las variables.
Variable Definición_variable Tipo_variable Clasificación
Número de fondo Número de identificación de cada fondo. Cualitativa ordinal FN-1,…,FN-i, i=1,…,184
Tipo Tipo de fondo. Cualitativa Nominal Intermediado por el gobierno-corporativo a corto plazo
Activos Activos Cuantitativa Continua Millones de dolares
Cargos Cargos de venta Cualitativa Nominal No, Si
Relación de gastos Proporción de gastos a activos netos. Cuantitativa Continua Porcentaje
Retorno en 2009 Rendimiento a doce meses en 2009. Cuantitativa Continua Porcentaje
Retorno a tres años Rendimiento anualizado, 2007-2009. Cuantitativa Continua Porcentaje
Retorno a cinco años Rendimiento anualizado, 2005-2009. Cuantitativa Continua Porcentaje
Riesgo Riesgo de pérdida del fondo Cualitativa Ordinal Abajo promedio, promedio o por encima del promedio
Note:
Fuente: Proyecto de investigación
  1. Construir tablas cruzadas (de frecuencias conjuntas) junto con los gráficos de barras correspondientes para: a. tipo (columnas) frente a cargos (filas), b. tipo (columnas) frente riesgo (filas), y c. cargos (columnas) frente a riesgo (filas). Teniendo en cuenta estas tablas de contingencia y los gráficos, ¿qué puede decir acerca de las relaciones entre estas variables? Nota: expresar las cifras en puntos porcentuales con 2 decimales e incluir los totales marginalmente.

a.

Tabla 2. Puntos porcentuales y totales marginales correspondientes tipo (columnas) frente a cargos (filas).
Cargos
Tipo
Intermediado por el gobierno Corporativo a corto plazo Sum
No 28.80 41.85 70.65
Si 18.48 10.87 29.35
Sum 47.28 52.72 100.00
Note:
Fuente: Proyecto de investigación

De la Tabla 2. observamos que el 47.28\(\%\) de todos los fondos de inversiones son intermediados por el gobierno, contrastado con el 52.72 \(\%\) que son corporativos a corto plazo.

Del mismo modo vemos que de todos los fondos de inversiones, el 70.65 \(\%\) no tiene cargos por impuestos, y el 29.35\(\%\) si presenta cargos.

Se notó que el 28.8\(\%\) de los fondos son intermediados por el gobierno y no tienen cargos por impuesto, mientras el 18.48 \(\%\) son de este tipo y si presentan cargos. Además el 41.85 \(\%\)de los fondos son corporativos a corto plazo y no tienen cargos por impuesto, con respecto al 10.87\(\%\) de este tipo de fondos que si presenta cargos. Podemos interpretar estas diferencias desde un punto de vista grafico a continuación.

b.

Tabla 3. Puntos porcentuales y totales marginales correspondientes Tipo (columnas) frente a Riesgo (filas).
Riesgo
Tipo
Intermediado por el gobierno Corporativo a corto plazo Sum
Por encima del promedio 15.76 16.30 32.07
Promedio 17.39 20.11 37.50
Abajo promedio 14.13 16.30 30.43
Sum 47.28 52.72 100.00
Note:
Fuente: Proyecto de investigación

De la Tabla 3. observamos que el 32.07\(\%\) de todos los fondos de inversiones presentan riesgo de pérdida por encima del promedio, el 37.50\(\%\) presentan riesgos con respecto al promedio y finalmente el 30.43\(\%\) de los fondos tienes riesgos por abajo del promedio.

Además vemos que 15.76 \(\%\) de los fondos son intermediados por el gobierno y tienen riesgos por encima del promedio, mientras que el 14.13 \(\%\) son de este tipo y tienen riesgos por abajo del promedio. El 16.30 \(\%\)de los fondos son corporativos a corto plazo y tienen riesgos por encima del promedio, con respecto al 16.30\(\%\) de este tipo de fondos que tienen riesgos por abajo del promedio. Podemos apreciar estas interpretaciones desde un punto de vista grafico a continuación.

c.
Tabla 3. Puntos porcentuales y totales marginales correspondientes Cargos (columnas) frente a Riesgo (filas).
Riesgo
Cargos
No Si Sum
Por encima del promedio 20.11 11.96 32.07
Promedio 26.63 10.87 37.50
Abajo promedio 23.91 6.52 30.43
Sum 70.65 29.35 100.00
Note:
Fuente: Proyecto de investigación

con base en la Tabla 4. observamos que el 20.11\(\%\) de los fondos no presentan cargos por impuestos y tienen riesgos por encima del promedio, mientras que el 11.96 \(\%\) de los fondos si presentan cargos por impuestos y tienen riesgos por encima del promedio. Por otro lado vemos que el 23.91\(\%\) de los fondos no presentan cargos por impuestos y tienen riesgos por abajo del promedio y tan solo 6.52\(\%\) presenta cargos por impuestos y tienen riesgos por abajo del promedio. Complementamos esta información desde un punto de vista grafico a continuación.

De manera general, más de las mitad de los fondos de inversiones son corporativos a corto plazo. La mayoria de estos fondos no presentan cargos por impuestos. Y en cuanto al riesgo por perdida, el panorama es muy parejo en estas categorias, sin embargo el riesgo en el promedio tiene mayor prevalencia 37.5\(\%\).

  1. Calcular la matriz de correlación y graficar los dispersogramas para describir las relaciones entre: activos, relación de gastos, retorno en 2009, retorno anualizado a tres años, y el retorno anualizado a cinco años. Teniendo en cuenta las correlaciones y los dispersogramas, ¿qué puede decir acerca de las relaciones entre estas variables?
##           activos relacion retorno09 retorno3 retorno5
## activos   100.000  -32.468     5.257   12.465   14.891
## relacion  -32.468  100.000     7.051    5.024   -0.054
## retorno09   5.257    7.051   100.000    5.643    8.626
## retorno3   12.465    5.024     5.643  100.000   98.628
## retorno5   14.891   -0.054     8.626   98.628  100.000

Al explorar la relación entre todas las variables, notamos relaciones positivas y algunas negativas, sin embargo vemos que algunas asociaciones son más fuertes que otras. Mencionamos las mas distintivas; como era de esperarse las variables activos por millones y la relación entre los gastos estan relacionadas, al tener un coeficiente de correlación negativo de -32.5 \(\%\) el cual nos indica que la relación es inversa e intermedia al ser un valor cercano a cero, es decir que aquellos fondos de inversiones con mayores activos presentaron una menor proporción de gastos a activos netos en porcentaje o viceversa aquellos fondos de inversiones con menores activos presentaron una mayor proporción de gastos a activos netos en porcentaje.

Por otro lado, las variables retorno a tres años y retorno a cinco años tambien estan relacionadas. Con un coeficiente de correlación del 98.62\(\%\), el cual nos indica una relación directa y fuerte, este argumento se respalda por el dispersograma cuyo grafico corresponde a la posición \((i,j)=(4,5)\), se puede apreciar en él, que la nube de puntos, tiene puntos seguidos uno detrás del otro, mostrando una relación lineal perfecta. Desde un punto de vista argumentativo, vemos que aquellos fondos de innversiones, que presentaron un rendimiento anualizado del 2007 al 2009 alto, tuvieron un rendimiento anualizado del 2005 al 2009 alto.

En cuanto al resto de las variables, las asociaciones fueron debiles, el coeficiente de correlación de pearson estuvo cercano al cero. Sin embargo mencionamos que los activos en millones presentaron una relación directa con los rendimientos anualizados, rendimientos a tres años y rendimientos a cinco años, el dispersograma para estas relaciones, muestra la presencia de datos atipicos.

La variable relación entre los gastos presentó asociaciones directas y debiles con las variables rendimiento anualizado y rendimiento a tres años. y finalmente una relación inversa pero tambien debil con el rendimiento a cinco años.

  1. Comparar los rendimientos de los fondos en 2009 en función del riesgo. Para cada uno de los tres niveles de riesgo (por debajo del promedio, promedio, por encima del promedio), calcular el mínimo, el máximo, la media, la mediana, el coeficiente de variación (CV), el coeficiente de asimetría de Fisher (AF), y el coeficiente de Gini, de los rendimientos en 2009, junto con los diagramas de caja e histogramas correspondientes. ¿A qué conclusiones puede llegar acerca de las diferencias entre los fondos en función del riesgo? Nota: presentar los resultados de las medidas en una tabla como la siguiente:
Tabla 4. Puntos porcentuales y totales marginales correspondientes Cargos (columnas) frente a Riesgo (filas).
Mínimo Máximo Mediana Media CV AF Gini
Debajo del promedio 0.2 13.0 6.1 6.31 42.88 15.89 24.3
Al rededor del promedio -1.1 16.4 6.0 6.87 63.89 18.30 NA
Encima del promedio -8.8 32.0 7.9 8.31 111.13 48.36 NA
Note:
Fuente: Proyecto de investigación

Observamos que el 50\(\%\) de los fondos de inversiones que presentaron riesgos por debajo del promedio, acumularon un rendimiento durante el 2009 antes de 6.1 \(\%\) y el un 25\(\%\) de los fondos con riesgos por debajo del promedio tuvieron rendimientos por encima de 8.125\(\%\), la distancia que separa el 50\(\%\) de los rendimientos centrales para las empresas con riesgo debajo del promedio, es del 3.2\(\%\)

El 50\(\%\) de los fondos de inversiones que presentaron riesgos en el promedio, acumularon un rendimiento durante el 2009 antes de 6\(\%\) y un 25\(\%\) de los fondos con riesgos en el promedio tuvieron rendimientos por encima de 10.8\(\%\), la distancia que separa el 50\(\%\) de los rendimientos centrales para las entidades con riesgo en el promedio, es del 7.3\(\%\)

El 50\(\%\) de los fondos de inversiones que presentaron riesgos por encima el promedio, acumularon un rendimiento durante el 2009 antes de 6.3\(\%\) y un 25\(\%\) de los fondos con riesgos en el promedio tuvieron rendimientos por encima de 13.9\(\%\), la distancia que separa el 50\(\%\) de los rendimientos centrales para las entidades con riesgo encima el promedio, es del 13.05\(\%\)

El coeficiente de asimetría de Fisher, indicó que las tres distribuciones de rendimientos de los fondos en 2009 en función del riesgo, eran sesgadas a la derecha, es decir que hubo una proporción importante de fondos inversionistas con rendimientos durante el 2009 más grandes en comparación con el resto, para cada grupo del riesgo. Cabe mencionar que la distribución más sesgada fue el rendimiento con riesgo por encima del promedio, esta afirmación se puede verificar con los histogramas y con la cuantificación del sesgo Tabla 4., además se evidencia al tener una media más inflada con respecto a los valores extremos, comparada con las demás distribuciones. Su coeficiente de variabilidad fue alto con repecto al valor promedio, siendo exactos del 111.13 \(\%\), es decir que los fondos con riesgo por encima del promedio presentaron rendimientos durante el 2009 muy heterogeneos o muy alejados de la media.

  1. Descomponer la variabilidad total de los rendimientos de los fondos en 2009 en función del riesgo. Calcular la proporción de varaibilidad debida tanto a la intra como la inter varianza de los grupos. ¿Qué puede decir del riesgo como variable segmentadora de los rendimientos?

Al descomponer la variabilidad total de los rendimientos de los fondos en 2009 en función del riesgo, obtuvimos una variabilidad dentro de los grupo del riesgo (intravarianza) del 36.42\(\%\) y una variabilidad entre los grupos del riesgo (intervarianza) del 0.68\(\%\), es decir una varianza que ocurre dentro de cada categoria del riesgo y una que ocurre entre las categorias. De modo que se satisface la siguiente igualdad.

\[Vartotal=Varianza(dentro)+Varianza(entre)\]

En este caso la varianza que más predominó fue la presente dentro de los grupos de riesgo, es decir que no hubo diferencia o variabilidad entre los grupos de riesgo, pero dentro de cada grupo de riesgo(abajo del promedio, promedio y por encima del promedio) la rentabilidad en el 2009 para los fondos de inversión fue heterogenea.

La proporción de intra-varianza fue del 98.16\(\%\) mayor que la proporción de inter-varianza que corresponde al 1.83\(\%\), esto era algo de esperarse, ya que al visualizar la distribución del rendimiento en el 2009 en función del bajo riesgo, vimos que estos eran sesgadas por la derecha dejando una proporción importante de fondos con rendimientos altos por encima del resto, para cada grupo.

En este caso no se considera el Riesgo como una variable segmentadora apropiada, debido a que el ideal sería tener una variable de agrupamiento que produzca mucha heterogeneidad entre grupos, pero homogeneidad dentro de los grupos.

Cálculo de probabilidades

Con el fin de evaluar el riesgo de los fondos en función de otras variables, a continuación se consideran algunas probabilidades:

Calcular y representar gráficamente todas las probabilidades condicionales para comparar los niveles de riesgo en función de: a. el tipo de fondo de inversión, y b. los cargos de venta. Presentar estas probabilidades tabular y gráficamente. Nota: calcular los perfiles fila o columna según corresponda a partir de las tablas cruzadas del numeral 2. de la sección anterior. ¿Existen diferencias sustanciales entre los diferentes niveles de riesgo en términos del tipo de fondo de inversión y los cargos de venta?

Independencia de eventos

Considere los siguiente eventos:

  • \(A\): “el fondo de inversión sí tiene carga de impuestos”.

Dada la información reflejada en las tablas conjuntas tenemos que: \(P(A)=0.29\)

  • \(B\): “el fondo de inversión es intermediado por el gobierno”.

Dada la información reflejada en las tablas conjuntas tenemos que: \(P(B)=0.47\)

  • \(E\): “el fonfo de inversión tiene riesgo por encima del promedio”.

Dada la información reflejada en las tablas conjuntas tenemos que: \(P(E)=0.33\)

Para dar respuesta tendremos en cuenta que, dados dos eventos \(A\) y \(B\), diremos que son independientes si se cumple que \(P(A|B)=P(A)\); es decir si el estado de información de \(A\) no depende de \(B\).

  1. ¿Los eventos \(A\) y \(E\) son independientes? ¿Por qué?

De las Tabla 5.(Anexos) por perfiles columnas tenemos que \(P(E|A)=0.41\neq P(E)\), dado que \(P(E)=0.33\)

Por lo tanto los eventos \(A\) y \(E\) son dependientes.

  1. ¿Los eventos \(B\) y \(E\) son independientes? ¿Por qué?

De las Tabla 6. (Anexos) por perfiles columnas tenemos que \(P(E|B)=0.33= P(E)\), dado que \(P(E)=0.33\)

Luegos los eventos \(E\) y \(B\) son independientes

  1. ¿Qué implicaciones tienen estos resultados sobre los fondos con riesgos por encima del promedio?

Inicialmente, que el riesgo del fondo, depende en gran medida de los cargos por impuestos, esto se puede evidenciar en los perfiles por columnas, en donde los fondos con cargos por impuestos, tenian una probabilidad mayor de tener riesgos por encima del promedio, seguidos de la probabilidad de riesgo en el promedio y finalmente con menor probabilidad de riesgo debajo del promedio.

En cuanto al riesgo del fondo y el tipo de fondo vemos que hay independencia, no se puede inferir cual riesgo es más probable que presente un fondo, de acuerdo a la naturaleza de este.

Conlclusiones

Con base en los resultados de las secciones anteriores proporcione algunas conclusiones de forma puntual y concisa, teniendo en cuenta las siguientes preguntas:

¿Los fondos intermediados por el gobierno tienden a ser inversiones menos riesgosas que los fondos corporativos a corto plazo?

¿Los fondos con menores rendimientos tienden a ser inversiones menos riesgosas que los fondos con mayores rendimientos?

¿Existe una relación entre los activos, la relación de gastos y los rendimientos de los fondos?

¿Hay una diferencia en los rendimientos de los fondos intermediados por el gobierno y los fondos corporativos a corto plazo?

Anexos

Tabla 5. Perfiles por columnas,correspondientes Tipo (columnas) frente a Riesgo (filas).
Riesgo
Tipo
Intermediado por el gobierno Corporativo a corto plazo
Por encima del promedio 33.33 30.93
Promedio 36.78 38.14
Abajo promedio 29.89 30.93
Sum 100.00 100.00
Note:
Fuente: Proyecto de investigación
Tabla 6. Perfiles por columnas, correspondientes Cargos (columnas) frente a Riesgo (filas).
Riesgo
Cargos
No Si
Por encima del promedio 28.46 40.74
Promedio 37.69 37.04
Abajo promedio 33.85 22.22
Sum 100.00 100.00
Note:
Fuente: Proyecto de investigación

Gráficos