set.seed(738)
datos.c <- data.frame(datos_credito)
muestra2 <- datos.c[sample(nrow(datos.c),size=100),0:14]

Medidas de tendencia central

Media

Se usara la función mean() para calcular la media de cada variable y en caso que sea necesario la función na.rm() para remover los NA existes en diferentes variables.

Formula de la media

\[ \bar{x} = \frac{1}{n}*\sum_{i=1}^{n} \]

Moda

Se usara la función ds_mode() para calcular la moda de cada variable y en caso que sea necesario la función na.rm() para remover los NA existes en diferentes variables.

Formula de la moda

\[ Moda = Dato\,de\,mayor\,frecuencia \]

Mediana

Se usara la mediana de datos pares debido al tamaño de la muestra es un número par, también se hara uso de la función sort() para organizar los datos de menor a mayor, la función median() para calcular la mediana de cada variable y en caso que sea necesario la función na.rm() para remover los NA existes en diferentes variables.

Formula de la mediana

\[ Mediana = \frac{x*(\frac{n}{2})+x*(\frac{n}{2}+1)}{2} \]

Medidas de dispersión

Rango

Se usara la función ds_range() para calcular el rango de las diferentes variables y dar una idea de la dispersión de los datos.

Formula del rango

\[R = (Max(x)-Min(x))\]

Varianza

Se usara la función var() para calcular la varianza. Esta medida nos permitira cual es la variabilidad de los datos con respecto a la media.

Formula de la varianza

\[S^2 = \frac{\sum_{i=1}^{n}*(x-\bar{x})^2}{n-1}\]

Desviación estandar

Se usara la función sd() para poder calcular la desviación estandar.

Formula de la desviación estandar

\[S = \sqrt{S^2}\]

Coeficiente de variación

Se usara la función ds_cvar() para calcular el coeficiente de variación de las variables. Este es un porcentaje que nos permitira saber que tan dispersos estan los datos.

Formula del coeficiente de variación

\[CV = \frac{S}{\bar{x}}*100\]

Medidas de posición

Cuartiles

Formula de los cuartiles

\[Q_k = \frac{K*n}{4}\]

Percentiles

Formula de los percentiles

\[P_k = \frac{K*n}{100} \] # Medidas de curtosis y apuntamiento

Curtosis

Se usara la función ds_kurtosis() para calcular la curtosis. Este nos devolvera un valor que nos permitira evaluar que tan apuntada o achatada esta la distribución con respecto a la distribución normal.

Formula de la curtosis para datos agrupados

\[g2 = \frac{1}{n}*\frac{\sum_{i=1}^{n}*f_i*(x_i-\bar{x})^4}{S^4}-3\]

Coeficiente de asimetría

Se usara la función ds_skewness() que nos devolvera el coeficiente de asimetría. Este valor nos permitira saber si la distribución esta sesgada hacía la derecha o hacía la izquierda brindandonos información de los datos y midiendo su simetría con respecto a la media.

Formula del coeficiente de asimetría de Fisher

\[\gamma = \frac{\sum_{i=1}^{n}*(x_i-\bar{x})^3}{N*S^3}\]

Interpretación de las variables

Antiguedad

Media - Antiguedad

Antiguedad = mean(muestra2$Antiguedad, na.rm=T)
Antiguedad
## [1] 6.59

La media de la Antiguedad de los entrevistados es 6.59

Moda - Antiguedad

moda_Antiguedad<- ds_mode(muestra2$Antiguedad,na.rm=TRUE);
moda_Antiguedad
## [1] 0

Se evidencia que la mayoría de personas que piden creditos no tienen años de antiguedad

Mediana - Antiguedad

median(sort(muestra2$Antiguedad, decreasing = F))
## [1] 3

La mitad de los registrados cuentan con una antigüedad laboral menor a 3 años. La otra mitad cuentan con una antigüedad laboral mayor a los 3 años.

Histograma - Antiguedad

q=sort(muestra2$Antiguedad)

x = sort(q)
df = data.frame(x)

ggplot(df, aes(x = x)) + 
  geom_histogram(aes(), colour = 1, fill = "#FF2119",bins=30) + ggtitle("Antiguedad") + xlab("Años de antiguedad")+ylab("Cuenta")+geom_vline(aes(xintercept=Antiguedad),
               color="black", linetype="dashed")

Se puede ver que el valor de la media a pesar de que no esta en el centro de la grafica si se puede ver que la mayoría de las personas tienen una antigüedad muy corta la cual esta muy cerca del valor medio entre 0 y 10 pero hay otro grupo de personas con una antigüedad muy grande superando los 30 lo que hace que la media general para esta variable se vea afectada.

Diagrama de caja - Antiguedad

ggplot(muestra2, aes(x=muestra2$Antiguedad))+geom_boxplot(fill = '#67A5B1')+labs(x="Antiguedad")

Cuartiles - Antiguedad

tcuartil_antiguedad
##   cuartil valor
## 1     25%     1
## 2     50%     3
## 3     75%    10
## 4    100%    35

Rango - Antiguedad

ds_range(muestra2$Antiguedad)
## [1] 35

Varianza - Antiguedad

round(var(muestra2$Antiguedad),3)
## [1] 60.527

Desviación estandar - Antiguedad

sqrt(round(var(muestra2$Antiguedad),3))
## [1] 7.77991

Curtosis - Antiguedad

ds_kurtosis(muestra2$Antiguedad)
## [1] 2.674021

Como la curtosis > 0 se puede interpretar como que los datos estan muy concentrados hacia la media. Se dice que su distribución es leptocúrtica.

Coeficiente de asimetría - Antiguedad

ds_skewness(muestra2$Antiguedad)
## [1] 1.640407

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Antiguedad)) + 
    geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Plazo

Media - Plazo

plazo= mean(muestra2$Plazo, na.rm=T)
plazo
## [1] 45.72

La media de los plazos tomados es de 45.72.

Moda - Plazo

moda_plazo<- ds_mode(muestra2$Plazo,na.rm = TRUE);
moda_plazo
## [1] 60

Según la muestra tomada de 100 personas podemos evidenciar que la mayoría de personas tienen sus créditos a un largo tiempo y muy pocos a tiempos cortos de pago.

Mediana - Plazo

median(sort(muestra2$Plazo, decreasing = F))
## [1] 48

La mitad de los registrados cuentan con un plazo para pagar el prestamo mayor a 48 meses. La otra mitad cuentan con menos de 48 meses.

Histograma - Plazo

q=sort(muestra2$Plazo)

x = sort(q)
df = data.frame(x)

ggplot(df, aes(x = x)) + 
  geom_histogram(aes(), colour = 1, fill = "#FF0196",bins=20) + ggtitle("Plazo") +
  xlab("Plazo de tiempo")+ylab("Cuenta")+geom_vline(aes(xintercept=plazo),
               color="black", linetype="dashed")

Como se puede ver en grafico que la media esta hacia un poco mas de la mitad del grafico ya que a pesar de que hay valores en todo el intervalo [0-60] el numero de plazos se incrementa al llegar a valores que superen los 40.

Diagrama de caja - Plazo

ggplot(muestra2, aes(x=muestra2$Plazo))+geom_boxplot(fill = '#67A5B1')+labs(title="Gráfica de caja (Plazo)",x="Plazo")

Cuartiles - Plazo

tcuartil_plazo
##   cuartil valor
## 1     25%    36
## 2     50%    48
## 3     75%    60
## 4    100%    60

Rango - Plazo

ds_range(muestra2$Plazo)
## [1] 54

Varianza - Plazo

round(var(muestra2$Plazo),3)
## [1] 234.749

Desviación estandar - Plazo

sqrt(round(var(muestra2$Plazo),3))
## [1] 15.32152

Curtosis - Plazo

ds_kurtosis(muestra2$Plazo)
## [1] -0.4472918

Como la curtosis < 0. Esto se puede interpretar como que los datos se encuentran dispersos con respecto a la media y se trata de una distribución Mesocúrtica.

Coeficiente de asimetría - Plazo

ds_skewness(muestra2$Plazo)
## [1] -0.7753363

Como el coeficiente a asimetría adopta un valor negativo se dice que es una distribución sesgada hacía la derecha, por lo que su moda es mayor a la mediana y la mediana es mayor a la moda.

ggplot(muestra2, aes(x=muestra2$Plazo)) + 
    geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Edad

Media - Edad

edad= mean(muestra2$Edad, na.rm=T)
edad
## [1] 35.23

El promedio de edad es de 35 años aproximadamente.

Moda - Edad

moda_edad<- ds_mode(muestra2$Edad,na.rm = TRUE);
moda_edad
## [1] 29

En la muestra se evidencia que la mayoría de encuestados tienen 29 años.

Mediana - Edad

median(sort(muestra2$Edad, decreasing = F))
## [1] 33

La edad de la mitad de los encuestados es menor a 33 años, la otra mitad tiene mas que esa edad.

Histograma - Edad

q=sort(muestra2$Edad)

x = sort(q)
df = data.frame(x)

ggplot(df, aes(x = x)) + 
  geom_histogram(aes(), colour = 1, fill = "#FFC913",bins=30) +
  scale_y_continuous(breaks = seq(0, 12, by = 2))+
   ggtitle("Edad") + xlab("Edad")+ylab("Cuenta")+geom_vline(aes(xintercept=edad),
               color="black", linetype="dashed")

Como se puede ver en grafico la media se ubica casi en el centro de el intervalo [30,40], también se observa que donde se agrupan mas datos atípicos es a partir de 50 años.

Diagrama de caja - Edad

ggplot(muestra2, aes(x=muestra2$Edad))+geom_boxplot(fill = '#67A5B1')+labs(title="Gráfica de caja (Edad)",x="Edad")

Cuartiles - Edad

tcuartil_edad
##   cuartil valor
## 1     25% 28.25
## 2     50% 33.00
## 3     75% 41.00
## 4    100% 66.00

Rango - Edad

ds_range(muestra2$Edad)
## [1] 47

Varianza - Edad

round(var(muestra2$Edad),3)
## [1] 105.553

Desviación estandar - Edad

sqrt(round(var(muestra2$Edad),3))
## [1] 10.2739

Curtosis - Edad

ds_kurtosis(muestra2$Edad)
## [1] 0.1212612

Como la curtosis > 0 se puede interpretar como que los datos estan muy concentrados hacia la media. Esta distribución es apuntada pero bastante similar a la distribución normal por tener un valor cercano a cero.

Coeficiente de asimetría - Edad

ds_skewness(muestra2$Edad)
## [1] 0.7175756

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Edad)) + 
    geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Gastos

Media - Gastos

mean(muestra2$Gastos, na.rm=T)
## [1] 56.29

Las personas entrevistadas gastan en promedio 56.29 dolares.

Moda - Gastos

moda_Gastos<- ds_mode(muestra2$Gastos,na.rm = TRUE);
moda_Gastos
## [1] 35

Se evidencia por medio de la gráfica que la moda en los gastos de las 100 personas es de 35, teniendo este dato la frecuencia registrada más alta

Mediana - Gastos

median(sort(muestra2$Edad, decreasing = F))
## [1] 33

La cantidad de gastos de los registrados gastan menos de 33$. La otra mitad gasta mas de 33 dolares en gastos.

Histograma - Gastos

q=sort(muestra2$Gastos)

x = sort(q)
df = data.frame(x)

ggplot(df, aes(x = x)) + 
  geom_histogram(aes(),
                 colour = 1, fill = "#00FF90",bins=20) +
   scale_y_continuous(breaks = seq(0, 26, by = 4))+
  ggtitle("Gastos registrados") + xlab("Gastos")+ylab("Cuenta")+geom_vline(aes(xintercept=mean(muestra2$Gastos, na.rm = T)),
               color="black", linetype="dashed")

Se puede ver que en este caso la media de los valores se encuentra de igual forma donde están los valores del medio en el intervalo entre 30 y 100 teniendo valores atípicos cercanos a los 150 los cuales hacen que la media se vea afectada.

Diagrama de caja - Gastos

ggplot(muestra2, aes(x=muestra2$Gastos))+geom_boxplot(fill = '#67A5B1')+labs(title="Gráfica de caja (Gastos)",x="Gastos")

Cuartiles - Gastos

tcuartil_gastos
##   cuartil valor
## 1     25%  35.0
## 2     50%  52.5
## 3     75%  74.0
## 4    100% 150.0

Rango - Gastos

ds_range(muestra2$Gastos)
## [1] 115

Varianza - Gastos

round(var(muestra2$Gastos),3)
## [1] 429.865

Desviación estandar - Gastos

sqrt(round(var(muestra2$Gastos),3))
## [1] 20.73319

Curtosis - Gastos

ds_kurtosis(muestra2$Gastos)
## [1] 2.851806

Como la curtosis > 0 graficamente se puede interpretar que esta distribución es mas apuntada que la distribución de la normal.

Coeficiente de asimetría - Gastos

ds_skewness(muestra2$Gastos)
## [1] 1.275221

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Gastos)) + 
    geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Ingresos

Media - Ingresos

Ingresos= mean(muestra2$Ingresos, na.rm=T)
Ingresos
## [1] 144.3333

Las personas entrevistadas en promedio generan 144.3 dolares.

Moda - Ingresos

moda_Ingresos = ds_mode(muestra2$Ingresos,na.rm =TRUE );
moda_Ingresos
## [1] 200

Podemos ver que la moda de los ingresos es 200, siendo esto bueno para la solicitud y aprobación de sus creditos

Mediana - Ingresos

median(sort(muestra2$Ingresos, decreasing = F), na.rm=T) 
## [1] 120

La cantidad de ingresos de la mitad de los registrados supera los 120$. La otra mitad cuentan con ingresos que no superan los 120 dolares.

Histograma - Ingresos

q=sort(muestra2$Ingresos)

x = sort(q)
df = data.frame(x)


ggplot(df, aes(x = x)) + 
  geom_histogram(aes(),
                 colour = 1, fill = "#B3FF00", bins=30) +

   ggtitle("Ingresos registrados") + xlab("Ingresos")+ylab("Cuenta")+geom_vline(aes(xintercept=Ingresos),
               color="black", linetype="dashed")

Se puede ver que el valor de la media del precio esta muy cerca de el centro de la concetracion principal de los datos aunque existen valores atípicos superando los 350 los cuales hacen que la media se vea afectada.

Diagrama de caja - Ingresos

ggplot(muestra2, aes(x=muestra2$Ingresos))+geom_boxplot(fill = '#67A5B1',na.rm = TRUE)+labs(title="Gráfica de caja (Ingresos)",x="Ingresos")

Cuartiles - Ingresos

tcuartil_ingresos
##   cuartil valor
## 1     25%    87
## 2     50%   120
## 3     75%   176
## 4    100%   857

Rango - Ingresos

ds_range(muestra2$Ingresos)
## [1] NA

Varianza - Ingresos

round(var(muestra2$Ingresos),3)
## [1] NA

Desviación estandar - Ingresos

sqrt(round(var(muestra2$Ingresos),3))
## [1] NA

Curtosis - Ingresos

ds_kurtosis(muestra2$Ingresos, na.rm=T)
## [1] 22.51481

Como la curtosis > 0 se puede interpretar como que los datos estan muy concentrados hacia la media. Esta distribución es apuntada con respecto a la distribución normal.

Coeficiente de asimetría - Ingresos

ds_skewness(muestra2$Ingresos, na.rm=T)
## [1] 3.865518

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Ingresos)) + 
   geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Activos

Media - Activos

activos= mean(muestra2$Activos, na.rm=T)
activos
## [1] 5033.673

El promedio de activos es 5033$

Moda - Activos

moda_Activos<-ds_mode(muestra2$Activos,na.rm =TRUE );
moda_Activos
## [1] 0

De la muestra de 100 personas podemos ver que en mayor cantidad están las persona con 0 activos según lo que se evidencia en la gráfica anterior.

Mediana - Activos

median(sort(muestra2$Activos, decreasing = F), na.rm=T)
## [1] 3500

El monto de activos de la mitad registrados supera los 3500. La otra mitad no superan esa cantidad.

Histograma - Activos

q = sort(muestra2$Activos)

x = sort(q)
df = data.frame(x)


ggplot(df, aes(x = x)) + 
  geom_histogram(aes(y = ),
                 colour = 1, fill = "#CF45FF",bins=30) +
  ggtitle("Activos registrados") + xlab("Activos")+ylab("Cuenta")+geom_vline(aes(xintercept=activos),
               color="black", linetype="dashed")

El valor de la media se encuentra casi en el comienzo de la grafica ya que como se puede ver su concentración mayor de datos esta entre cero y 20,000 teniendo valores atípicos superiores a 20000 que afectan la media de la muestra.

Diagrama de caja - Activos

ggplot(muestra2, aes(x=muestra2$Activos))+geom_boxplot(fill = '#67A5B1',na.rm = TRUE)+labs(title="Gráfica de caja (Activos)",x="Activos")

Cuartiles - Activos

tcuartil_activos
##   cuartil valor
## 1     25%     0
## 2     50%  3500
## 3     75%  6000
## 4    100% 80000

Rango - Activos

ds_range(muestra2$Activos)
## [1] NA

Varianza - Activos

round(var(muestra2$Activos),3)
## [1] NA

Desviación estandar - Activos

sqrt(round(var(muestra2$Activos),3))
## [1] NA

Curtosis - Activos

ds_kurtosis(muestra2$Activos, na.rm=T)
## [1] 43.38007

Como la curtosis > 0 se puede indica que las colas son más largas que las de una distribución normal.

Coeficiente de asimetría - Activos

ds_skewness(muestra2$Activos, na.rm=T)
## [1] 5.836991

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Activos)) + 
   geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Deuda

Media - Deuda

deuda= mean(muestra2$Deuda, na.rm=T)
deuda
## [1] 832.6263

El promedio de deuda de los entrevistados es 832.6 dolares.

Moda - Deuda

moda_Deuda<-ds_mode(muestra2$Deuda,na.rm = TRUE);
moda_Deuda
## [1] 0

La gran mayoría de encuestados no cuentan con deuda alguna.

Mediana - Deuda

median(sort(muestra2$Deuda, decreasing = F))
## [1] 0

La mitad de los encuestados no cuentan con deuda alguna. La otra mitad seguramente cuenten con deuda alguna.

Histograma - Deuda

q=sort(muestra2$Deuda)

x = sort(q)
df = data.frame(x)


ggplot(df, aes(x = x)) + 
  geom_histogram(aes(),
                 colour = 1, fill = "#43AFFF", bins=30) +
  ggtitle("Deudas registradas") + xlab("Valor de la deuda")+ylab("Cuenta")+geom_vline(aes(xintercept=deuda),
               color="black", linetype="dashed")

Se puede ver que casi todas las personas se encuentran cerca a la media de la deuda entre 0 y 5,000 aunque existe un valor atipico de 30000 el cual afecta la media de la deuda en toda la muestra.

Diagrama de caja - Deuda

ggplot(muestra2, aes(x=muestra2$Deuda))+geom_boxplot(fill = '#67A5B1',na.rm = TRUE)+labs(title="Gráfica de caja (Deuda)",x="Deuda")

Cuartiles - Deuda

tcuartil_deuda
##   cuartil valor
## 1     25%     0
## 2     50%     0
## 3     75%   400
## 4    100% 30000

Rango - Deuda

ds_range(muestra2$Deuda)
## [1] NA

Varianza - Deuda

round(var(muestra2$Deuda),3)
## [1] NA

Desviación estandar - Deuda

sqrt(round(var(muestra2$Deuda),3))
## [1] NA

Curtosis - Deuda

ds_kurtosis(muestra2$Deuda, na.rm=T)
## [1] 76.03971

Como la curtosis > 0 se puede interpretar como que los datos estan muy concentrados hacia la media. Esta distribución es mucho mas apuntada con respecto a la distribución normal debido a que sus valores de curtosis estan muy alejados del cero.

Coeficente de asimetría - Deuda

ds_skewness(muestra2$Deuda, na.rm=T)
## [1] 8.264946

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Deuda)) + 
    geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Cantidad

Media - Cantidad

cantidad= mean(muestra2$Cantidad, na.rm=T)
cantidad
## [1] 1048.32

Se solicitaron en promedio prestamos de 1048 dolares.

Moda - Cantidad

moda_cantidad<-ds_mode(muestra2$Cantidad);
moda_cantidad
## [1] 1000

La mayor cantidad de prestamos solicitados son de 1000 dolares.

Mediana - Cantidad

median(sort(muestra2$Cantidad, decreasing = F))
## [1] 1000

Más de la mitad de los prestamos solicitados corresponden a más de los 1000$. La otra mitad corresponde a prestamos menores a 1000 dolares.

Histograma - Cantidad

q=sort(muestra2$Cantidad)

x = sort(q)
df = data.frame(x)


ggplot(df, aes(x = x)) + 
  geom_histogram(aes(),
                 colour = 1, fill = "#FF7B30",bins=30) +
  ggtitle("Cantidad del prestamo solicitado") + xlab("Valor del prestamo")+ylab("Cuenta")+geom_vline(aes(xintercept=cantidad),
               color="black", linetype="dashed")

Se puede ver en la grafica la media se encuentra donde se ubica la mayor de concentración de datos, se tienen datos atípicos que afectan la media de la variable desde 2,000 hasta los 4,000.

Diagrama de caja - Cantidad

ggplot(muestra2, aes(x=muestra2$Cantidad))+geom_boxplot(fill = '#67A5B1',na.rm = TRUE)+labs(title="Gráfica de caja (Cantidad)",x="Cantidad")

Cuartiles - Cantidad

tcuartil_cantidad
##   cuartil  valor
## 1     25%  700.0
## 2     50% 1000.0
## 3     75% 1287.5
## 4    100% 4000.0

Rango - Cantidad

ds_range(muestra2$Cantidad)
## [1] 3750

Varianza - Cantidad

round(var(muestra2$Cantidad),3)
## [1] 359387.3

Desviación estandar - Cantidad

sqrt(round(var(muestra2$Cantidad),3))
## [1] 599.4892

Curtosis- Cantidad

ds_kurtosis(muestra2$Cantidad, na.rm=T)
## [1] 10.53637

Como la curtosis > 0 se puede interpretar como que los datos estan muy concentrados hacia la media. Se dice que su distribución es leptocúrtica.

Coeficente de asimetría - Cantidad

ds_skewness(muestra2$Cantidad, na.rm=T)
## [1] 2.536624

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Cantidad)) + 
    geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Precio

Media - Precio

precio= mean(muestra2$Precio, na.rm=T)
precio
## [1] 1480.35

Los bienes de los entrevistados en promedio tienen un precio de 1480$.

Moda - Precio

moda_precio<-ds_mode(muestra2$Precio);
moda_precio
## [1] 1000

La moda de esta variable es 1000. Es decir que los bienes tienen un precio superior a 1000$.

Mediana - Precio

median(sort(muestra2$Precio, decreasing = F))
## [1] 1350

La mitad de los bienes tiene un precio superior a los 1350$. La otra mitad de los bienes tienen un precion inferior a los 1350 dolares.

Histograma - Precio

q=sort(muestra2$Precio)

x <- sort(q)
df <- data.frame(x)


ggplot(df, aes(x = x)) + 
  geom_histogram(aes(),
                 colour = 1, fill = "#0AF9EE",bins=30) +
  ggtitle("Precio de los bienes") + xlab("Valor del bien")+ylab("Cuenta")+geom_vline(aes(xintercept=precio),
               color="black", linetype="dashed")

Se puede ver que la media esta casi en el medio del intervalo entre 0 y 2,300 ya que es donde se ubica la mayor concentración de datos, habiendo valores que afectan su media desde 2700 hasta los 6300.

Diagrama de caja - Precio

ggplot(muestra2, aes(x=muestra2$Precio))+geom_boxplot(fill = '#67A5B1',na.rm = TRUE)+labs(title="Gráfica de caja (Precio)",x="Precio")

Cuartiles - Precio

tcuartil_precio
##   cuartil   valor
## 1     25% 1056.50
## 2     50% 1350.00
## 3     75% 1774.25
## 4    100% 6146.00

Rango - Precio

ds_range(muestra2$Precio)
## [1] 5646

Varianza - Precio

round(var(muestra2$Precio),3)
## [1] 584840.9

Desviación estandar - Precio

sqrt(round(var(muestra2$Precio),3))
## [1] 764.7489

Curtosis- Precio

ds_kurtosis(muestra2$Precio, na.rm=T)
## [1] 15.31718

Como la curtosis > 0 graficamente se puede interpretar que esta distribución es mas apuntada que la distribución de la normal.

Coeficente de asimetría - Precio

ds_skewness(muestra2$Precio, na.rm=T)
## [1] 3.071773

Como el coeficiente a asimetría adopta un valor positivo se puede interpretar como una distribución sesgada hacia la izquierda, se dice que la moda es menor que la mediana y la mediana menor a la media.

ggplot(muestra2, aes(x=muestra2$Precio)) + 
    geom_histogram(aes(y=after_stat(density)),bins = 50,colour="black",fill="#85C1E9",na.rm = TRUE)+    
    geom_density(alpha=.2, fill=4,colour = 1,na.rm = TRUE)

Variables cualitativas

Estado

frecu_estado=table(muestra2$Estado)
df<-as.data.frame(frecu_estado)
attach(df)
porcentaje<-c("BUENO 71%","MALO 29%")
torta2<- pie3D(frecu_estado,labels=porcentaje,col = c("lightblue2","indianred1"),radius = 1.5,
               explode=0.1, height=0.4,labelcex = 0.8,theta=pi/4,
               main="Diagrama de torta para estado")

detach(df) 

Se puede evidenciar de la muestra de 100 personas que el 71% de los clientes tienen un crédito bueno y que de manera beneficiosa la minoria tiene un credito malo

Vivienda

frela_vv <- table(muestra2$Vivienda)
dv<-as.data.frame(frela_vv)
attach(dv)
barplot(frela_vv, width = 1.3, ylim=c(0,65),col = 'red3',
        border = 'black',
        xlab ='Grafica para medio de vivienda ',density = 40)

detach(dv) 

Se evidencia que la mayoría de encuestados son propietarios de algun bien. La otra mitad vive mediante alquiler o vive con sus padres y el resto vive en vivienda privada u otros.

ggplot(muestra2, aes(x = muestra2$Vivienda, y = muestra2$Edad,
                 colour = muestra2$Vivienda)) +
  geom_boxplot() +
  geom_jitter(width = 0.25)+ coord_flip()+labs(title="Gráfica del tipo de vivienda con respecto a la edad",x="Vivienda",y="Edad")

Trabajo

fre_tra <- table(muestra2$Trabajo)

dt <- as.data.frame(fre_tra)

attach(dt)

dt<- rename(dt, clase = Var1, valor= Freq)

diag_barra<- ggplot(dt, aes(x = clase, y=valor)) +
  geom_col()

count<-c(62,28,3,7)
diag_barra<- ggplot(dt, aes(x = clase, y = valor, fill = clase)) +
  geom_bar(stat ='identity') +
  scale_fill_manual(values = c("deeppink1","lightpink2", "lightpink1", "bisque1"))+
  geom_text(aes(label = count), vjust = -1, colour = "black") +
  ylim(c(0,80))
diag_barra

detach(dt) 

Se evidencia que la mayoria de encuestados cuentan con un trabajo fijo, menos de la mitad son freelancer y el resto trabajan a tiempo parcial y por otros metodos.

ggplot(muestra2, aes(x = muestra2$Trabajo, y = muestra2$Ingresos,
                 colour = muestra2$Trabajo)) +
  geom_boxplot(na.rm = TRUE) +
  geom_jitter(width = 0.25,na.rm = TRUE)+ coord_flip()+labs(title="Gráfica del trabajo con respecto a los ingresos",x="Trabajo",y="Ingresos")

Estado Civil

frecu_esc <- table(muestra2$EstadoCivil)
dsc <- as.data.frame(frecu_esc)

attach(dsc)
count<-c("0","75%","3%","25%","2%")
graf_torta <- ggplot(dsc,aes(x="", y = Freq,fill=Var1)) +
  geom_col(color='white') + 
  geom_text(aes(label = count),
            position = position_stack(vjust = 0.5)) +
  coord_polar(theta = 'y') +theme(legend.position = "left")+
  guides(fill = guide_legend(title = "Estado Civil"))+
  scale_fill_manual(values = c("black","royalblue3", "steelblue", "skyblue2","slategray2"))

graf_torta

detach(dsc) 

Según la muestra tomada de 100 personas, se observa que el 70% de estas son casadas, el 25% estan solteros y tan solo el 5% las personas separadas o viudas

ggplot(muestra2, aes(x = muestra2$EstadoCivil, y = muestra2$Antiguedad,
                 colour = muestra2$EstadoCivil)) +
  geom_boxplot() +
  geom_jitter(width = 0.25)+ coord_flip()+labs(title="Gráfica del Estado civil con respecto a la antiguedad",x="Estado Civil",y="Antiguedad")

Registros

frecu_r<- table(muestra2$Registros)
dr <- as.data.frame(frecu_r)
attach(dr)

dr <- data.frame(grupo = c("si", "no"),
                 n = c(19, 81))
count<-c(19,81)
ggplot(dr, aes(x = grupo, y = n, color=grupo)) +
  geom_bar(stat = "identity",lwd = 2, fill = "snow1")+
  theme(legend.position = "left")+ 
  guides(fill = guide_legend(title = "Grafico de registro"))+
 geom_text(aes(label =count), vjust = -0.5, colour = "black")

detach(dr) 

Mediante la muestra de 100 personas se puede evidenciar que el 81% de personas se encuentran vigentes en el resgitro crediticio y solo 19% no se encuentran allí

Tabla de frecuencias

attach(muestra2)
## The following objects are masked _by_ .GlobalEnv:
## 
##     Antiguedad, Gastos, Ingresos
# Frecuencia absoluta 
fabe = table(Estado)
faba = table(Antiguedad)
fabv = table(Vivienda)
favp = table(Plazo)
faved = table(Edad)
faves = table(EstadoCivil)
favr = table(Registros)
favt = table(Trabajo)
favg = table(Gastos)
favi = table(Ingresos)
fava = table(Activos)
favd = table(Deuda)
favc = table(Cantidad)
favp = table(Precio)

# Frecuencia acumulada acumulada
faabe = cumsum(fabe)
faaba = cumsum(faba)
faabv =cumsum(fabv)
faavp = cumsum(favp)
faaved = cumsum(faved)
faaves = cumsum(faves)
faavr = cumsum(favr)
faavt = cumsum(favt)
faavg = cumsum(favg)
faavi = cumsum(favi)
faava = cumsum(fava)
faavd = cumsum(favd)
faavc = cumsum(favc)
faavp = cumsum(favp)

# Frecuencia relativa

frbe = table(Estado)/100
frba = table(Antiguedad)/100
frbv = table(Vivienda)/100
frbp = table(Plazo)/100
frbed = table(Edad)/100 
frvec = table(EstadoCivil)/100
frvr = table(Registros)/100
frvt = table(Trabajo)/100
frvg = table(Gastos)/100
frvi = table(Ingresos)/100
frva = table(Activos)/100
frvd = table(Deuda)/100 
frvc = table(Cantidad)/100
frvp = table(Precio)/100

# Frecuencia acumulada relativa

frabe =cumsum(frbe) 
fraba =cumsum(frba) 
frabv =cumsum(frbv) 
fravp = cumsum(frbp) 
fraved =cumsum(frbed) 
fravec =cumsum(frvec) 
fravr =cumsum(frvr) 
fravt = cumsum(frvt) 
fravg =cumsum(frvg) 
fravi =cumsum(frvi) 
frava =cumsum(frva) 
fravd =cumsum(frvd) 
fravc = cumsum(frvc) 
fravp = cumsum(frvp) 

nombresc = c("Fr. absoluta ","Fr. absoluta acum.","Fr. relativa","Fr. relativa acum.")

Estado

tfabe = cbind(fabe, faabe, frbe, frabe)
colnames(tfabe) <- nombresc
tfabe
##       Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## malo             29                 29         0.29               0.29
## bueno            71                100         0.71               1.00

Antiguedad

tfba = cbind(faba, faaba, frba, fraba)
colnames(tfba) <- nombresc
tfba
##      Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 6.59             1                  1         0.01               0.01

Vivienda

tfv = cbind(fabv, faabv, frbv, frabv)
colnames(tfv) <- nombresc
tfv
##             Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## ignorar                 0                  0         0.00               0.00
## otra                    6                  6         0.06               0.06
## propietario            47                 53         0.47               0.53
## padres                 19                 72         0.19               0.72
## privado                 7                 79         0.07               0.79
## alquila                21                100         0.21               1.00

Plazo

tfvp = cbind(favp, faavp, frbp, fravp)
colnames(tfvp) <- nombresc
tfvp
##      Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 500              2                  2         0.01               0.02
## 550              2                  4         0.05               0.04
## 600              2                  6         0.01               0.06
## 625              2                  8         0.09               0.08
## 690              1                  9         0.02               0.09
## 700              1                 10         0.19               0.10
## 710              1                 11         0.21               0.11
## 830              1                 12         0.42               0.12
## 850              2                 14         0.01               0.14
## 865              1                 15         0.05               0.15
## 925              1                 16         0.01               0.16
## 972              1                 17         0.09               0.17
## 973              1                 18         0.02               0.18
## 975              2                 20         0.19               0.20
## 1000             3                 23         0.21               0.23
## 1035             1                 24         0.42               0.24
## 1054             1                 25         0.01               0.25
## 1064             1                 26         0.05               0.26
## 1070             1                 27         0.01               0.27
## 1088             1                 28         0.09               0.28
## 1105             1                 29         0.02               0.29
## 1108             1                 30         0.19               0.30
## 1127             1                 31         0.21               0.31
## 1150             1                 32         0.42               0.32
## 1173             1                 33         0.01               0.33
## 1179             1                 34         0.05               0.34
## 1180             1                 35         0.01               0.35
## 1191             1                 36         0.09               0.36
## 1195             1                 37         0.02               0.37
## 1196             1                 38         0.19               0.38
## 1200             1                 39         0.21               0.39
## 1258             1                 40         0.42               0.40
## 1266             1                 41         0.01               0.41
## 1275             1                 42         0.05               0.42
## 1300             1                 43         0.01               0.43
## 1308             1                 44         0.09               0.44
## 1309             1                 45         0.02               0.45
## 1325             1                 46         0.19               0.46
## 1330             1                 47         0.21               0.47
## 1340             1                 48         0.42               0.48
## 1345             1                 49         0.01               0.49
## 1350             2                 51         0.05               0.51
## 1365             1                 52         0.01               0.52
## 1387             1                 53         0.09               0.53
## 1389             1                 54         0.02               0.54
## 1400             1                 55         0.19               0.55
## 1404             1                 56         0.21               0.56
## 1498             1                 57         0.42               0.57
## 1505             1                 58         0.01               0.58
## 1537             1                 59         0.05               0.59
## 1553             2                 61         0.01               0.61
## 1566             1                 62         0.09               0.62
## 1567             1                 63         0.02               0.63
## 1568             1                 64         0.19               0.64
## 1600             1                 65         0.21               0.65
## 1607             2                 67         0.42               0.67
## 1612             1                 68         0.01               0.68
## 1627             1                 69         0.05               0.69
## 1648             1                 70         0.01               0.70
## 1650             1                 71         0.09               0.71
## 1718             1                 72         0.02               0.72
## 1736             1                 73         0.19               0.73
## 1750             1                 74         0.21               0.74
## 1757             1                 75         0.42               0.75
## 1780             1                 76         0.01               0.76
## 1796             1                 77         0.05               0.77
## 1797             1                 78         0.01               0.78
## 1800             2                 80         0.09               0.80
## 1803             1                 81         0.02               0.81
## 1812             1                 82         0.19               0.82
## 1820             1                 83         0.21               0.83
## 1850             1                 84         0.42               0.84
## 1900             1                 85         0.01               0.85
## 1926             1                 86         0.05               0.86
## 1970             1                 87         0.01               0.87
## 2000             1                 88         0.09               0.88
## 2050             1                 89         0.02               0.89
## 2067             1                 90         0.19               0.90
## 2100             1                 91         0.21               0.91
## 2200             1                 92         0.42               0.92
## 2225             1                 93         0.01               0.93
## 2260             1                 94         0.05               0.94
## 2276             1                 95         0.01               0.95
## 2432             1                 96         0.09               0.96
## 2985             1                 97         0.02               0.97
## 3400             1                 98         0.19               0.98
## 4500             1                 99         0.21               0.99
## 6146             1                100         0.42               1.00

Edad

tfed = cbind(faved, faaved, frbed, fraved)
colnames(tfed) <- nombresc
tfed
##    Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 19             1                  1         0.01               0.01
## 20             3                  4         0.03               0.04
## 21             4                  8         0.04               0.08
## 22             2                 10         0.02               0.10
## 23             3                 13         0.03               0.13
## 24             2                 15         0.02               0.15
## 25             1                 16         0.01               0.16
## 26             2                 18         0.02               0.18
## 27             3                 21         0.03               0.21
## 28             4                 25         0.04               0.25
## 29             8                 33         0.08               0.33
## 30             5                 38         0.05               0.38
## 31             2                 40         0.02               0.40
## 32             6                 46         0.06               0.46
## 33             6                 52         0.06               0.52
## 34             2                 54         0.02               0.54
## 35             4                 58         0.04               0.58
## 36             6                 64         0.06               0.64
## 37             1                 65         0.01               0.65
## 38             1                 66         0.01               0.66
## 39             1                 67         0.01               0.67
## 40             6                 73         0.06               0.73
## 41             5                 78         0.05               0.78
## 42             1                 79         0.01               0.79
## 43             1                 80         0.01               0.80
## 44             3                 83         0.03               0.83
## 45             1                 84         0.01               0.84
## 46             4                 88         0.04               0.88
## 50             1                 89         0.01               0.89
## 51             1                 90         0.01               0.90
## 53             3                 93         0.03               0.93
## 54             1                 94         0.01               0.94
## 55             1                 95         0.01               0.95
## 57             2                 97         0.02               0.97
## 58             1                 98         0.01               0.98
## 59             1                 99         0.01               0.99
## 66             1                100         0.01               1.00

Estado

tfes = cbind(faves, faaves, frvec, fravec)
colnames(tfes) <- nombresc
tfes
##            Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## divorciado             0                  0         0.00               0.00
## casado                70                 70         0.70               0.70
## separado               3                 73         0.03               0.73
## soltero               25                 98         0.25               0.98
## viudo                  2                100         0.02               1.00

Registros

tfrg = cbind(favr, faavr, frvr, fravr)
colnames(tfrg) <- nombresc
tfrg
##    Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## no            81                 81         0.81               0.81
## sí            19                100         0.19               1.00

Trabajo

tft = cbind(favt, faavt, frvt, fravt)
colnames(tfrg) <- nombresc
tfrg
##    Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## no            81                 81         0.81               0.81
## sí            19                100         0.19               1.00

Gastos

tfg = cbind(favg, faavg, frvg, fravg)
colnames(tfg) <- nombresc
tfg
##       Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 56.29             1                  1         0.01               0.01

Ingresos

tfin = cbind(favi,faavi,frvi,fravi)
colnames(tfin) <- nombresc
tfin
##                  Fr. absoluta  Fr. absoluta acum. Fr. relativa
## 144.333333333333             1                  1         0.01
##                  Fr. relativa acum.
## 144.333333333333               0.01

Activos

tfac = cbind(fava,faava,frva,frava)
colnames(tfac) <- nombresc
tfac
##       Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 0                36                 36         0.36               0.36
## 1500              1                 37         0.01               0.37
## 2000              2                 39         0.02               0.39
## 2500              2                 41         0.02               0.41
## 3000              7                 48         0.07               0.48
## 3500              3                 51         0.03               0.51
## 4000              7                 58         0.07               0.58
## 4500              2                 60         0.02               0.60
## 4700              1                 61         0.01               0.61
## 4800              1                 62         0.01               0.62
## 5000              7                 69         0.07               0.69
## 5500              1                 70         0.01               0.70
## 6000              8                 78         0.08               0.78
## 7000              2                 80         0.02               0.80
## 8000              4                 84         0.04               0.84
## 10000             3                 87         0.03               0.87
## 11000             1                 88         0.01               0.88
## 11500             1                 89         0.01               0.89
## 11800             1                 90         0.01               0.90
## 12000             2                 92         0.02               0.92
## 13000             2                 94         0.02               0.94
## 16000             1                 95         0.01               0.95
## 25000             1                 96         0.01               0.96
## 35000             1                 97         0.01               0.97
## 80000             1                 98         0.01               0.98

Deuda

tfde = cbind(favd,faavd,frvd,fravd)
colnames(tfde) <- nombresc
tfde
##       Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 0                72                 72         0.72               0.72
## 100               1                 73         0.01               0.73
## 150               1                 74         0.01               0.74
## 400               2                 76         0.02               0.76
## 500               1                 77         0.01               0.77
## 700               1                 78         0.01               0.78
## 850               1                 79         0.01               0.79
## 1200              1                 80         0.01               0.80
## 1500              1                 81         0.01               0.81
## 1800              2                 83         0.02               0.83
## 2000              5                 88         0.05               0.88
## 2500              2                 90         0.02               0.90
## 2900              1                 91         0.01               0.91
## 3000              2                 93         0.02               0.93
## 3130              1                 94         0.01               0.94
## 3500              1                 95         0.01               0.95
## 4000              2                 97         0.02               0.97
## 4500              1                 98         0.01               0.98
## 30000             1                 99         0.01               0.99

Cantidad

tfcan = cbind(favc,faavc,frvc,fravc)
colnames(tfcan) <- nombresc
tfcan
##      Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 250              2                  2         0.02               0.02
## 300              1                  3         0.01               0.03
## 350              2                  5         0.02               0.05
## 380              1                  6         0.01               0.06
## 400              5                 11         0.05               0.11
## 425              1                 12         0.01               0.12
## 450              1                 13         0.01               0.13
## 475              1                 14         0.01               0.14
## 500              4                 18         0.04               0.18
## 550              1                 19         0.01               0.19
## 600              3                 22         0.03               0.22
## 650              1                 23         0.01               0.23
## 700              4                 27         0.04               0.27
## 740              1                 28         0.01               0.28
## 750              3                 31         0.03               0.31
## 800              4                 35         0.04               0.35
## 830              1                 36         0.01               0.36
## 850              1                 37         0.01               0.37
## 900              4                 41         0.04               0.41
## 950              1                 42         0.01               0.42
## 1000            15                 57         0.15               0.57
## 1020             1                 58         0.01               0.58
## 1050             1                 59         0.01               0.59
## 1085             1                 60         0.01               0.60
## 1100             3                 63         0.03               0.63
## 1150             1                 64         0.01               0.64
## 1157             1                 65         0.01               0.65
## 1200             5                 70         0.05               0.70
## 1220             1                 71         0.01               0.71
## 1250             4                 75         0.04               0.75
## 1300             6                 81         0.06               0.81
## 1350             1                 82         0.01               0.82
## 1400             5                 87         0.05               0.87
## 1450             1                 88         0.01               0.88
## 1500             4                 92         0.04               0.92
## 1550             2                 94         0.02               0.94
## 1900             1                 95         0.01               0.95
## 2000             1                 96         0.01               0.96
## 2400             2                 98         0.02               0.98
## 4000             2                100         0.02               1.00

Precio

tfpr= cbind(favp,faavp,frvp,fravp)
colnames(tfpr) <- nombresc
tfpr
##      Fr. absoluta  Fr. absoluta acum. Fr. relativa Fr. relativa acum.
## 500              2                  2         0.02               0.02
## 550              2                  4         0.02               0.04
## 600              2                  6         0.02               0.06
## 625              2                  8         0.02               0.08
## 690              1                  9         0.01               0.09
## 700              1                 10         0.01               0.10
## 710              1                 11         0.01               0.11
## 830              1                 12         0.01               0.12
## 850              2                 14         0.02               0.14
## 865              1                 15         0.01               0.15
## 925              1                 16         0.01               0.16
## 972              1                 17         0.01               0.17
## 973              1                 18         0.01               0.18
## 975              2                 20         0.02               0.20
## 1000             3                 23         0.03               0.23
## 1035             1                 24         0.01               0.24
## 1054             1                 25         0.01               0.25
## 1064             1                 26         0.01               0.26
## 1070             1                 27         0.01               0.27
## 1088             1                 28         0.01               0.28
## 1105             1                 29         0.01               0.29
## 1108             1                 30         0.01               0.30
## 1127             1                 31         0.01               0.31
## 1150             1                 32         0.01               0.32
## 1173             1                 33         0.01               0.33
## 1179             1                 34         0.01               0.34
## 1180             1                 35         0.01               0.35
## 1191             1                 36         0.01               0.36
## 1195             1                 37         0.01               0.37
## 1196             1                 38         0.01               0.38
## 1200             1                 39         0.01               0.39
## 1258             1                 40         0.01               0.40
## 1266             1                 41         0.01               0.41
## 1275             1                 42         0.01               0.42
## 1300             1                 43         0.01               0.43
## 1308             1                 44         0.01               0.44
## 1309             1                 45         0.01               0.45
## 1325             1                 46         0.01               0.46
## 1330             1                 47         0.01               0.47
## 1340             1                 48         0.01               0.48
## 1345             1                 49         0.01               0.49
## 1350             2                 51         0.02               0.51
## 1365             1                 52         0.01               0.52
## 1387             1                 53         0.01               0.53
## 1389             1                 54         0.01               0.54
## 1400             1                 55         0.01               0.55
## 1404             1                 56         0.01               0.56
## 1498             1                 57         0.01               0.57
## 1505             1                 58         0.01               0.58
## 1537             1                 59         0.01               0.59
## 1553             2                 61         0.02               0.61
## 1566             1                 62         0.01               0.62
## 1567             1                 63         0.01               0.63
## 1568             1                 64         0.01               0.64
## 1600             1                 65         0.01               0.65
## 1607             2                 67         0.02               0.67
## 1612             1                 68         0.01               0.68
## 1627             1                 69         0.01               0.69
## 1648             1                 70         0.01               0.70
## 1650             1                 71         0.01               0.71
## 1718             1                 72         0.01               0.72
## 1736             1                 73         0.01               0.73
## 1750             1                 74         0.01               0.74
## 1757             1                 75         0.01               0.75
## 1780             1                 76         0.01               0.76
## 1796             1                 77         0.01               0.77
## 1797             1                 78         0.01               0.78
## 1800             2                 80         0.02               0.80
## 1803             1                 81         0.01               0.81
## 1812             1                 82         0.01               0.82
## 1820             1                 83         0.01               0.83
## 1850             1                 84         0.01               0.84
## 1900             1                 85         0.01               0.85
## 1926             1                 86         0.01               0.86
## 1970             1                 87         0.01               0.87
## 2000             1                 88         0.01               0.88
## 2050             1                 89         0.01               0.89
## 2067             1                 90         0.01               0.90
## 2100             1                 91         0.01               0.91
## 2200             1                 92         0.01               0.92
## 2225             1                 93         0.01               0.93
## 2260             1                 94         0.01               0.94
## 2276             1                 95         0.01               0.95
## 2432             1                 96         0.01               0.96
## 2985             1                 97         0.01               0.97
## 3400             1                 98         0.01               0.98
## 4500             1                 99         0.01               0.99
## 6146             1                100         0.01               1.00