Introducción

La empresa B&C (Bienes y Casas) es una agencia de bienes raíces que opera en la ciudad de Cali, Colombia,ha crecido significativamente desde el año 2021 hasta la fecha con progresos significativos al mercado inmobiliario superando ventas de 6700 millones anuales. Está empresa entregó una base de datos de precio, ubicación, características de vivienda y sus precios de venta de acuerdo a su valor de la zona y su área construída.

Con la base de datos, se procedió a realizar un análisis por medio de técnicas de estadística descriptiva que permitieron clasificar, resumir, gráficar patrones de cada variable ya sea cualitatia o cuantitativa que tuvieron como resultados proporcionar información sobre tendencias en el precio de las viviendas en Cali, las viviendas más vendidas y la zona con mayor demanda por la inmobiliaria y definir de alguna forma la evolución del mercado inmobiliario; para definir este último paso hizo falta información más detallada de los años 2021 y 2022.

Así mismo,los aportes significativos de la estadistica descriptiva para determinar las tendencias de las variables,se da gracias al apoyo de métodos en la ciencia de datos que obtienen resultados y conclusiones más rápidas y concretas que aportan en cada uno de los criterios que definen el desarrollo de la economía regional.

Objetivos

Objetivo general

Construir un análisis descriptivo para identificar tendencias y patrones en los datos de la inmobiliaria B&C de la ciudad de Cali.

Objetivo especifico

  • Identificar las variables estadísticas aportadas por la inmobiliaria B&C

  • Ejecutar un análisis estadístico descriptivo que permita la toma de decisiones frente al sector y al tipo de vivienda en cada zona de la ciudad

  • Evaluar la oferta inmobiliaria del mercado de bienes raíces para los datos dados por la empresa B&C

Métodos

El primer paso para la ejecución del análisis estadístico de la inmobiliaria B&C que opera en la Ciudad de Cali, es examinar el tipo de variables aportadas por la base de datos de la empresa, como se muestra a continuación:

Tabla 1

En donde se específica cada una de variables que están dados por variables cuantitativas y cualitativas. Para el caso de las variables cuantitativas, se tienen discretas y continuas; las variables cuantitativas discretas son el número de pisos, el estrato socioeconómico, número de parqueaderos, número de baños, número de habitaciones y el precio en redondeado en millones de cada inmueble; en cuánto a las continuas, se encuentra el área construída, los valores de latitud y longitud en relación a la ubicación geográfica de cada vivienda.

En el caso de las variables cualitativas se encuentran de carácter nominal como las zonas residenciales de Cali, el tipo de vivienda ya sea casa o apartamento y el barrio.

Al evidenciar cada una de las variables que poseen datos incompletos los cuáles aparecen señalados con la connotación “NA”, se planea realizar una depuración y limpieza de los datos que incluyen tanto las variables cualitativas como cuantitativas.

Es importante señalar, que la base de datos entregada tiene un total 8330 registros de los cuáles se presentan datos incompletos en algunas variables y datos sin ninguna información, por ello, se ejecutan estrategías propias de la ciencia de datos como se mostrará en el apartado de resultados.

Una de las estrategias que permite la ciencia de datos es que por medio de diferentes librerías propias del lenguaje de programación R, es posible realizar el análisis estadístico empezando por la limpieza e imputación de los datos con el uso de las librerías naniar y mice que permiten consultar los datos faltantes de la base de datos por medio del siguiente código.

library(mice)
library(naniar)

Al tener la instalación de estás librerías, se hace la siguiente codificación para que se muestren los datos faltantes de la base de datos.

faltantes <- colSums(is.na(vivienda_faltantes)) [1]
faltantes

El paso siguiente, consiste en la elaboración de gráficos de las variables a través de las librerias mencionadas y códigos propios del lenguaje de programación utilizado, que suministrarán la visualización de cada dato faltante en las variables y cuál será el método para eliminarlos o cambiarlos ya sea por valores de la media, moda o mediana dependiendo del análisis que construya.

Los variables que se reemplazarán por cero o por valores de la media, mediana o moda estarán sujetos al análisis que se ejecutará en la etapa de resultados.

En segundo lugar, se realiza el análisis estadísticos para identificar patrones y tendencias de las variables, esto se hace a través de paquetes como DescTools que contiene funciones para determinar datos descriptivos, estás funciones tienen herramientas permiten el cálculo de estadísticas y la representación a través de gráficos y tabla, especialmente en el manejo de datos faltantes como es el caso de la base de datos de la inmobiliaria.

Resultados y discusión

Limpieza de datos

En el proceso de limpieza de los datos, se tuvieron varias etapas, la primera de ellas fue conocer cuántos datos estaban sin información en las variables de la base de datos de la inmobiliaria B&C. Este primer paso se hizo con el código [1], el cuál mostró como resultado los valores faltantes en cada variable, como se muestra a continuación

Tabla 2

##        id      zona      piso   estrato   preciom areaconst   parquea    banios 
##         3         3      2641         3         2         3      1606         3 
##   habitac      tipo    barrio  longitud   latitud 
##         3         3         3         3         3

Teniendo la información de los datos faltantes, se procede a la representación gráfica de los mismos

Como se puede visualizar en la figura 1, se encuentra que las variables que más tienen datos faltantes, son la variable piso con un total de 2641 y la variable parqueadero con 1606.Al no tener contacto directo con las directivas de la inmobiliaria de la justificación de los datos faltantes, como el piso y los parqueaderos, se asumieron situaciones hipotéticas que apoyan el análisis estadístico preliminar; es importante mencionar que estos análisis estarán sujetos a cambios de acuerdo al comportamiento de cada variable en su realidad. física.

Teniendo como base el gráfico de la figura 2, se puede inferir que los valores que están vacíos en la variables parqueaderos no podrían reemplazarse por un valor de la moda o la mediana, de acuerdo a las técnicas de imputación de datos, sino por valores de cero. Partiendo del hecho de que no todas las viviendas tienen parqueadero y poner un valor diferente de cero tendría menos probabilidad de que esta variable se comportará de está formay alteraría el estudio estadístico.

Así, se tiene los siguientes resultados

Como se ve en gráfico anterior, los valores de parqueadero han sido corregidos y ya se encuentran con valor de 0, indicando que no todas las viviendas ya sean apartamentos o casas que están a cargo de la inmobiliaria no poseen necesariamente un parqueadero.

Seguidamente, se reemplazan los valores de la moda para los pisos, que es el dato que se encuentra con mayor frecuencia en registro inmobiliario; esta decisión se tomó por el tipo de viviendas que más tiene a cargo la empresa, que son los apartamentos.

Primero, se instala la siguiente librería

library(DescTools)

Después, a través del código se obtiene los resultados para la variable piso

Sin embargo, al ejecutarse el código anterior se encuentran tres registros que no tienen información de ninguna de las variables de la base de datos, por lo que se procede a eliminar estos tres registros.

datosSINA <- na.omit(base_datos)
grafico <-md.pattern(datosSINA, rotate.names = TRUE)
##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

library(dplyr)

Con este último proceso de imputación y limpieza de los datos, ya se obtiene la base de datos lista para los análisis estadísticas requeridos en la toma de decisiones por la imboliaria en cuánto a su evolución, diagnóstico de características elegidas por los usuarios. (Ver base en Anexos)

Análisis de datos

Con la finalidad de construir un análisis estadístico, que permita la toma de decisiones frente al precio de las viviendas en las zonas de la ciudad de Cali. Se debe conocer la distribución de los estratos socieconómicos en las zonas residenciales utilizando la siguiente librería.

library(tidyverse)
summarytools::freq(datosSINA$zona, cumul = FALSE)
## Frequencies  
## datosSINA$zona  
## Type: Character  
## 
##                      Freq   % Valid   % Total
## ------------------ ------ --------- ---------
##        Zona Centro    124      1.49      1.49
##         Zona Norte   1922     23.08     23.08
##         Zona Oeste   1204     14.46     14.46
##       Zona Oriente    351      4.22      4.22
##           Zona Sur   4726     56.76     56.76
##               <NA>      0                0.00
##              Total   8327    100.00    100.00
table(datosSINA$zona, datosSINA$estrato)
##               
##                   3    4    5    6
##   Zona Centro   105   14    4    1
##   Zona Norte    572  408  770  172
##   Zona Oeste     54   85  290  775
##   Zona Oriente  340    8    2    1
##   Zona Sur      382 1616 1685 1043

De acuerdo con la tabla anterior, se deduce que en la zona centro la mayoría de las viviendas se encuentran en estrato 3; para la zona norte la mayoria de las viviendas se encuentran en estrato 5 con un total de 770; en el caso de la zona oeste, la mayor parte de las viviendas se encuentran entre el estrato 5 y 6 con valores de 290 y 775 respectivamente. La zona sur presenta un comportamiento similar, la mayoria de las viviendas están entre el estrato 5 y el 4, siendo el 5 con 1685 viviendas; en constraste con lo anterior, esta la zona oriente donde más del 90% de las viviendas se encuentran en el estrato 3 con un total de 340.

hist(x = datosSINA$estrato, main = "Histograma estrato socieconómico", 
     xlim = c(3,6), las=1,
     xlab = "Estratos en las Zonas de Cali", ylab = "Frecuencia",
     col = "#fff2cc")

Ahora se hace necesario, determinar los rangos de precio para cada estrato, como se muestra a continuación con la librería dplyr

library(dplyr)
datosSINA %>% select(preciom) %>% range()
## [1]   58 1999

De la salida anterior, podemos ver que los precios de las viviendas van desde 58 hasta 1999 millones de pesos, es decir, el rango de la variable precio sería igual 1999-58= 1941 millones de pesos para todos los 8327 registros de la inmobiliaria B&C.

Así, se procede al análisis entre la variables estrato socieconómico y el rango de precios de 1941 millones para las ofertas inmobiliarias en Cali.

datosSINA %>% 
  group_by(estrato) %>% 
  summarise(rango_precios=max(preciom)-min(preciom))

De los resultados, se puede decir que a medida que aumenta de estrato el rango del precio de las viviendas aumenta. Viviendas de estrato bajo tienden a tener precios similares mientras que los precios de venta para el estrato 5 es más alto que para el estrato 6 que estan ubicados en la zona oeste y sur de Cali de acuerdo a estos análisis.

Añadido a lo anterior, se puede determinar cuál es la ubicación en la ciudad que presenta mayor varianza en los precios de las viviendas y la ubicación de las mismas.

datosSINA %>% 
  group_by(zona) %>% 
  summarise(n=n(),
            varianza=var(preciom))
mean(x=datosSINA$preciom)
## [1] 434.2532
sd(x=datosSINA$preciom)
## [1] 329.0335

De los resultados anteriores, se observa que las viviendas ubicadas en la zona oeste tienen la mayor variabilidad en sus precios con una desviación estándar de 329.0335 que de acuerdo con la media aritmética 434.2532, la variable de los precios se encuentra alejada de la media de 105millones hasta 763millones este resultado se confirma en el diagrama boxplot para la variable precio dada la ubicación, los resultados de precios que se encuentran después de estos límites se conocen como los outliers o datos atípicos que se analizan por medio del boxplot.

En este sentido, es imprescindible conocer el coeficiente de variación de la variable precio en relación a la muestra de 8327 datos y sus cuartiles que muestran la ubicación de los precios dependiendo del porcentaje de la muestra, ya sea del 25%, 50% y 75%, esto se hace a través de la librería DescTools

library(DescTools)
CoefVar(datosSINA$preciom, na.rm =  TRUE)
## [1] 0.7576997
Quantile(x=datosSINA$preciom, probs = c(0.25, 0.5, 0.75, 1))
##  25%  50%  75% 100% 
##  220  330  540 1999
with(datosSINA, boxplot(preciom ~ zona, ylab='Precio (millones)'))

El 25% de los precios de las viviendas a cargo de la inmobiliaria se encuentran en 220millones, el 50% que corresponde a la mediana de los precios de los bienes inmuebles se encuentra en 330millones y el 75% 540millones.

En el gráfico de boxplot, que muestra la variabilidad de los precios de las viviendas en cada una de las zonas de Cali, en general para las zonas centro, norte, oeste y sur los precios no se comportan simétricamente y están sesgados hacía la izquierda o derecha respectivamente, lo que indica que lo existe una distribución normal de estos valores y una variabilidad más grandes en relación a la zona oriente, en donde los precios se comportan más uniformemente y son simétricos y solo hay cuatro datos que se encuentran fuera de los límites de los precios de la zona.

En particular, se dice que, para la zona centro la mayoría de los precios se encuentran entre los límites de la muestra de 763millones y solo 5 viviendas tienen precios más elevados y son datos atípicos de la zona centro con un comportamiento asimétrico.

En cuánto a la zona norte, los valores de precios se encuentran distribuídos de forma asimétrica y tienen muchos más valores fuera de los límites de rango de la muestra de precios inicial, en lo que concierne a la zona oeste hay una menor variabilidad de los precios que se encuentran dentro de los rangos para está zona y su comportamiento es asimétrico positivo con resultados de precios acumulados a la izquierda que quiere decir que hay más viviendas con precios menos a 1250millones y que hay más pocas viviendas con precios mayores y valores atípicos de viviendas con precios más elevados cercanos a los 2mil millones.

Finalmente, para la zona sur, hay una acumulación de datos que se encuentran entre el Q1 Y EL Q3, sin embargo, se encuentran más datos fuera de este rango desde los 900millones hasta lo 1990millones y son estos los outliers de la zona sur.

Uno de los aspectos más importantes que se pueden deducir de este estudio estadístico y que son de gran interés para la inmobiliaria son los tipos de vivienda más vendidas en la ciudad, ya sean casas o apartamentos.

Para esto, se define en primera medida, el promedio de los precios en millones de las ofertas inmobiliarias como se muestra a continuación

mean(datosSINA$preciom, na.rm = TRUE, trim = 0.10)
## [1] 374.7222
(min(datosSINA$preciom,na.rm = TRUE)+max(datosSINA$preciom,na.rm = TRUE))/2
## [1] 1028.5

De acuerdo con el código anterior, los precios de las viviendas están en un promedio de 374,7 a 1028,5 millones, que representan la distribución de los precios de los inmuebles desde la zona oriente hasta la zona oeste y sur.

A continuación, se muestran las ofertas inmobiliarias en cada una de las zonas residenciales de Cali, para esto se hizo una limpieza de la base de datos iniciar de los 8327 registros para que solo tuviera la variable de las zonas en donde se encuentran las viviendas de la inmobiliaria para mayor practicidad.

library(readr)
Zonas_inmbcali <- readxl::read_excel("Zonas_Cali.xlsx")
Zonas_inmbcali
plot(x = Zonas_inmbcali$`Total ofertas`, main = "Gráfica de ofertas inmobiliarias en Cali",
     xlab = "Zonas Residenciales", ylab = "Ofertas", 
     col = c("#ff9999", "#ffb399", "#ffcc99", "#ffe699"))

En donde la zona sur representa una oferta de 4726 viviendas, la zona centro 124, zona norte 1922, zona oriente 351, zona oeste 1204.

Por ello, es de vital importancia seguir fortaleciendo el mercado inmobiliario en la zona sur y tener diferentes estrategias de marketing para la zona norte y oeste.

Ahora bien, es importante conocer el tipo de viviendas más vendidas en la zonas residenciales de Cali ya sean apartamentos y viviendas por medio de la libreria tidyverse

library(tidyverse)
table(datosSINA$zona, datosSINA$tipo)
##               
##                Apartamento APARTAMENTO apto casa Casa CASA
##   Zona Centro           24           0    0    0  100    0
##   Zona Norte          1172          16   11    4  714    5
##   Zona Oeste          1025          10    0    0  168    1
##   Zona Oriente          60           1    1    7  281    1
##   Zona Sur            2751          34    1    3 1932    5

De acuerdo con la gráfica anterior, se deduce que la zona sur tiene más viviendas que las demás zonas para la inmobiliaria; por esto, se hace el análisis del total de tipo de viviendas de la zona sur, en donde se hizo una tabla adicional para estandarizar la base de datos de la zona sur en relación a los tipos de viviendas apartamentos y casa.

Zonasur <- readxl::read_excel("Zona_Sur.xlsx")
Zonasur
tipo=c(1940, 2786)
names(tipo)=c("Casa", "Apartamento")
barplot(tipo, col=c("#ff5b00","#dcf600"), las=1, ylim = c(0,2786))

El tipo de viviendas más vendidas en Cali, son los apartamentos en un total de 2786 en comparación a 1940 casas en la zona sur que es la que más inmuebles vendidos representan para la empresa y en donde deben hacerse las estrategias de marketing, que consigan seguir impulsando el mercado inmobiliario así como en la zona oeste.

Seguidamente, es necesario conocer cuáles son las características de las viviendas más vendidas, con el objetivo de diferenciarlas de las que no, y estas serán las viviendas que prefieren los usuarios.

En cuánto a las habitaciones y los baños, es necesario conocer el valor de estás variables en la base de datos original, usando la librería tidyverse

library(tidyverse)
table(datosSINA$habitac)
## 
##    0    1    2    3    4    5    6    7    8    9   10 
##   66   59  927 4101 1731  680  318  173  138   83   51
table(datosSINA$banios)
## 
##    0    1    2    3    4    5    6    7    8    9   10 
##   45  497 2946 1994 1460  891  315  107   48   15    9

En las zonas residenciales de la ciudad, los usuarios prefieren viviendas entre 3 y 4 habitaciones y entre 2 y 3 baños, según el informe de la base de datos.

En lo que respecta a la zona sur, donde la rentabilidad de la empresa es mucho mayor, se comportan de la siguiente forma

library(tidyverse)
table(Zonasur$habitac)
## 
##    0    1    2    3    4    5    6    7    8    9   10 
##   20   21  490 2350 1044  415  183   85   64   30   24
table(Zonasur$banios)
## 
##    0    1    2    3    4    5    6    7    8    9   10 
##   18  188 1747 1136  765  545  206   75   30   10    6

En la zona residencial del sur, los clientes prefieren las viviendas entre 3 y 4 habitaciones y entre 2 y 3 baños que es muy semejante al comportamiento de las demás zonas.

Finalmente, para conocer la evolución del mercado inmobiliario de Cali teniendo como base las estadisticas de los años 2021 y 2022, se puede deducir las estadisticas que van hasta este 2023 según informa compartido de la base de datos de la inmboliaria.

library(tidyverse)
summarytools::freq(datosSINA$preciom, cumul = FALSE)
mean(datosSINA$preciom)
median(datosSINA$preciom)

De acuerdo con la tabla obtenido por el código anterior, (ver anexo 2) los precios hasta la fecha son de 3.600 millones de pesos que representan la totalidad de los bienes inmuebles a cargo de la inmobiliaria.

Conclusiones

Teniendo la información analizada por medio de métodos y técnicas propias de la estadística descriptiva, se lograron obtener resultados importantes de los cuáles se concluye que las técnicas utilizadas para la limpieza e imputación de datos son usadas como una etapa preliminar para la ejecución del análisis estadístico, cabe resaltar que, las imputaciones de datos tienen técnicas mucho más complejas a las utilizadas en este informe, que se ajustaron mejor al objetivo de este.

En la construcción del análisis estadístico, se identificaron tendencias y patrones importantes en las variables, en las que se destacan la zonas en donde hay más inmuebles a cargo de la empresa B&C que es la zona sur con 4726 viviendas tanto apartamentos como casas, y que las características más usuales de estos on ras son los apartamentos especialmente de 3 a 4 habitaciones y entre 2 y 3 baños y con rango de precios hasta 1999millones con apartamentos desde 40 a 932 metros cuadrados.

Anexos

Anexo 1

Tabla de base de datos empleada para el análisis estadístico de la inmobiliaria con 8327 valores.

glimpse(datosSINA)
## Rows: 8,327
## Columns: 13
## $ id        <int> 8312, 8311, 8307, 8296, 8297, 8298, 8299, 8300, 8286, 8287, …
## $ zona      <chr> "Zona Oeste", "Zona Oeste", "Zona Oeste", "Zona Sur", "Zona …
## $ piso      <int> 4, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 6, 2, 2, 8, 2, 6, 2, 2, …
## $ estrato   <int> 6, 6, 5, 3, 5, 5, 6, 5, 5, 5, 5, 3, 6, 3, 5, 6, 5, 6, 6, 6, …
## $ preciom   <int> 1300, 480, 1200, 220, 330, 1350, 305, 480, 275, 285, 310, 17…
## $ areaconst <dbl> 318, 300, 800, 150, 112, 390, 125, 280, 74, 120, 166, 155, 1…
## $ parquea   <dbl> 2, 1, 4, 1, 2, 8, 2, 4, 1, 2, 2, 0, 2, 0, 1, 2, 2, 2, 4, 1, …
## $ banios    <int> 4, 4, 7, 2, 4, 10, 3, 4, 2, 4, 4, 4, 3, 2, 2, 3, 3, 5, 7, 1,…
## $ habitac   <int> 2, 4, 5, 4, 3, 10, 3, 4, 3, 3, 3, 6, 3, 3, 2, 4, 3, 4, 3, 2,…
## $ tipo      <chr> "Apartamento", "Casa", "Casa", "Casa", "Casa", "Casa", "Apar…
## $ barrio    <chr> "arboleda", "normandía", "miraflores", "el guabal", "bella s…
## $ longitud  <dbl> -76576, -76571, -76568, -76565, -76565, -76565, -76565, -765…
## $ latitud   <dbl> 3454.00000, 3454.00000, 3455.00000, 3417.00000, 3408.00000, …
summary(datosSINA)
##        id           zona                piso           estrato     
##  Min.   :   1   Length:8327        Min.   : 1.000   Min.   :3.000  
##  1st Qu.:2082   Class :character   1st Qu.: 2.000   1st Qu.:4.000  
##  Median :4164   Mode  :character   Median : 2.000   Median :5.000  
##  Mean   :4164                      Mean   : 3.211   Mean   :4.634  
##  3rd Qu.:6246                      3rd Qu.: 4.000   3rd Qu.:5.000  
##  Max.   :8319                      Max.   :12.000   Max.   :6.000  
##     preciom         areaconst       parquea           banios      
##  Min.   :  58.0   Min.   :  30   Min.   : 0.000   Min.   : 0.000  
##  1st Qu.: 220.0   1st Qu.:  80   1st Qu.: 1.000   1st Qu.: 2.000  
##  Median : 330.0   Median : 123   Median : 1.000   Median : 3.000  
##  Mean   : 434.3   Mean   : 175   Mean   : 1.483   Mean   : 3.112  
##  3rd Qu.: 540.0   3rd Qu.: 229   3rd Qu.: 2.000   3rd Qu.: 4.000  
##  Max.   :1999.0   Max.   :1745   Max.   :10.000   Max.   :10.000  
##     habitac           tipo              barrio             longitud        
##  Min.   : 0.000   Length:8327        Length:8327        Min.   :-76576.00  
##  1st Qu.: 3.000   Class :character   Class :character   1st Qu.:-76506.00  
##  Median : 3.000   Mode  :character   Mode  :character   Median :   -76.54  
##  Mean   : 3.605                                         Mean   :-21845.13  
##  3rd Qu.: 4.000                                         3rd Qu.:   -76.52  
##  Max.   :10.000                                         Max.   :   -76.46  
##     latitud        
##  Min.   :   3.333  
##  1st Qu.:   3.390  
##  Median :   3.450  
##  Mean   : 970.370  
##  3rd Qu.:3367.000  
##  Max.   :3497.000

Anexo 2

Tabla de base de datos empleada para la evolución del mercado inmbiliaria hasta el momento

summarytools::freq(datosSINA$preciom, cumul = FALSE)
## Frequencies  
## datosSINA$preciom  
## Type: Integer  
## 
##               Freq   % Valid   % Total
## ----------- ------ --------- ---------
##          58      1     0.012     0.012
##          62      3     0.036     0.036
##          65      1     0.012     0.012
##          69      1     0.012     0.012
##          70      4     0.048     0.048
##          72      2     0.024     0.024
##          73      1     0.012     0.012
##          75     10     0.120     0.120
##          76      1     0.012     0.012
##          77      2     0.024     0.024
##          78      8     0.096     0.096
##          79      1     0.012     0.012
##          80      7     0.084     0.084
##          83      1     0.012     0.012
##          85     11     0.132     0.132
##          86      1     0.012     0.012
##          87      5     0.060     0.060
##          88      2     0.024     0.024
##          89      5     0.060     0.060
##          90     14     0.168     0.168
##          91      1     0.012     0.012
##          92      4     0.048     0.048
##          93      6     0.072     0.072
##          95     23     0.276     0.276
##          96      9     0.108     0.108
##          97      5     0.060     0.060
##          98     12     0.144     0.144
##          99      9     0.108     0.108
##         100     19     0.228     0.228
##         103      1     0.012     0.012
##         104      2     0.024     0.024
##         105     23     0.276     0.276
##         106      1     0.012     0.012
##         107      2     0.024     0.024
##         108     12     0.144     0.144
##         109      2     0.024     0.024
##         110     43     0.516     0.516
##         111      1     0.012     0.012
##         112      5     0.060     0.060
##         113      9     0.108     0.108
##         114      1     0.012     0.012
##         115     49     0.588     0.588
##         116      4     0.048     0.048
##         117      5     0.060     0.060
##         118     14     0.168     0.168
##         119      4     0.048     0.048
##         120     67     0.805     0.805
##         121      3     0.036     0.036
##         122      5     0.060     0.060
##         123      5     0.060     0.060
##         124      1     0.012     0.012
##         125     59     0.709     0.709
##         126      4     0.048     0.048
##         127      7     0.084     0.084
##         128     17     0.204     0.204
##         129      3     0.036     0.036
##         130     74     0.889     0.889
##         131      2     0.024     0.024
##         132     12     0.144     0.144
##         133      2     0.024     0.024
##         134      2     0.024     0.024
##         135     76     0.913     0.913
##         136      5     0.060     0.060
##         137      4     0.048     0.048
##         138     14     0.168     0.168
##         139      5     0.060     0.060
##         140     79     0.949     0.949
##         141      1     0.012     0.012
##         142      7     0.084     0.084
##         143      6     0.072     0.072
##         144      1     0.012     0.012
##         145     62     0.745     0.745
##         147      8     0.096     0.096
##         148     24     0.288     0.288
##         149      8     0.096     0.096
##         150    112     1.345     1.345
##         151      2     0.024     0.024
##         152     16     0.192     0.192
##         153      5     0.060     0.060
##         154      5     0.060     0.060
##         155     77     0.925     0.925
##         156      3     0.036     0.036
##         157      9     0.108     0.108
##         158     18     0.216     0.216
##         159     10     0.120     0.120
##         160    105     1.261     1.261
##         161      1     0.012     0.012
##         162      7     0.084     0.084
##         163      8     0.096     0.096
##         164      4     0.048     0.048
##         165     71     0.853     0.853
##         166      1     0.012     0.012
##         167      3     0.036     0.036
##         168     14     0.168     0.168
##         169      2     0.024     0.024
##         170     71     0.853     0.853
##         171      1     0.012     0.012
##         173      3     0.036     0.036
##         175     53     0.636     0.636
##         176      4     0.048     0.048
##         177      3     0.036     0.036
##         178     10     0.120     0.120
##         179      3     0.036     0.036
##         180     71     0.853     0.853
##         182      3     0.036     0.036
##         183      1     0.012     0.012
##         184      1     0.012     0.012
##         185     46     0.552     0.552
##         186      1     0.012     0.012
##         188      3     0.036     0.036
##         189      2     0.024     0.024
##         190     63     0.757     0.757
##         192      3     0.036     0.036
##         193      1     0.012     0.012
##         195     46     0.552     0.552
##         196      2     0.024     0.024
##         197      2     0.024     0.024
##         198     13     0.156     0.156
##         199      8     0.096     0.096
##         200     66     0.793     0.793
##         201      2     0.024     0.024
##         202      2     0.024     0.024
##         203      1     0.012     0.012
##         204      3     0.036     0.036
##         205     19     0.228     0.228
##         206      3     0.036     0.036
##         208      8     0.096     0.096
##         209      1     0.012     0.012
##         210     74     0.889     0.889
##         211      1     0.012     0.012
##         212      1     0.012     0.012
##         213      2     0.024     0.024
##         214      1     0.012     0.012
##         215     59     0.709     0.709
##         216      1     0.012     0.012
##         218      3     0.036     0.036
##         219      2     0.024     0.024
##         220    130     1.561     1.561
##         221      1     0.012     0.012
##         222      6     0.072     0.072
##         223      3     0.036     0.036
##         224      2     0.024     0.024
##         225     63     0.757     0.757
##         226      4     0.048     0.048
##         227      3     0.036     0.036
##         228      6     0.072     0.072
##         229      4     0.048     0.048
##         230    113     1.357     1.357
##         231      1     0.012     0.012
##         232      2     0.024     0.024
##         233      2     0.024     0.024
##         234      1     0.012     0.012
##         235     66     0.793     0.793
##         236      6     0.072     0.072
##         237      2     0.024     0.024
##         238      6     0.072     0.072
##         239      1     0.012     0.012
##         240    122     1.465     1.465
##         242      3     0.036     0.036
##         243      4     0.048     0.048
##         245     59     0.709     0.709
##         246      1     0.012     0.012
##         248      5     0.060     0.060
##         249      2     0.024     0.024
##         250    164     1.969     1.969
##         251      1     0.012     0.012
##         252      2     0.024     0.024
##         253      3     0.036     0.036
##         255     41     0.492     0.492
##         256      1     0.012     0.012
##         257      3     0.036     0.036
##         258      4     0.048     0.048
##         259      6     0.072     0.072
##         260    120     1.441     1.441
##         262      1     0.012     0.012
##         265     35     0.420     0.420
##         266      1     0.012     0.012
##         267      2     0.024     0.024
##         268      6     0.072     0.072
##         269      1     0.012     0.012
##         270    108     1.297     1.297
##         271      1     0.012     0.012
##         272      2     0.024     0.024
##         275     42     0.504     0.504
##         276      2     0.024     0.024
##         277      1     0.012     0.012
##         278      1     0.012     0.012
##         279      4     0.048     0.048
##         280    105     1.261     1.261
##         283      3     0.036     0.036
##         285     47     0.564     0.564
##         286      1     0.012     0.012
##         287      1     0.012     0.012
##         288      3     0.036     0.036
##         289      3     0.036     0.036
##         290    109     1.309     1.309
##         291      2     0.024     0.024
##         293      1     0.012     0.012
##         294      1     0.012     0.012
##         295     55     0.661     0.661
##         296      2     0.024     0.024
##         297      2     0.024     0.024
##         298     16     0.192     0.192
##         299     10     0.120     0.120
##         300    147     1.765     1.765
##         303      1     0.012     0.012
##         304      3     0.036     0.036
##         305     19     0.228     0.228
##         306      2     0.024     0.024
##         307      1     0.012     0.012
##         308      4     0.048     0.048
##         309      4     0.048     0.048
##         310     88     1.057     1.057
##         314      3     0.036     0.036
##         315     47     0.564     0.564
##         318      6     0.072     0.072
##         319      1     0.012     0.012
##         320    138     1.657     1.657
##         321      3     0.036     0.036
##         324      1     0.012     0.012
##         325     34     0.408     0.408
##         327      2     0.024     0.024
##         328      4     0.048     0.048
##         329      1     0.012     0.012
##         330    105     1.261     1.261
##         332      1     0.012     0.012
##         333      1     0.012     0.012
##         334      2     0.024     0.024
##         335     35     0.420     0.420
##         336      1     0.012     0.012
##         337      2     0.024     0.024
##         338      3     0.036     0.036
##         339      1     0.012     0.012
##         340     95     1.141     1.141
##         341      1     0.012     0.012
##         342      2     0.024     0.024
##         343      1     0.012     0.012
##         344      2     0.024     0.024
##         345     18     0.216     0.216
##         346      1     0.012     0.012
##         347      2     0.024     0.024
##         348      1     0.012     0.012
##         349      2     0.024     0.024
##         350    201     2.414     2.414
##         352      1     0.012     0.012
##         353      1     0.012     0.012
##         354      1     0.012     0.012
##         355     26     0.312     0.312
##         356      1     0.012     0.012
##         357      2     0.024     0.024
##         358      2     0.024     0.024
##         359      1     0.012     0.012
##         360     97     1.165     1.165
##         362      2     0.024     0.024
##         365     22     0.264     0.264
##         367      2     0.024     0.024
##         368      2     0.024     0.024
##         369      2     0.024     0.024
##         370     80     0.961     0.961
##         371      1     0.012     0.012
##         372      1     0.012     0.012
##         375     19     0.228     0.228
##         377      2     0.024     0.024
##         378      1     0.012     0.012
##         379      1     0.012     0.012
##         380     98     1.177     1.177
##         382      1     0.012     0.012
##         383      1     0.012     0.012
##         385     26     0.312     0.312
##         387      2     0.024     0.024
##         388      3     0.036     0.036
##         389      1     0.012     0.012
##         390     74     0.889     0.889
##         392      1     0.012     0.012
##         393      4     0.048     0.048
##         395     37     0.444     0.444
##         397      4     0.048     0.048
##         398      6     0.072     0.072
##         399      2     0.024     0.024
##         400    107     1.285     1.285
##         403      1     0.012     0.012
##         404      1     0.012     0.012
##         405     12     0.144     0.144
##         406      1     0.012     0.012
##         408      2     0.024     0.024
##         410     46     0.552     0.552
##         411      1     0.012     0.012
##         412      2     0.024     0.024
##         415     17     0.204     0.204
##         416      1     0.012     0.012
##         419      1     0.012     0.012
##         420    101     1.213     1.213
##         421      1     0.012     0.012
##         423      1     0.012     0.012
##         424      1     0.012     0.012
##         425     20     0.240     0.240
##         428      1     0.012     0.012
##         429      1     0.012     0.012
##         430     83     0.997     0.997
##         432      1     0.012     0.012
##         433      1     0.012     0.012
##         435     11     0.132     0.132
##         438      2     0.024     0.024
##         439      1     0.012     0.012
##         440     39     0.468     0.468
##         445      6     0.072     0.072
##         447      1     0.012     0.012
##         449      3     0.036     0.036
##         450    170     2.042     2.042
##         455      4     0.048     0.048
##         460     31     0.372     0.372
##         461      1     0.012     0.012
##         465      7     0.084     0.084
##         468      2     0.024     0.024
##         469      1     0.012     0.012
##         470     49     0.588     0.588
##         472      1     0.012     0.012
##         475     18     0.216     0.216
##         480     77     0.925     0.925
##         485     13     0.156     0.156
##         488      1     0.012     0.012
##         490     27     0.324     0.324
##         494      2     0.024     0.024
##         495     13     0.156     0.156
##         496      1     0.012     0.012
##         498      1     0.012     0.012
##         499      2     0.024     0.024
##         500     86     1.033     1.033
##         505      5     0.060     0.060
##         508      1     0.012     0.012
##         510     17     0.204     0.204
##         513      1     0.012     0.012
##         515      7     0.084     0.084
##         518      2     0.024     0.024
##         520     53     0.636     0.636
##         524      1     0.012     0.012
##         525     11     0.132     0.132
##         530     58     0.697     0.697
##         534      1     0.012     0.012
##         535      5     0.060     0.060
##         537      1     0.012     0.012
##         538      2     0.024     0.024
##         540     18     0.216     0.216
##         542      1     0.012     0.012
##         545      2     0.024     0.024
##         547      1     0.012     0.012
##         548      3     0.036     0.036
##         550    110     1.321     1.321
##         555      1     0.012     0.012
##         560     30     0.360     0.360
##         565      5     0.060     0.060
##         569      1     0.012     0.012
##         570     32     0.384     0.384
##         575      5     0.060     0.060
##         580     58     0.697     0.697
##         585      7     0.084     0.084
##         590     37     0.444     0.444
##         591      1     0.012     0.012
##         594      1     0.012     0.012
##         595     13     0.156     0.156
##         597      2     0.024     0.024
##         598      1     0.012     0.012
##         599      5     0.060     0.060
##         600     87     1.045     1.045
##         603      2     0.024     0.024
##         605      2     0.024     0.024
##         610     11     0.132     0.132
##         615      1     0.012     0.012
##         620     30     0.360     0.360
##         621      3     0.036     0.036
##         622      1     0.012     0.012
##         625      3     0.036     0.036
##         626      1     0.012     0.012
##         630     32     0.384     0.384
##         635      2     0.024     0.024
##         637      1     0.012     0.012
##         638      1     0.012     0.012
##         639      1     0.012     0.012
##         640     13     0.156     0.156
##         643      1     0.012     0.012
##         645      4     0.048     0.048
##         648      1     0.012     0.012
##         649      1     0.012     0.012
##         650    118     1.417     1.417
##         651      1     0.012     0.012
##         655      4     0.048     0.048
##         660     23     0.276     0.276
##         667      1     0.012     0.012
##         670     18     0.216     0.216
##         673      2     0.024     0.024
##         677      1     0.012     0.012
##         679      1     0.012     0.012
##         680     47     0.564     0.564
##         681      1     0.012     0.012
##         685      4     0.048     0.048
##         690     37     0.444     0.444
##         695      8     0.096     0.096
##         697      4     0.048     0.048
##         698      1     0.012     0.012
##         699      1     0.012     0.012
##         700     56     0.673     0.673
##         701      1     0.012     0.012
##         704      1     0.012     0.012
##         705      1     0.012     0.012
##         707      1     0.012     0.012
##         710      6     0.072     0.072
##         720     24     0.288     0.288
##         725      3     0.036     0.036
##         730     15     0.180     0.180
##         732      1     0.012     0.012
##         735      1     0.012     0.012
##         736      1     0.012     0.012
##         737      1     0.012     0.012
##         738      1     0.012     0.012
##         740      5     0.060     0.060
##         745      1     0.012     0.012
##         749      1     0.012     0.012
##         750     82     0.985     0.985
##         754      1     0.012     0.012
##         760     10     0.120     0.120
##         765      1     0.012     0.012
##         767      1     0.012     0.012
##         770      4     0.048     0.048
##         775      1     0.012     0.012
##         780     43     0.516     0.516
##         785      1     0.012     0.012
##         790     13     0.156     0.156
##         792      1     0.012     0.012
##         795      7     0.084     0.084
##         800     37     0.444     0.444
##         810      4     0.048     0.048
##         820      8     0.096     0.096
##         825      2     0.024     0.024
##         830      7     0.084     0.084
##         832      1     0.012     0.012
##         833      1     0.012     0.012
##         835      1     0.012     0.012
##         836      1     0.012     0.012
##         840      7     0.084     0.084
##         845      1     0.012     0.012
##         849      1     0.012     0.012
##         850     93     1.117     1.117
##         852      1     0.012     0.012
##         860      4     0.048     0.048
##         865      3     0.036     0.036
##         870     17     0.204     0.204
##         875      1     0.012     0.012
##         880     18     0.216     0.216
##         887      2     0.024     0.024
##         890     14     0.168     0.168
##         895      3     0.036     0.036
##         900     54     0.648     0.648
##         910      7     0.084     0.084
##         920      5     0.060     0.060
##         923      1     0.012     0.012
##         925      1     0.012     0.012
##         930     12     0.144     0.144
##         934      1     0.012     0.012
##         938      2     0.024     0.024
##         940      3     0.036     0.036
##         950     54     0.648     0.648
##         960      6     0.072     0.072
##         970      2     0.024     0.024
##         975      2     0.024     0.024
##         980     29     0.348     0.348
##         985      1     0.012     0.012
##         990     11     0.132     0.132
##         998      2     0.024     0.024
##         999      1     0.012     0.012
##        1000     33     0.396     0.396
##        1015      1     0.012     0.012
##        1050     14     0.168     0.168
##        1051      1     0.012     0.012
##        1077      1     0.012     0.012
##        1078      1     0.012     0.012
##        1080      2     0.024     0.024
##        1090      4     0.048     0.048
##        1100     46     0.552     0.552
##        1103      1     0.012     0.012
##        1106      1     0.012     0.012
##        1110      1     0.012     0.012
##        1120      1     0.012     0.012
##        1125      1     0.012     0.012
##        1126      1     0.012     0.012
##        1130      1     0.012     0.012
##        1133      1     0.012     0.012
##        1149      1     0.012     0.012
##        1150     26     0.312     0.312
##        1160      2     0.024     0.024
##        1170      1     0.012     0.012
##        1180      4     0.048     0.048
##        1190      1     0.012     0.012
##        1195      2     0.024     0.024
##        1200     80     0.961     0.961
##        1220      3     0.036     0.036
##        1226      1     0.012     0.012
##        1230      1     0.012     0.012
##        1240      1     0.012     0.012
##        1250     35     0.420     0.420
##        1255      1     0.012     0.012
##        1270      3     0.036     0.036
##        1280      9     0.108     0.108
##        1290      1     0.012     0.012
##        1300     40     0.480     0.480
##        1320      1     0.012     0.012
##        1330      4     0.048     0.048
##        1350     24     0.288     0.288
##        1360      1     0.012     0.012
##        1370      2     0.024     0.024
##        1380      2     0.024     0.024
##        1385      2     0.024     0.024
##        1390      2     0.024     0.024
##        1395      1     0.012     0.012
##        1398      1     0.012     0.012
##        1400     49     0.588     0.588
##        1440      1     0.012     0.012
##        1450      9     0.108     0.108
##        1480      2     0.024     0.024
##        1500     32     0.384     0.384
##        1530      1     0.012     0.012
##        1550      8     0.096     0.096
##        1561      1     0.012     0.012
##        1580      2     0.024     0.024
##        1583      1     0.012     0.012
##        1584      1     0.012     0.012
##        1590      4     0.048     0.048
##        1600     25     0.300     0.300
##        1650      9     0.108     0.108
##        1680      2     0.024     0.024
##        1700     22     0.264     0.264
##        1750      4     0.048     0.048
##        1800     24     0.288     0.288
##        1801      1     0.012     0.012
##        1830      1     0.012     0.012
##        1850     11     0.132     0.132
##        1900     11     0.132     0.132
##        1940      1     0.012     0.012
##        1950      3     0.036     0.036
##        1999      1     0.012     0.012
##        <NA>      0               0.000
##       Total   8327   100.000   100.000