## Registered S3 method overwritten by 'httr':
## method from
## print.response rmutil
##
## malo bueno
## 24 76
Al ser una variable cualitativa para sacar sus medidas de tendencia central los agrupamos entre bueno y malo para asi hacer sus medidas con respecto a la variable precio.
Grafico de pastel
## Warning: The titlefont attribute is deprecated. Use title = list(font = ...)
## instead.
En este grafico podemos ver la distribucion entre el estado del credito bien sea bueno o malo
MediEstado=muestra2 %>% group_by(Estado=Estado) %>% summarise(MediaAritmetica=mean(Precio))
MediEstadoMedianEstado=muestra2 %>% group_by(Estado=Estado) %>% summarise(MediaAritmetica=median(Precio))
MedianEstadoen esta grafica podemos ver la comparacion de las medias de los precios agrupados entre bueno o malo dependiendo del estado del credito
##
## 0 1 2 3 4 5 6 7 8 9 10 11 12 13 15 16 18 19 20 22 27 29 35 38 40
## 14 10 13 8 7 7 4 3 2 3 3 5 5 2 2 2 1 1 1 1 2 1 1 1 1
Esta variable es cuantitativa y nos indica la antiguedad laboral de la persona
.
En este grafico comparativo podemos ver que a pesar de que la media
aritmetica = 7.9 y la mediana = 5 el valor mas frecuente es el 0 lo cual
nos indica que la mayor cantidad de residentes llevan menos de 1 año de
antiguedad laboral
.
En este histograma vemos la cantidad de personas dentro de cada grupo comprendido por años de antiguedad laboral ademas de eso las lineas nos permite tener una claridad de la media, mediana y moda
.
Este grafico de cajas y bigotes nos ayuda a ver esos valores atipicos, generalmente hacia arriba, esto debido a que al ser la moda=0 y la media = 7.9 hace que el grueso de los datos normales se concentren en la parte baja del grafico por esta razon los habitantes con mayor antiguedad laboral se pueden considerar como valores atipicos.
## [1] 1.167449
Grafico Dispersion
En este grafico observamos como el grueso de los habitantes se encuentran en la parte inferior del grafico de dispersion esto ya que en su gran mayoria tienen una antiguedad = 0
qqnorm(muestra2$Antiguedad, col="#89FFF6",ylab="Cuantiles de la muestra",xlab="cuantiles teoricos")
qqline(muestra2$Antiguedad)Con esta cuerva positiva se puede inferir que por su sesgo los valores no corresponden a valores normales
##
## 12 18 24 30 36 42 48 60
## 4 2 10 2 23 1 20 38
Esta es una variable cuantitativa que nos indica el plazo de credito en meses ### Medidas Tendencia Central #### Media Aritmetica
## [1] 44.94
en este histograma podemos ver la cantidad de personas en los intervalos de plazo ademas de tambien tener las medidas de tendencia central
En este grafico vemos como el grueso de los datos va a la parte superior indicando que la mayor parte de los datos estan en elnumero de plazos mas grandes
Esta variable es una cuantitativa la cual nos indica la edad de las personas en la base de datos
## [1] 36.45
## [1] 35
## [1] 28
mtc<-c(mean(muestra2$Edad),median(muestra2$Edad),mfv(muestra2$Edad))
barplot(mtc, col= rainbow(6), ylim=c(0, 40),names.arg=c("Media","Mediana","Moda"))
grid(nx = NA, ny = NULL, lwd = 1, lty = 1, col = "gray")
barplot(mtc, col= c("#FBFF89","#FF89C0","#89FFAD","#FF8989"), ylim=c(0, 40), add=TRUE)
.
Podemos observar las tres medidas de tendencia central comparadas
entre ellas.
.
En este grafico podemos observar la distribucion de la edad de los
residentes de esta base de datos, tambien vemos como la media aritmetica
(roja) se encuentra en 37 y la mediana en 36 ademas de la moda en 28 lo
cual nos indica que la mayor cantidad de residentes de la base de datos
tiene una edad de 28 años
.
En este boxplot podemos ver que los valores no manejan valores atipicos tan evidentes
## [1] 0.3213503
Grafico Dispersion
.
En este grafico nos podemos dar cuena que a pesar de la gran cantidad de datos la dispersion es bastante uniforme y no se presentan tantos valores atipicos
##
## divorciado casado separado soltero viudo
## 2 68 4 25 1
Esta es una variable cualitativa por lo cual se graficaran sus medidas de tendencia central relacionadolos con sus ingresos
En ambos graficos podemos ver como los porcentajes en los que estan distribuidos los distintos estados civiles de las personas en nuestro espacio muestral
muestrad<-muestra2%>%filter(!is.na(Ingresos))
MediaEstadoCivil=muestrad %>% group_by(EstadoCivil=EstadoCivil) %>% summarise(MediaAritmetica=mean(Ingresos))
MediaEstadoCivilMedianEstadoCivil=muestrad %>% group_by(EstadoCivil=EstadoCivil) %>% summarise(MediaAritmetica=median(Ingresos))
MedianEstadoCivilModaEstadoCivil=muestrad %>% group_by(EstadoCivil=EstadoCivil) %>% summarise(MediaAritmetica=mfv(Ingresos))## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
## always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## `summarise()` has grouped output by 'EstadoCivil'. You can override using the
## `.groups` argument.
En esta gracifa vemos la comparacion entre las medias aritmeticas de los ingresos de los distintos grupos de estados civiles
## Warning: package 'kableExtra' is in use and will not be installed
| Frecuencia Absoluta | Frecuencia Relativa | Frecuencia Absoluta Acumulada | Frecuencia Relativa Acumulada | |
|---|---|---|---|---|
| divorciado | 2 | 0.02 | 2 | 0.02 |
| casado | 68 | 0.68 | 70 | 0.70 |
| separado | 4 | 0.04 | 74 | 0.74 |
| soltero | 25 | 0.25 | 99 | 0.99 |
| viudo | 1 | 0.01 | 100 | 1.00 |
##
## no sí
## 81 19
Registro es una variable cualitativa, primero se mostrará los gráficos que nos permiten observar la catidad y la distrubución de quienes de dos grupos los cuales son: Qienes sí cuentan con registo y de quienes no. Luengo de esto se calculará las medidas de la media, mediana y moda de el precio de su correspondiente grupo.
tablare = c(19,81)
tablare = table(muestra2$Registros)
colores = c("#FFF9B8", "#B0E2FF")
# Genera el gráfico de barras con título más pequeño
barplot(tablare, col = colores,
horiz = FALSE, ylab = "RESIDENTES", border = TRUE,
ylim = c(0, 100), xlab = "REGISTRO (SÍ / NO)",
main = " GRÁFICO DE BARRAS QUE EVIDENCIA CUANTAS PERSONAS SÍ
CUENTAN CON REGISTRO Y CUANTAS NO CUENTAN CON REGISTRO",
cex.main = 1) # Tamaño del título reducidoEn este gráfico de barras se puede evidenciar la cantidad de residentes que cuentan con registo y los residentes que no cuentan con registro.
En este gráfico podemos observar la distibución de los residentes que sí cuentan con registro y quienes no cuentan con registro
##
## fijo freelance otros tiempo parcial
## 66 21 4 9
En este caso la variable trabajo es una variable cualitativa por lo cual para sacar sus medidas de tendencia central se agruparan y luego se calculara la media, mediana y moda de el precio en su respectivo grupo.
pie(e,col = c("#C1FFFB", "#F7FFC1","#C1FFD2", "#C8C1FF"), border = c("#C1FFFB", "#F7FFC1","#C1FFD2", "#C8C1FF"))Este grafico muestra la en un grafico de pastel el porcentaje que abarca cada uno de los grupos de trabajo
Graficos Media
En esta grafica vemos la comparacion de las medias de precio agrupados en la variable de trabajo
Grafico Mediana
.
En este grafico vemos la comparativa entre la mediana de los precios agrupado por la variable trabajo
Grafico Moda
Esta variable es de caracter cuantitativo y nos indica lacantidad de gastos
En este gafico vemos la cantidad de personas por cada grupo de gastos agrupados en grupos ademas de ver las medidas de tendencia central
En este grafico vemos como en la distribucion de datos el grueso se encuentra hacia abajo en donde los gastos son menores, ademas de no ver ningun dato particularmente anormal ### Medidas Variabilidad #### Rango
## [1] 35 130
## [1] 0.3535628
Graficos Dispercion
En este grafico vemos como la dispercion de datos es bastante dispersa aun cuando una gran parte de los datos se encuentra en la parte inferior
Estaes una variable cuantitativa que nos indica la cantidad o monto de ingresos
## Warning: Removed 8 rows containing non-finite values (`stat_bin()`).
## Warning: Removed 100 rows containing missing values (`geom_vline()`).
## Removed 100 rows containing missing values (`geom_vline()`).
## Removed 100 rows containing missing values (`geom_vline()`).
En este grafico podemos ver la cantidad de personas en los diferentes brechas de ingresos andemas de ver la comparacion con sus medidas de tendencia central
En esta grafica podemos ver en la grafica de cajas que en la parte superior se encuentran algunos datos atipicos donde los ingresos son bastante altos
## [1] 0 3000 0 2500 2500 2500 3000 0 0 5000 3500 4000
## [13] 4500 0 0 0 0 0 0 3500 11000 0 0 3000
## [25] 18000 6000 0 0 1500 0 0 3500 875 5000 0 0
## [37] 0 4000 0 4000 0 4000 18000 7500 2500 0 0 3000
## [49] 0 0 4500 10000 6000 0 0 7000 3000 2000 0 15000
## [61] 2000 3850 0 4000 0 25000 0 12500 4000 0 11000 0
## [73] 11000 0 21500 17000 3000 5000 8000 4000 4500 6500 0 0
## [85] 0 0 2000 3000 4000 0 6000 0 0 12000 0 7750
## [97] 14000
Esta es una variablede caracteer cuantitativo la cual nos indica la cantidad o monto de los ativos
## Warning: Removed 3 rows containing non-finite values (`stat_bin()`).
En este histograma vemos como se distribuyen los datos de la variable actiovos cuando se agrupan por cantidad de activos
En este grafico vemos como existen valores atipicos mayormente en la parte superior del grafico alehjados de la media
sd(actibosd) #### coeficiente Variacion
## [1] 1.391905
Graficos dispersion
En este grafico podemos ver que los datos de esta muestra son bastante dispersos en general sin embargo una gran cantidad se agrupan en la parte de abajo alrededor del 0
Esta es una variable de caracter cuantitativo que nos indica la cantidad o monto de las deudas
En este grafico vemos la comprativa de las medidas de tendencia central de la variable deudas, cabe notar que la moda es igual a 0 ya que es el valor que mas se repite asi mismo si se organizan los datos de mayor a menor la mediana que es el dato de la mitad tambien es igual a 0
En este grafico vemos como hay unagran cantidad de valores anormales en la parte superior del grafico
## [1] 2.921432
Graficos Dispercion
En este grafico vemos como la dispersion de datos es bastante uniforme ya que la mayor parte de sus datos se encuentran en 0 siendo bastantes pocos los superiores a 0
Esta variable es una cuantitativa y nos indica la cantidad solicitada del credito
## [1] 100 200 200 200 200 240 270 300 325 400 400 400 400 450 475
## [16] 500 500 500 550 550 575 600 600 600 625 635 700 700 700 700
## [31] 750 750 775 780 800 800 800 800 800 850 850 900 900 900 900
## [46] 900 900 950 950 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000
## [61] 1000 1000 1000 1050 1075 1100 1100 1100 1100 1100 1150 1200 1200 1200 1200
## [76] 1250 1300 1300 1300 1300 1300 1300 1300 1350 1350 1400 1400 1400 1400 1450
## [91] 1500 1500 1520 1600 1600 1900 2000 2250 3000 5000
En este grafico observamos la comparacion entre las medidas de tendencia central de la variable cantidad
En este histograma vemos la distribucion de laspersonas en grupos dependeindo de la cantidad del prestamo
En este grafico de cajas vemos como existen unos pocos datos anormales que se van a la aprte superior del grafico a pesar de que el grueso se encuentra al rededor de 1000
Para este apartado de medidas de posición se calcularan los cuartiles (Q1 = 25%, Q2 = 50%, Q3 = 75%) de la variable cuantitativa cantidad, para ser más específicos se dividirá el conjunto de datos en cuatro partes iguales.
Q1c = quantile(muestra2$Cantidad,0.25,type = 6)
Q1ca = paste("El primer cuartil (Q1) de la variable cantidad es: ",Q1c)
Q1ca## [1] "El primer cuartil (Q1) de la variable cantidad es: 627.5"
Q2c = quantile(muestra2$Cantidad,0.5,type = 6)
Q2ca = paste("El segundo cuartil (Q2) de la variable cantidad es: ",Q2c)
Q2ca## [1] "El segundo cuartil (Q2) de la variable cantidad es: 1000"
Q3c = quantile(muestra2$Cantidad,0.75,type = 6)
Q3ca = paste("El segundo cuartil (Q3) de la variable cantidad es: ",Q3c)
Q3ca## [1] "El segundo cuartil (Q3) de la variable cantidad es: 1237.5"
Al hallar los cuartiles, se evidencia y confirma que el segundo cuartil (Q2), es igual al valor de la mediana de la variable. Ahora, se va a comparar el segundo cuartil (Q2) y se demostrará que es igual a la mediana gráficamente:
### CURTOSIS Y ASIMETRÍA
Finalmente, se analizará las medidas de “curtosis” y “asimetria” para determinar:que tanto se concentran los valores entorno a la media/promedio y que tipo de asimetria presentan los datos.
## Warning in geom_vline(aes(xintercept = mean(CANTIDAD), fill = "black"), :
## Ignoring unknown aesthetics: fill
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Como puede ver en la anterior gráfica, los valores tienden a concentrarse en la media (lineas vertical punteada) por lo que esta ilustración posee una curtosis leptocúrtica, debido a que hay una concentración en los datos en la media. En cuanto a la asimetría la variable cantidad posee asimetria positiva (un sesgo a la derecha).
Esta variable es una cuantitativa la cual nos indica el precio de las viviendas en la base de datos
## [1] 1456.74
## [1] 1310
## [1] 1100
En este grafico podemos observar la distribucion del precio de las viviendas de esta base de datos, tambien vemos como la media aritmetica (roja) se encuentra en 1462 y la mediana en 1400 ademas de la moda en 1500 lo cual nos indica que la mayor cantidad de viviendas de la base de datos tiene un precio de 1500.
En esta grafica de caja podemos observar comohay valores atipicos tanto
en la parte superior como la inferior del grafico siendo pocos los datos
que se agrupan al rededor de la media
## [1] 0.5670986
Graficas Dispersion
En esta grafica de dispersion podemos ver como la mayoria de los datos giran al rededor del numero 1000 sin embargo hay unos datos atipicos que rondan los 4000 - 5000
##
## ignorar otra propietario padres privado alquila
## 0 10 42 18 8 22
Esta variable es de tipo cualitativa la cual nos indica el tipo de propiedad de la vivienda
En este grafico podemos ver la distribucion del tipo de propiedad de la vivienda
Medidas de tendencia central con respecto al precio de la vivienda
MediEstador=muestra2 %>% group_by(Vivienda = Vivienda) %>% summarise(MediaAritmetica=mean(Precio))
MediEstadorMediEstadoe=muestra2 %>% group_by(Vivienda = Vivienda) %>% summarise(MediaAritmetica=median(Precio))
MediEstadoe## Warning: Returning more (or less) than 1 row per `summarise()` group was deprecated in
## dplyr 1.1.0.
## ℹ Please use `reframe()` instead.
## ℹ When switching from `summarise()` to `reframe()`, remember that `reframe()`
## always returns an ungrouped data frame and adjust accordingly.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## `summarise()` has grouped output by 'Vivienda'. You can override using the
## `.groups` argument.
En esta grafico vemos la comparacion de las medias de los precios agrupados en la variable de vivienda