###{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE)
###This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
###When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
###{r cars} summary(cars)
#You can also embed plots, for example:
###{r pressure, echo=FALSE} plot(pressure)
#Note that the echo = FALSE
parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.
##ESCALA NOMINAL: La escala nominal se utiliza para etiquetar variables sin ningún valor cuantitativo,ejemplo: género, estado civil. En una escala nominal, la operación consiste en dividir una clase determinada en un conjunto de subclases mutuamente excluyentes.
##ESCALA ORDINAL:En la escala ordinal, lo importante y significativo es el orden de los valores, pero no se conocen realmente las diferencias entre cada uno de ellos. Sus categorías están ordenadas por rango; cada clase posee una misma relación posicional con la siguiente; es decir, la escala muestra situaciones escalonadas.
##ESCALA DE INTERVALOS:La escala de intervalo es una escala numérica en la que conocemos tanto el orden como las diferencias exactas entre los valores. Es un tipo de medicición en la que las distancias entre los valores son significativas y se pueden medir, pero el cero es arbitrario y no representa la ausencia total de la característica medida.
##ESCALA DE RAZÓN:La escala de razón arroja el valor exacto entre las unidades y también tienen un cero absoluto, lo que permite aplicar una amplia gama de estadísticas tanto descriptivas como inferenciales.
install.packages(‘dplyr’)
install.packages(‘descriptr’)
install.packages(‘ggplot2’)
install.packages(“datos”)
library(dplyr)
library(descriptr)
library(ggplot2)
library(datos)
View(datos_credito)
datos.c <- datos_credito
set.seed(4495) #sembrar semilla
#TOMAR MUESTRA ALEATORIA 120 REGISTROS
datos.c <- datos_credito
muestra_credito <- sample_n(datos.c, size = 120, replace = FALSE) View(muestra_credito)
#Diagrma de barras #datos.m$ muestra todas las variables de la base de datos.m tabla_frec <- table(muestra_credito$Vivienda) #TABLA DE FRECUENCIAS PARA VIVIENDA
tabla_frec
barplot(tabla_frec , col = c(“#32f002”,“cadetblue1”,“#000”,“#ff2004”,“#f29”,“#ff2”), horiz=FALSE, density=NULL,ylab= “Personas” , border = TRUE, ylim=c(0,60),xlab=“Tipo de persona”,main=“Vivienda”)
tabla_frec_1 <- table(muestra_credito$Trabajo) #TABLA DE FRECUENCIAS PARA VIVIENDA
pie(tabla_frec_1,labels = names(tabla_frec_1),density=NULL,edges = 500, radius = 0.8, col=c(“aquamarine1”,“antiquewhite2”, “purple”,“darkseagreen2”,“#f29”,“#ff2”), clockwise = TRUE, main = “Tipo de personas”, border = “black”) #Estas conclusiones fueron elaboradas con la ayuda de la inteligencia artificial #CONCLUSIONES #PRIMERA CONCLUSION #Diagrama de barras (Vivienda) #La mayoría de las personas viven con sus padres, superando notablemente a las demás categorías. Aqui, se encuentran quienes alquilan su vivienda, seguidos por aquellos clasificados como padres (posiblemente hogares propios con familia). Las categorías otra y ignorar presentan frecuencias mucho menores, siendo la última prácticamente inexistente. Esta distribución sugiere que, en la base de datos, predomina un perfil de personas que no poseen vivienda propia y dependen de un hogar familiar, lo cual puede estar relacionado con su nivel de ingresos y estabilidad económica.
#SEGUNDA CONCLUSION #Diagrama de torta (Trabajo) #El gráfico evidencia que la mayoría de las personas de la muestra tienen un empleo fijo, representando más de la mitad del total. En segundo lugar, se encuentran los freelance, seguidos por quienes trabajan a tiempo parcial. La categoría otros es la menos representativa. Esta distribución muestra que la base de datos está compuesta principalmente por personas con empleo estable, lo cual puede influir en la evaluación de riesgo y capacidad de pago en estudios de crédito
#TERCERA CONCLUSION #Se identificaron y describieron correctamente las escalas nominal, ordinal, de intervalos y de razón, lo cual permite clasificar y entender el tipo de datos que se analizan en estadística.
#CUARTA CONCLUSION #La selección de 120 registros aleatorios a partir de la base de datos datos_credito asegura que los análisis no estén sesgados por un orden específico de los datos lo que garantizo representatividad en las gráficas.