Realizar una interpretación de datos a partir de una simulación de un conjunto de datos cualitativos y por medio de una distribución de frecuencias y visualización gráfica de datos.
A través de un proceso que incluye datos, codificación y resultados se hace un análisis e interpretación de datos.
El proceso incluye varios aspectos: la creación de los datos que implica crear y procesar diez mil nombres de personas a partir de un vector de cincuenta nombres diferentes; el formateo o categorización de los mismos; la generación de frecuencias de clase, relativas y porcentuales y la creación de la distribución de frecuencias.
El análisis de los datos se hace a partir de la tabla de frecuencias, se genera una visualización gráfica se interpretan los resultados. La visualización de datos es mediante gráfica de barra y de pastel respectivamente y la interpretación del caso incluye responder a las cuestiones particulares del caso.
pendiente
Se presentan datos de cincuenta nombre de personas credos a partir de la función c() y amacenados en una variable tipo vector llamada nombres.
Se utiliza la función factor() para categorizar los nombres, es decir que se pueda identificar nombres diferentes además que se pueda determinar su frecuencia.
Se determinan frecuencias de clase, frecuencias relativas y porcentuales, tablas de frecuencias, gráficas de barra y pastel del ejercicio.
Simular la generación de una muestra diez mil (10000) nombres de personas a partir de la simulación de 50 datos nombres diferentes para determinar la ditribución de frecuencias.
Se utiliza la variable tipo vector nombres ## sembrar una semilla
set.seed(2021)
nombres <- c('Claudia', 'Leonardo', 'Antonio', 'Cristina', 'Luis','Leonardo' , 'Claudia' , 'Antonio' , 'Luis', 'Leonardo', 'Luis','Cristina,','Antonio','Luis','Leonardo','Claudia','Claudia','Claudia','Antonio','Claudia','Claudia','Claudia','Claudia','Leonardo','Claudia','Antonio','Cristina','Claudia','Claudia','Leonardo','Luis','Antonio','Claudia','Cristina','Luis','Claudia','Leonardo','Cristina','Clauida','Leonardo','Claudia','Antonio','Antonio','Claudia','Leonardo','Luis','Cristina','Cristina','Leonardo','Claudia')
nombres
## [1] "Claudia" "Leonardo" "Antonio" "Cristina" "Luis" "Leonardo"
## [7] "Claudia" "Antonio" "Luis" "Leonardo" "Luis" "Cristina,"
## [13] "Antonio" "Luis" "Leonardo" "Claudia" "Claudia" "Claudia"
## [19] "Antonio" "Claudia" "Claudia" "Claudia" "Claudia" "Leonardo"
## [25] "Claudia" "Antonio" "Cristina" "Claudia" "Claudia" "Leonardo"
## [31] "Luis" "Antonio" "Claudia" "Cristina" "Luis" "Claudia"
## [37] "Leonardo" "Cristina" "Clauida" "Leonardo" "Claudia" "Antonio"
## [43] "Antonio" "Claudia" "Leonardo" "Luis" "Cristina" "Cristina"
## [49] "Leonardo" "Claudia"
datos <- sample(nombres, size = 100, replace = TRUE)
head(datos, 50)
## [1] "Claudia" "Cristina" "Luis" "Clauida" "Cristina," "Leonardo"
## [7] "Cristina" "Cristina" "Luis" "Luis" "Cristina" "Clauida"
## [13] "Claudia" "Claudia" "Cristina," "Claudia" "Antonio" "Luis"
## [19] "Leonardo" "Antonio" "Claudia" "Leonardo" "Claudia" "Luis"
## [25] "Cristina" "Cristina" "Antonio" "Cristina" "Claudia" "Luis"
## [31] "Luis" "Cristina" "Claudia" "Antonio" "Claudia" "Leonardo"
## [37] "Claudia" "Leonardo" "Leonardo" "Cristina" "Claudia" "Claudia"
## [43] "Claudia" "Leonardo" "Leonardo" "Leonardo" "Claudia" "Cristina"
## [49] "Leonardo" "Claudia"
tail(datos, 50)
## [1] "Cristina" "Leonardo" "Antonio" "Antonio" "Antonio" "Leonardo"
## [7] "Claudia" "Leonardo" "Claudia" "Luis" "Leonardo" "Luis"
## [13] "Claudia" "Cristina" "Luis" "Leonardo" "Claudia" "Cristina"
## [19] "Luis" "Leonardo" "Claudia" "Luis" "Antonio" "Claudia"
## [25] "Claudia" "Cristina" "Leonardo" "Antonio" "Claudia" "Claudia"
## [31] "Cristina" "Cristina" "Claudia" "Antonio" "Claudia" "Luis"
## [37] "Claudia" "Claudia" "Luis" "Leonardo" "Luis" "Luis"
## [43] "Claudia" "Antonio" "Claudia" "Claudia" "Leonardo" "Luis"
## [49] "Cristina" "Claudia"
n <- length(datos)
n
## [1] 100
datos <- factor(datos)
frecuencia.clase <- table(datos)
frecuencia.clase
## datos
## Antonio Claudia Clauida Cristina Cristina, Leonardo Luis
## 11 32 2 17 2 19 17
frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
## Antonio Claudia Clauida Cristina Cristina, Leonardo Luis
## 0.11 0.32 0.02 0.17 0.02 0.19 0.17
frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
## Antonio Claudia Clauida Cristina Cristina, Leonardo Luis
## 11 32 2 17 2 19 17
tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))
names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')
tabla.frecuencia
## Clases Frecuencia de clase Relativa Porcentual
## 1 Antonio 11 0.11 11
## 2 Claudia 32 0.32 32
## 3 Clauida 2 0.02 2
## 4 Cristina 17 0.17 17
## 5 Cristina, 2 0.02 2
## 6 Leonardo 19 0.19 19
## 7 Luis 17 0.17 17
barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de nombres. ")
tabla.frecuencia <- tabla.frecuencia[order(tabla.frecuencia$`Frecuencia de clase`, decreasing = TRUE), ]
tabla.frecuencia <- tabla.frecuencia[1:5,]
tabla.frecuencia
## Clases Frecuencia de clase Relativa Porcentual
## 2 Claudia 32 0.32 32
## 6 Leonardo 19 0.19 19
## 4 Cristina 17 0.17 17
## 7 Luis 17 0.17 17
## 1 Antonio 11 0.11 11
pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)
Contestar de manera descriptiva cada una de las siguientes preguntas:
claudia 33
cristina 2
Antonio Claudia Clauida Cristina Cristina, Leonardo 0.11 0.32 0.02 0.17 0.02 0.19 Luis 0.17
Antonio Claudia Clauida Cristina Cristina, Leonardo 11 32 2 17 2 19 Luis 17 # Que representa la tabla de distribución de frecuencias, la gráfica de barra y gráfica de pastel? 1-el numero de ocurrencias por cada valor 2-la comparacion de dos o mas valores 3-porcentajes y proporciones
##Aspectos generales del caso:
moverle al programa, tener una idea mas clara.
el conocimiento de datos y el uso correcto de ellos
el familiarizarse con el programa y usar bien las formulas
tener mas posibilidades de realizar los casos
Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía Estadística para administración y economía. 10a. Edición. México, D.F: Cengage Learning Editores,S.A. de C.V.
Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística. México, D.F.: Cengage Learning Editores, S.A. de C.V.
Walpole, R., Myers, R. H., Myers, S. L., & Ye, K. (2007). Probabilidad y estadística para Ingeniería y Ciencias. Octava Edición (Octava Edición ed.). México: Prentice Hill. Pearson Educación.
Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición ed.). Cd. México: Pearson.