Realizar una interpretación de datos a partir de muestras simuladas mediante una distribución de frecuencias y visualización gráfica de datos cualitativos.
A través de un proceso que incluye datos, codificación y resultaos se hace un análisis e interpretación de datos.
El proceso incluye varios aspectos: la creación de datos con una muestra de 50 elementos; el formateo o categorización de los mismos; la generación de frecuencias de clase, relativas y porcentuales y la creación de la distribución de frecuencias.
El análisis de los datos se hace a partir de la tabla de frecuencias, se genera una visualización gráfica y se interpretan los resultados.
La visualización de datos es mediante gráfica de barra y de pastel respectivamente y la interpretación del caso incluye responder a las cuestiones particulares del ejercicio.
pendiente
Los datos son simulados a partir de nombres de refrescos de una muestra de 50 compras que hicieron 50 clientes y se les preguntó que refresco compraron. La versión del caso original se encuentra en el ejercicio de la distribución de una muestra de compra de refrescos del libro de Anderson, Sweeney, & Williams (2008) (pág. 28).
El caso, analiza una distribución de frecuencia de 50 datos de una muestra de refrescos, simulando una encuesta a 50 personas de preferencias de refrescos.
Los datos se costruyen con la función de concatenación c().
Las variables en donde se almacenan los datos son estructuras vectores en R, categorizados con las función factor().
Se determinan frecuencias de clase con la función table(), frecuencias relativas y porcentuales, se construye la tabla de frecuencias con la función data.frame(), se generan gráficas de barra y pastel y se interpreta el caso.
datos <- c('pepsi','coca cola','sprite','fanta','coors','manzanita','coors','coca cola','coca cola','pepsi','pepsi','sprite','pepsi','coca cola','sprite','fanta','coors','manzanita','coors','coca cola','coca cola','pepsi','pepsi','sprite','pepsi','coca cola','sprite','fanta','coors','manzanita','coors','coca cola','coca cola','pepsi','pepsi','sprite','pepsi','coca cola','sprite','fanta','coors','manzanita','coors','pepsi','pepsi','sprite','manzanita','coors','pepsi','pepsi')
datos
## [1] "pepsi" "coca cola" "sprite" "fanta" "coors" "manzanita"
## [7] "coors" "coca cola" "coca cola" "pepsi" "pepsi" "sprite"
## [13] "pepsi" "coca cola" "sprite" "fanta" "coors" "manzanita"
## [19] "coors" "coca cola" "coca cola" "pepsi" "pepsi" "sprite"
## [25] "pepsi" "coca cola" "sprite" "fanta" "coors" "manzanita"
## [31] "coors" "coca cola" "coca cola" "pepsi" "pepsi" "sprite"
## [37] "pepsi" "coca cola" "sprite" "fanta" "coors" "manzanita"
## [43] "coors" "pepsi" "pepsi" "sprite" "manzanita" "coors"
## [49] "pepsi" "pepsi"
n <- length(datos)
n
## [1] 50
datos <- factor(datos)
datos
## [1] pepsi coca cola sprite fanta coors manzanita coors
## [8] coca cola coca cola pepsi pepsi sprite pepsi coca cola
## [15] sprite fanta coors manzanita coors coca cola coca cola
## [22] pepsi pepsi sprite pepsi coca cola sprite fanta
## [29] coors manzanita coors coca cola coca cola pepsi pepsi
## [36] sprite pepsi coca cola sprite fanta coors manzanita
## [43] coors pepsi pepsi sprite manzanita coors pepsi
## [50] pepsi
## Levels: coca cola coors fanta manzanita pepsi sprite
frecuencia.clase <- table(datos)
frecuencia.clase
## datos
## coca cola coors fanta manzanita pepsi sprite
## 10 9 4 5 14 8
frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
## coca cola coors fanta manzanita pepsi sprite
## 0.20 0.18 0.08 0.10 0.28 0.16
frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
## coca cola coors fanta manzanita pepsi sprite
## 20 18 8 10 28 16
tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))
names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')
tabla.frecuencia
## Clases Frecuencia de clase Relativa Porcentual
## 1 coca cola 10 0.20 20
## 2 coors 9 0.18 18
## 3 fanta 4 0.08 8
## 4 manzanita 5 0.10 10
## 5 pepsi 14 0.28 28
## 6 sprite 8 0.16 16
barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de refrescos")
pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)
Contestar de manera descriptiva cada una de las siguientes preguntas:
pepsi(14)
fanta(4)
coca cola coors fanta manzanita pepsi sprite 0.20 0.18 0.08 0.10 0.28 0.16
coca cola coors fanta manzanita pepsi sprite 20 18 8 10 28 16
Los datos que pusimos de los refrescos pero mas detallado y en forma atractiva
utilizar las herramientas del programa
buen aprendizaje del programa
el ir conociendo las formulas del programa de una manera mas sencilla
el que me sirva para las proximas practicas
Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía Estadística para administración y economía. 10a. Edición. México, D.F: Cengage Learning Editores,S.A. de C.V.
Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística. México, D.F.: Cengage Learning Editores, S.A. de C.V.
Walpole, R., Myers, R. H., Myers, S. L., & Ye, K. (2007). Probabilidad y estadística para Ingeniería y Ciencias. Octava Edición (Octava Edición ed.). México: Prentice Hill. Pearson Educación.
Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición ed.). Cd. México: Pearson.