Realizar una interpretación de datos a partir de muestras simuladas mediante una distribución de frecuencias y visualización gráfica de datos cualitativos.
A través de un proceso que incluye datos, codificación y resultaos se hace un análisis e interpretación de datos.
El proceso incluye varios aspectos: la creación de datos con una muestra de 50 elementos; el formateo o categorización de los mismos; la generación de frecuencias de clase, relativas y porcentuales y la creación de la distribución de frecuencias.
El análisis de los datos se hace a partir de la tabla de frecuencias, se genera una visualización gráfica y se interpretan los resultados.
La visualización de datos es mediante gráfica de barra y de pastel respectivamente y la interpretación del caso incluye responder a las cuestiones particulares del ejercicio.
pendiente
Los datos son simulados a partir de nombres de refrescos de una muestra de 50 compras que hicieron 50 clientes y se les preguntó que refresco compraron. La versión del caso original se encuentra en el ejercicio de la distribución de una muestra de compra de refrescos del libro de Anderson, Sweeney, & Williams (2008) (pág. 28).
El caso, analiza una distribución de frecuencia de 50 datos de una muestra de refrescos, simulando una encuesta a 50 personas de preferencias de refrescos.
Los datos se costruyen con la función de concatenación c().
Las variables en donde se almacenan los datos son estructuras vectores en R, categorizados con las función factor().
Se determinan frecuencias de clase con la función table(), frecuencias relativas y porcentuales, se construye la tabla de frecuencias con la función data.frame(), se generan gráficas de barra y pastel y se interpreta el caso.
datos <- c('coca original','coca light','fanta','sprite','sidral','fresca','pepsi','sevenup','manzanita','jarrito','coca original','coca light','fanta','sprite','sidral','fresca','pepsi','sevenup','manzanita','jarrito','coca original','coca light','fanta','sprite','sidral','fresca','pepsi','sevenup','manzanita','jarrito','coca original','coca light','fanta','sprite','sidral','fresca','pepsi','sevenup','manzanita','jarrito','coca original','coca light','fanta','sprite','sidral','fresca','pepsi','sevenup','manzanita','jarrito')
datos
## [1] "coca original" "coca light" "fanta" "sprite"
## [5] "sidral" "fresca" "pepsi" "sevenup"
## [9] "manzanita" "jarrito" "coca original" "coca light"
## [13] "fanta" "sprite" "sidral" "fresca"
## [17] "pepsi" "sevenup" "manzanita" "jarrito"
## [21] "coca original" "coca light" "fanta" "sprite"
## [25] "sidral" "fresca" "pepsi" "sevenup"
## [29] "manzanita" "jarrito" "coca original" "coca light"
## [33] "fanta" "sprite" "sidral" "fresca"
## [37] "pepsi" "sevenup" "manzanita" "jarrito"
## [41] "coca original" "coca light" "fanta" "sprite"
## [45] "sidral" "fresca" "pepsi" "sevenup"
## [49] "manzanita" "jarrito"
n <- length(datos)
n
## [1] 50
datos <- factor(datos)
datos
## [1] coca original coca light fanta sprite sidral
## [6] fresca pepsi sevenup manzanita jarrito
## [11] coca original coca light fanta sprite sidral
## [16] fresca pepsi sevenup manzanita jarrito
## [21] coca original coca light fanta sprite sidral
## [26] fresca pepsi sevenup manzanita jarrito
## [31] coca original coca light fanta sprite sidral
## [36] fresca pepsi sevenup manzanita jarrito
## [41] coca original coca light fanta sprite sidral
## [46] fresca pepsi sevenup manzanita jarrito
## 10 Levels: coca light coca original fanta fresca jarrito manzanita ... sprite
frecuencia.clase <- table(datos)
frecuencia.clase
## datos
## coca light coca original fanta fresca jarrito
## 5 5 5 5 5
## manzanita pepsi sevenup sidral sprite
## 5 5 5 5 5
frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
## coca light coca original fanta fresca jarrito
## 0.1 0.1 0.1 0.1 0.1
## manzanita pepsi sevenup sidral sprite
## 0.1 0.1 0.1 0.1 0.1
frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
## coca light coca original fanta fresca jarrito
## 10 10 10 10 10
## manzanita pepsi sevenup sidral sprite
## 10 10 10 10 10
tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))
names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')
tabla.frecuencia
## Clases Frecuencia de clase Relativa Porcentual
## 1 coca light 5 0.1 10
## 2 coca original 5 0.1 10
## 3 fanta 5 0.1 10
## 4 fresca 5 0.1 10
## 5 jarrito 5 0.1 10
## 6 manzanita 5 0.1 10
## 7 pepsi 5 0.1 10
## 8 sevenup 5 0.1 10
## 9 sidral 5 0.1 10
## 10 sprite 5 0.1 10
barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de refrescos")
pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)
Contestar de manera descriptiva cada una de las siguientes preguntas:
#¿Cual es el refresco más comprado y su frecuencia de clase? todos con la misma clase de 10 #¿Cuál es el refresco menos comprado y su frecuencia de clase? todos salieron igual en clase por lo tanto no hay menor clase #¿Cuáles son las frecuencias relativas en cada refresco? datos coca light coca original fanta fresca jarrito 0.1 0.1 0.1 0.1 0.1 manzanita pepsi sevenup sidral sprite 0.1 0.1 0.1 0.1 0.1 #¿Cuáles son los procentajes de refrescos más y menos comprados? datos coca light coca original fanta fresca jarrito 10 10 10 10 10 manzanita pepsi sevenup sidral sprite 10 10 10 10 10 #¿Qué representa la tabla de distribución de frecuencias, la gráfica de barra y gráfica de pasel? los refrescos con mayor clase y frecuencia de los que son s¿consumidos
#¿qué aprendizajes se obtuvieron? porcentajes saber como calcular estadisticas de algo tan consumido como el refreso #¿Qué deja el caso? mucha contrariedad pero mucho aprendizaje y practica #¿qué habilidades se desarrollan? estadistica y programacion #¿qué formación se obtiene? estadistica y saber usr ms el rstudio #¿qué ideas se generan?… practicas del tema ver las estadisticas y sacar conclusiones del tema… …
Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía Estadística para administración y economía. 10a. Edición. México, D.F: Cengage Learning Editores,S.A. de C.V.
Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística. México, D.F.: Cengage Learning Editores, S.A. de C.V.
Walpole, R., Myers, R. H., Myers, S. L., & Ye, K. (2007). Probabilidad y estadística para Ingeniería y Ciencias. Octava Edición (Octava Edición ed.). México: Prentice Hill. Pearson Educación.
Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición ed.). Cd. México: Pearson.