Objetivo

Realizar una interpretación de datos a partir de muestras simuladas mediante una distribución de frecuencias y visualización gráfica de datos cualitativos.

Descripción

A través de un proceso que incluye datos, codificación y resultaos se hace un análisis e interpretación de datos.

El proceso incluye varios aspectos: la creación de datos con una muestra de 50 elementos; el formateo o categorización de los mismos; la generación de frecuencias de clase, relativas y porcentuales y la creación de la distribución de frecuencias.

El análisis de los datos se hace a partir de la tabla de frecuencias, se genera una visualización gráfica y se interpretan los resultados.

La visualización de datos es mediante gráfica de barra y de pastel respectivamente y la interpretación del caso incluye responder a las cuestiones particulares del ejercicio.

Marco teorico

pendiente

Desarrollo

Los datos son simulados a partir de nombres de refrescos de una muestra de 50 compras que hicieron 50 clientes y se les preguntó que refresco compraron. La versión del caso original se encuentra en el ejercicio de la distribución de una muestra de compra de refrescos del libro de Anderson, Sweeney, & Williams (2008) (pág. 28).

El caso, analiza una distribución de frecuencia de 50 datos de una muestra de refrescos, simulando una encuesta a 50 personas de preferencias de refrescos.

Los datos se costruyen con la función de concatenación c().

Las variables en donde se almacenan los datos son estructuras vectores en R, categorizados con las función factor().

Se determinan frecuencias de clase con la función table(), frecuencias relativas y porcentuales, se construye la tabla de frecuencias con la función data.frame(), se generan gráficas de barra y pastel y se interpreta el caso.

Datos

datos <- c('pepsi','coca cola','sprite','fanta','coors','manzanita','coors','coca cola','coca cola','pepsi','pepsi','sprite','pepsi','coca cola','sprite','fanta','coors','manzanita','coors','coca cola','coca cola','pepsi','pepsi','sprite','pepsi','coca cola','sprite','fanta','coors','manzanita','coors','coca cola','coca cola','pepsi','pepsi','sprite','pepsi','coca cola','sprite','fanta','coors','manzanita','coors','pepsi','pepsi','sprite','manzanita','coors','pepsi','pepsi')
datos
##  [1] "pepsi"     "coca cola" "sprite"    "fanta"     "coors"     "manzanita"
##  [7] "coors"     "coca cola" "coca cola" "pepsi"     "pepsi"     "sprite"   
## [13] "pepsi"     "coca cola" "sprite"    "fanta"     "coors"     "manzanita"
## [19] "coors"     "coca cola" "coca cola" "pepsi"     "pepsi"     "sprite"   
## [25] "pepsi"     "coca cola" "sprite"    "fanta"     "coors"     "manzanita"
## [31] "coors"     "coca cola" "coca cola" "pepsi"     "pepsi"     "sprite"   
## [37] "pepsi"     "coca cola" "sprite"    "fanta"     "coors"     "manzanita"
## [43] "coors"     "pepsi"     "pepsi"     "sprite"    "manzanita" "coors"    
## [49] "pepsi"     "pepsi"

Número de elementos

n <- length(datos)
n
## [1] 50

Determinar los datos como tipo factor o categóricos

datos <- factor(datos)
datos
##  [1] pepsi     coca cola sprite    fanta     coors     manzanita coors    
##  [8] coca cola coca cola pepsi     pepsi     sprite    pepsi     coca cola
## [15] sprite    fanta     coors     manzanita coors     coca cola coca cola
## [22] pepsi     pepsi     sprite    pepsi     coca cola sprite    fanta    
## [29] coors     manzanita coors     coca cola coca cola pepsi     pepsi    
## [36] sprite    pepsi     coca cola sprite    fanta     coors     manzanita
## [43] coors     pepsi     pepsi     sprite    manzanita coors     pepsi    
## [50] pepsi    
## Levels: coca cola coors fanta manzanita pepsi sprite

Frecuencia de cada clase

frecuencia.clase <- table(datos)
frecuencia.clase
## datos
## coca cola     coors     fanta manzanita     pepsi    sprite 
##        10         9         4         5        14         8

Frecuencia relativa

frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
## coca cola     coors     fanta manzanita     pepsi    sprite 
##      0.20      0.18      0.08      0.10      0.28      0.16

Frecuencia porcentual

frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
## coca cola     coors     fanta manzanita     pepsi    sprite 
##        20        18         8        10        28        16

Construir la tabla de frecuencias

tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))

names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')

tabla.frecuencia 
##      Clases Frecuencia de clase Relativa Porcentual
## 1 coca cola                  10     0.20         20
## 2     coors                   9     0.18         18
## 3     fanta                   4     0.08          8
## 4 manzanita                   5     0.10         10
## 5     pepsi                  14     0.28         28
## 6    sprite                   8     0.16         16

Gráfica de barra

barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de refrescos")

Gráfica de pastel

pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)

Interpretación del ejercicio 1

Contestar de manera descriptiva cada una de las siguientes preguntas:

¿Cual es el refresco más comprado y su frecuencia de clase?

pepsi(14)

¿Cuál es el refresco menos comprado y su frecuencia de clase?

fanta(4)

¿Cuáles son las frecuencias relativas en cada refresco?

coca cola coors fanta manzanita pepsi sprite 0.20 0.18 0.08 0.10 0.28 0.16

¿Cuáles son los porcentajes de refrescos más y menos comprados?

coca cola coors fanta manzanita pepsi sprite 20 18 8 10 28 16

¿Qué representa la tabla de distribución de frecuencias, la gráfica de barra y gráfica de pastel?

Los datos que pusimos de los refrescos pero mas detallado y en forma atractiva

Describir aspectos generales del caso:

¿qué aprendizajes se obtuvieron?

utilizar las herramientas del programa

¿Qué deja el caso?

buen aprendizaje del programa

¿qué habilidades se desarrollan?

el ir conociendo las formulas del programa de una manera mas sencilla

¿qué formación se obtiene?

el que me sirva para las proximas practicas

Referencias bibliográficas

Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía Estadística para administración y economía. 10a. Edición. México, D.F: Cengage Learning Editores,S.A. de C.V.

Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística. México, D.F.: Cengage Learning Editores, S.A. de C.V.

Walpole, R., Myers, R. H., Myers, S. L., & Ye, K. (2007). Probabilidad y estadística para Ingeniería y Ciencias. Octava Edición (Octava Edición ed.). México: Prentice Hill. Pearson Educación.

Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición ed.). Cd. México: Pearson.