Objetivo

Realizar una interpretación de datos a partir de muestras simuladas mediante una distribución de frecuencias y visualización gráfica de datos cualitativos.

Descripción

A través de un proceso que incluye datos, codificación y resultaos se hace un análisis e interpretación de datos.

El proceso incluye varios aspectos: la creación de datos con una muestra de 50 elementos; el formateo o categorización de los mismos; la generación de frecuencias de clase, relativas y porcentuales y la creación de la distribución de frecuencias.

El análisis de los datos se hace a partir de la tabla de frecuencias, se genera una visualización gráfica y se interpretan los resultados.

La visualización de datos es mediante gráfica de barra y de pastel respectivamente y la interpretación del caso incluye responder a las cuestiones particulares del ejercicio.

Marco teórico

Pendiente

Desarrollo

Los datos son simulados a partir de nombres de refrescos de una muestra de 50 compras que hicieron 50 clientes y se les preguntó que refresco compraron. La versión del caso original se encuentra en el ejercicio de la distribución de una muestra de compra de refrescos del libro de Anderson, Sweeney, & Williams (2008) (pág. 28).

El caso, analiza una distribución de frecuencia de 50 datos de una muestra de refrescos, simulando una encuesta a 50 personas de preferencias de refrescos.

Los datos se costruyen con la función de concatenación c().

Las variables en donde se almacenan los datos son estructuras vectores en R, categorizados con las función factor().

Se determinan frecuencias de clase con la función table(), frecuencias relativas y porcentuales, se construye la tabla de frecuencias con la función data.frame(), se generan gráficas de barra y pastel y se interpreta el caso.

La creacion de los datos

datos <- c ('fanta','manzanita','fresca','jarrito','barrilito','fresca','barrilito','fanta','manzanita','jarrito','barrilito','fresca','jarrito','fresca','fresca','fanta','manzanita','fresca','jarrito','barrilito','fresca','barrilito','fanta','manzanita','jarrito','barrilito','fresca','jarrito','fresca','fresca','fanta','manzanita','fresca','jarrito','barrilito','fresca','barrilito','fanta','manzanita','jarrito','barrilito','fresca','jarrito','fresca','fresca','fanta','manzanita','fresca','jarrito','barrilito')

datos
##  [1] "fanta"     "manzanita" "fresca"    "jarrito"   "barrilito" "fresca"   
##  [7] "barrilito" "fanta"     "manzanita" "jarrito"   "barrilito" "fresca"   
## [13] "jarrito"   "fresca"    "fresca"    "fanta"     "manzanita" "fresca"   
## [19] "jarrito"   "barrilito" "fresca"    "barrilito" "fanta"     "manzanita"
## [25] "jarrito"   "barrilito" "fresca"    "jarrito"   "fresca"    "fresca"   
## [31] "fanta"     "manzanita" "fresca"    "jarrito"   "barrilito" "fresca"   
## [37] "barrilito" "fanta"     "manzanita" "jarrito"   "barrilito" "fresca"   
## [43] "jarrito"   "fresca"    "fresca"    "fanta"     "manzanita" "fresca"   
## [49] "jarrito"   "barrilito"

Numero de elemntos

n <- length(datos)
n
## [1] 50

Determinar los datos como tipo factor o categóricos

datos <- factor(datos)
datos
##  [1] fanta     manzanita fresca    jarrito   barrilito fresca    barrilito
##  [8] fanta     manzanita jarrito   barrilito fresca    jarrito   fresca   
## [15] fresca    fanta     manzanita fresca    jarrito   barrilito fresca   
## [22] barrilito fanta     manzanita jarrito   barrilito fresca    jarrito  
## [29] fresca    fresca    fanta     manzanita fresca    jarrito   barrilito
## [36] fresca    barrilito fanta     manzanita jarrito   barrilito fresca   
## [43] jarrito   fresca    fresca    fanta     manzanita fresca    jarrito  
## [50] barrilito
## Levels: barrilito fanta fresca jarrito manzanita

Frecuencia de cada clase

frecuencia.clase <- table(datos)
frecuencia.clase
## datos
## barrilito     fanta    fresca   jarrito manzanita 
##        10         7        16        10         7

Frecuencia relativa

frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
## barrilito     fanta    fresca   jarrito manzanita 
##      0.20      0.14      0.32      0.20      0.14

Frecuencia porcentual

frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
## barrilito     fanta    fresca   jarrito manzanita 
##        20        14        32        20        14

Construir la tabla de frecuencias

tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))

names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')

tabla.frecuencia
##      Clases Frecuencia de clase Relativa Porcentual
## 1 barrilito                  10     0.20         20
## 2     fanta                   7     0.14         14
## 3    fresca                  16     0.32         32
## 4   jarrito                  10     0.20         20
## 5 manzanita                   7     0.14         14

Gráfica de barra

barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de refrescos")

## Gráfica de pastel

pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)

Interpretación del ejercicio 1

Contestar de manera descriptiva cada una de las siguientes preguntas:

    ¿Cual es el refresco más comprado y su frecuencia de clase?
    FRESCA
    ¿Cuál es el refresco menos comprado y su frecuencia de clase?
    FANTA Y MANZANITA
    ¿Cuáles son las frecuencias relativas en cada refresco?
    barrilito     fanta    fresca   jarrito manzanita 
       0.20        0.14    0.32      0.20      0.14 
    ¿Cuáles son los procentajes de refrescos más y menos comprados?
    barrilito     fanta    fresca   jarrito manzanita 
       20           14        32        20        14
    ¿Qué representa la tabla de distribución de frecuencias, la gráfica de barra y gráfica de pasel?
    INTERPETAR DE MANERA SENCILLA LA INFORMACION OPTENIDA
    Describir aspectos generales del caso: ¿qué aprendizajes se obtuvieron?,
    ¿Qué deja el caso?, ¿qué habilidades se desarrollan?, ¿qué formación se obtiene, ¿qué ideas se generan?, entre otras cosas… …
    CON ESTA ACTIVIDAD PUDE DESENPRENDER LAS ACTIVIDADES APRENDIDAS DURANTE LA CLASE 

Respuestas Pendiente … Pendiente …

Referencias bibliográficas

Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía Estadística para administración y economía. 10a. Edición. México, D.F: Cengage Learning Editores,S.A. de C.V.

Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística. México, D.F.: Cengage Learning Editores, S.A. de C.V.

Walpole, R., Myers, R. H., Myers, S. L., & Ye, K. (2007). Probabilidad y estadística para Ingeniería y Ciencias. Octava Edición (Octava Edición ed.). México: Prentice Hill. Pearson Educación.

Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición ed.). Cd. México: Pearson.