Desarrollar una interpretacion de datos a partir de muestras simuladas mediante una distrbucion de frecuencias y visualizaciones grafica de datos cualitativos.
Desarrollar una interpretacion de datos a partir de la creacion de distribuciones de frecuencia y visualizacion de datos de tres ejercicios con datos cualitativos. La visualizacion de datos es mediante grafica de barra y de pastel respectivamente y la interpretacion del caso para cada ejercicio incluye responder a las cuestiones particulares de cadda ejercicio.
La estadística es la disciplina matemática que trata con el análisis y estudio de los datos y la estadística descriptiva es el mecanismo que presenta los datos de manera resumida comprensible para su adecuada interpretación y comunicación.
¿qué datos y cuántos datos hay que analizar y estudiar?, ¿cuáles mediciones hay que hacer y determinar?, para responder a estos cuestionamientos de cualquier estudio y contexto, primero hay es necesario distinguir entre dos conceptos íntimamente relacionados con estadística, los de población y muestra.
Anderson Sweeney y Williams (2008) conceptualizan que una “población es el conjunto de todos los elementos de interés en un estudio determinado; la muestra es un subconjunto de la población” (pág. 15).
Walpole, Myers, Myers y Ye (2012) mencionan que “la información se colecta en forma de muestras o conjuntos de observaciones, las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los individuos o elementos individuales de un tipo específico” (pág. 2).
Mendenhall, Beaver, y Beaver (2010) mencionana que “en el lenguaje de la estadística, uno de los conceptos más elementales es el muestreo. En casi todos los problemas de estadística, un número especificado de mediciones o datos, es decir, una muestra, se toma de un cuerpo de mediciones más grande llamado población” (pág. 3).
En un estudio estadístico se determinan algunas medidas, máximos, mínimos, medias, varianzas, desviaciones, cuartiles, percentiles, frecuencias, porcentajes, entre muchas otras, si estas medidas se calculan usando los datos de una muestra, se llaman estadísticos muestrales, si las medidas se determinan con los datos de una población se llaman parámetros poblacionales. (Anderson, Sweeney, & Williams, 2008).
Los datos se pueden clasificar en cualitativos o cuantitativos. Los datos cualitativos o categóricos emplean etiquetas o nombres para determinar categorías de elementos iguales o diferentes. Los datos cuantitativos son valores numéricos en los que se permite hacer operaciones matemáticas o determianr medidas estadísticas.
En su libro Mendenhall, Beaver y Beaver (2010), establecen que las variables cualitativas miden una cualidad o característica en cada unidad experimental. Las variables cuantitativas miden una cantidad numérica en cada unidad experimental. (pág. 10)
Una distribución de frecuencia es un resumen tabular de datos que muestra el número (frecuencia) de elementos en cada una de las diferentes clases disyuntas (que no se sobreponen) (Anderson, Sweeney, & Williams, 2008).
Una clase en elementos cualitativos es una etiqueta de cada tipo que hay en el conjunto de datos. Una frecuencia de clase para datos cualitativos es el número de elementos que existen de etiquetas individuales y diferentes entre si de cada tipo del conjunto de datos.
Para determinar una tabla de distribución de frecuencia se cuentan cada uno de los elementos de cada clase del conjunto de datos en la cual se indica cuántos elementos hay de cada clase y que proporción existe con respecto al número total de elementos.
frecuencia.de.clase=número.de.elementos.de.cada.clase
La frecuencia relativa de una clase es igual a la parte o proporción de los elementos que pertenecen a cada clase. En un conjunto de datos, en el que hay n observaciones, la frecuencia relativa de cada clase se determina como dividiendo la cantidad de cada clase entre el número de elementos
frecuencia.relativa=frecuencia.de.clasen
La frecuencia porcentual de una clase es la frecuencia relativa multiplicada por 100
frecuencia.porcentual=frecuencia.relativa×100
Entonces una distribución de frecuencia ofrece un resumen tabular de datos en el que se muestra la frecuencia relativa de cada clase. Una distribución de frecuencia porcentual da la frecuencia porcentual de los datos de cada clase (Anderson, Sweeney, & Williams, 2008).
Una gráfica de barras o un diagrama de barras, es una gráfica para representar los datos cualitativos de una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual. En el horizontal, se especifican las etiquetas empleadas para las clases (categorías), en el eje vertical se indica una escala para frecuencia, frecuencia relativa o frecuencia porcentual. Después, empleando un ancho de barra fijo, se dibuja sobre cada etiqueta de las clases una barra que se extiende de la base del eje horizontal hasta la frecuencia, frecuencia relativa o frecuencia porcentual de la clase (Anderson, Sweeney, & Williams, 2008).
La gráfica de pastel proporciona otra manera de mostrar distribuciones de frecuencia de clase, relativa o porcentual de datos cualitativos. Para elaborar una gráfica de pastel, primero se dibuja un círculo que representa todos los datos. Después se usa la frecuencia relativa para subdividir el círculo en sectores, o partes, que corresponden a la frecuencia relativa de cada clase (Anderson, Sweeney, & Williams, 2008).
Los datos son simulados a partir de nombres de refrescos de una muestra de 50 compras que hicieron 50 clientes y se les preguntó que refresco compraron. La versión del caso original se encuentra en el ejercicio de la distribución de una muestra de compra de refrescos del libro de Anderson, Sweeney, & Williams (2008) (pág. 28).
El caso, analiza una distribución de frecuencia de 50 datos de una muestra de refrescos, simulando una encuesta a 50 personas de preferencias de refrescos.
Los datos se costruyen con la función de concatenación c().
Las variables en donde se almacenan los datos son estructuras vectores en R, categorizados con las función factor().
Se determinan frecuencias de clase con la función table(), frecuencias relativas y porcentuales, se construye la tabla de frecuencias con la función data.frame(), se generan gráficas de barra y pastel y se interpreta el caso.
datos <- c('Coke Classic','Sprite','Pepsi',
'Diet Coke','Coke Classic','Coke Classic','Pepsi','Diet Coke','Coke Classic','Diet Coke','Coke Classic','Coke Classic',
'Coke Classic','Diet Coke','Pepsi',
'Coke Classic','Coke Classic','Dr. Pepper',
'Dr. Pepper','Sprite','Coke Classic',
'Diet Coke','Pepsi','Diet Coke',
'Pepsi','Coke Classic','Pepsi',
'Pepsi','Coke Classic','Pepsi',
'Coke Classic','Coke Classic','Pepsi',
'Dr. Pepper','Pepsi','Pepsi',
'Sprite','Coke Classic','Coke Classic',
'Coke Classic','Sprite','Dr. Pepper',
'Diet Coke','Dr. Pepper','Pepsi',
'Coke Classic','Pepsi', 'Sprite',
'Coke Classic','Diet Coke')
datos
## [1] "Coke Classic" "Sprite" "Pepsi" "Diet Coke" "Coke Classic"
## [6] "Coke Classic" "Pepsi" "Diet Coke" "Coke Classic" "Diet Coke"
## [11] "Coke Classic" "Coke Classic" "Coke Classic" "Diet Coke" "Pepsi"
## [16] "Coke Classic" "Coke Classic" "Dr. Pepper" "Dr. Pepper" "Sprite"
## [21] "Coke Classic" "Diet Coke" "Pepsi" "Diet Coke" "Pepsi"
## [26] "Coke Classic" "Pepsi" "Pepsi" "Coke Classic" "Pepsi"
## [31] "Coke Classic" "Coke Classic" "Pepsi" "Dr. Pepper" "Pepsi"
## [36] "Pepsi" "Sprite" "Coke Classic" "Coke Classic" "Coke Classic"
## [41] "Sprite" "Dr. Pepper" "Diet Coke" "Dr. Pepper" "Pepsi"
## [46] "Coke Classic" "Pepsi" "Sprite" "Coke Classic" "Diet Coke"
n <- length(datos)
n
## [1] 50
datos <- factor(datos)
datos
## [1] Coke Classic Sprite Pepsi Diet Coke Coke Classic
## [6] Coke Classic Pepsi Diet Coke Coke Classic Diet Coke
## [11] Coke Classic Coke Classic Coke Classic Diet Coke Pepsi
## [16] Coke Classic Coke Classic Dr. Pepper Dr. Pepper Sprite
## [21] Coke Classic Diet Coke Pepsi Diet Coke Pepsi
## [26] Coke Classic Pepsi Pepsi Coke Classic Pepsi
## [31] Coke Classic Coke Classic Pepsi Dr. Pepper Pepsi
## [36] Pepsi Sprite Coke Classic Coke Classic Coke Classic
## [41] Sprite Dr. Pepper Diet Coke Dr. Pepper Pepsi
## [46] Coke Classic Pepsi Sprite Coke Classic Diet Coke
## Levels: Coke Classic Diet Coke Dr. Pepper Pepsi Sprite
frecuencia.clase <- table(datos)
frecuencia.clase
## datos
## Coke Classic Diet Coke Dr. Pepper Pepsi Sprite
## 19 8 5 13 5
frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
## Coke Classic Diet Coke Dr. Pepper Pepsi Sprite
## 0.38 0.16 0.10 0.26 0.10
frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
## Coke Classic Diet Coke Dr. Pepper Pepsi Sprite
## 38 16 10 26 10
tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))
names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')
tabla.frecuencia
## Clases Frecuencia de clase Relativa Porcentual
## 1 Coke Classic 19 0.38 38
## 2 Diet Coke 8 0.16 16
## 3 Dr. Pepper 5 0.10 10
## 4 Pepsi 13 0.26 26
## 5 Sprite 5 0.10 10
barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de refrescos")
pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)
¿Cual es el refresco más comprado y su frecuencia de clase? COKE CLASSSIC (19)
¿Cuál es el refresco menos comprado y su frecuencia de clase? SPRITE (5)
¿Cuáles son las frecuencias relativas en cada refresco? COKE CLASSIC (0.38), DIET COKE (0.16), DR, PEPPER (0.10), PEPSI (0.26), SPRITE (0.10)
¿Cuáles son los procentajes de refrescos más y menos comprados? MÀS COMPRADO: COKE CLASSIC (38%), MENOS COMPRADA: SPRITE (10%)
¿Qué representa la tabla de distribución de frecuencias, la gráfica de barra y gráfica de pasel? Frecuencia absoluta al número de veces que se repite una variable en un experimento,Frecuencia relativa representa la cantidad de veces que se repite una observación, expresada como proporción de la muestra. Representan la frecuencia de cada clase (refrescos).
Describir aspectos generales del caso: ¿qué aprendizajes se obtuvieron?, ¿Qué deja el caso?, ¿qué habilidades se desarrollan?, ¿qué formación se obtiene, ¿qué ideas se generan?, entre otras cosas… ESTA PRACTICA NOS SIRVIO PARA IDENTIFICAR COMO SE VAN FORMANDO TODOS LOS GRAFICOS NECESARIOS PARA IDENTIFICAR LA FRECUENCIA EN DATOS ESPECIFICOS EN CANTIDADES GRANDES.
Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía Estadística para administración y economía. 10a. Edición. México, D.F: Cengage Learning Editores,S.A. de C.V.
Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística. México, D.F.: Cengage Learning Editores, S.A. de C.V.
Walpole, R., Myers, R. H., Myers, S. L., & Ye, K. (2007). Probabilidad y estadística para Ingeniería y Ciencias. Octava Edición (Octava Edición ed.). México: Prentice Hill. Pearson Educación.
Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición ed.). Cd. México: Pearson.