Objetivo

Realizar una interpretación de datos a partir de muestras simuladas mediante una distribución de frecuencias y visualización gráfica de datos cualitativos.

Descripcion

A través de un proceso que incluye datos, codificación y resultaos se hace un análisis e interpretación de datos.

El proceso incluye varios aspectos: la creación de datos con una muestra de 50 elementos; el formateo o categorización de los mismos; la generación de frecuencias de clase, relativas y porcentuales y la creación de la distribución de frecuencias.

El análisis de los datos se hace a partir de la tabla de frecuencias, se genera una visualización gráfica y se interpretan los resultados.

La visualización de datos es mediante gráfica de barra y de pastel respectivamente y la interpretación del caso incluye responder a las cuestiones particulares del ejercicio.

Marco teorico

pendiente

Desarrollo

Se presentan datos de cincuenta nombre de personas credos a partir de la función c() y amacenados en una variable tipo vector llamada nombres.

Se utiliza la función factor() para categorizar los nombres, es decir que se pueda identificar nombres diferentes además que se pueda determinar su frecuencia.

Se determinan frecuencias de clase, frecuencias relativas y porcentuales, tablas de frecuencias, gráficas de barra y pastel del ejercicio.

Simular la generación de una muestra diez mil (10000) nombres de personas a partir de la simulación de 50 datos nombres diferentes para determinar la ditribución de frecuencias.

Se utiliza la variable tipo vector nombres

Sembrar una semilla

set.seed(2021)

datos nombres de personas

nombres <- c('miguel','rosa','brenda','berenice','ana','jenny','aaron','jarod','jaime','aurora','claudia','beto','emilio','victor','samantha','emmanuel','antonio','yahira','alan','benito','jesus','salvdor','alejandro','fernando','zayra','pedro','antonio','angel','montse','leslie','miguel','rosa','brenda','berenice','ana','jenny','aaron','jarod','jaime','aurora','claudia','beto','emilio','victor','samantha','emmanuel','antonio','yahira','alan','benito')

nombres

simular 100 nombres

datos <- sample(nombres, size = 100, replace = TRUE)

head(datos, 50)
##  [1] "aaron"     "jarod"     "emmanuel"  "jaime"     "beto"      "jenny"    
##  [7] "jarod"     "jarod"     "emmanuel"  "ana"       "antonio"   "jaime"    
## [13] "claudia"   "alejandro" "beto"      "yahira"    "brenda"    "emmanuel" 
## [19] "aurora"    "pedro"     "jenny"     "aaron"     "salvdor"   "miguel"   
## [25] "yahira"    "berenice"  "alan"      "berenice"  "salvdor"   "ana"      
## [31] "jaime"     "jarod"     "yahira"    "emilio"    "benito"    "jenny"    
## [37] "salvdor"   "jenny"     "samantha"  "berenice"  "salvdor"   "benito"   
## [43] "emmanuel"  "samantha"  "alan"      "fernando"  "antonio"   "jarod"    
## [49] "aaron"     "benito"
n <- length(datos)
n
## [1] 100

Determinar los datos como tipo factor o categóricos

datos <- factor(datos)

Frecuencia de clase

frecuencia.clase <- table(datos)
frecuencia.clase
## datos
##     aaron      alan alejandro       ana   antonio    aurora    benito  berenice 
##         5         6         2         2         5         2         3         5 
##      beto    brenda   claudia    emilio  emmanuel  fernando     jaime     jarod 
##         3         3         4         3         8         1         6         8 
##     jenny     jesus    leslie    miguel    montse     pedro      rosa   salvdor 
##         6         1         2         3         1         1         1         6 
##  samantha    victor    yahira     zayra 
##         4         3         5         1

frecuencia relativa

frecuencia.relativa <- frecuencia.clase / n
frecuencia.relativa
## datos
##     aaron      alan alejandro       ana   antonio    aurora    benito  berenice 
##      0.05      0.06      0.02      0.02      0.05      0.02      0.03      0.05 
##      beto    brenda   claudia    emilio  emmanuel  fernando     jaime     jarod 
##      0.03      0.03      0.04      0.03      0.08      0.01      0.06      0.08 
##     jenny     jesus    leslie    miguel    montse     pedro      rosa   salvdor 
##      0.06      0.01      0.02      0.03      0.01      0.01      0.01      0.06 
##  samantha    victor    yahira     zayra 
##      0.04      0.03      0.05      0.01

frecuencia porcentual

frecuencia.porcentual <- frecuencia.relativa * 100
frecuencia.porcentual
## datos
##     aaron      alan alejandro       ana   antonio    aurora    benito  berenice 
##         5         6         2         2         5         2         3         5 
##      beto    brenda   claudia    emilio  emmanuel  fernando     jaime     jarod 
##         3         3         4         3         8         1         6         8 
##     jenny     jesus    leslie    miguel    montse     pedro      rosa   salvdor 
##         6         1         2         3         1         1         1         6 
##  samantha    victor    yahira     zayra 
##         4         3         5         1

tabla de frecuencias

tabla.frecuencia <- data.frame(names(frecuencia.clase), as.vector(frecuencia.clase), as.vector(frecuencia.relativa), as.vector(frecuencia.porcentual))

names(tabla.frecuencia) <- c('Clases', 'Frecuencia de clase', 'Relativa', 'Porcentual')

tabla.frecuencia
##       Clases Frecuencia de clase Relativa Porcentual
## 1      aaron                   5     0.05          5
## 2       alan                   6     0.06          6
## 3  alejandro                   2     0.02          2
## 4        ana                   2     0.02          2
## 5    antonio                   5     0.05          5
## 6     aurora                   2     0.02          2
## 7     benito                   3     0.03          3
## 8   berenice                   5     0.05          5
## 9       beto                   3     0.03          3
## 10    brenda                   3     0.03          3
## 11   claudia                   4     0.04          4
## 12    emilio                   3     0.03          3
## 13  emmanuel                   8     0.08          8
## 14  fernando                   1     0.01          1
## 15     jaime                   6     0.06          6
## 16     jarod                   8     0.08          8
## 17     jenny                   6     0.06          6
## 18     jesus                   1     0.01          1
## 19    leslie                   2     0.02          2
## 20    miguel                   3     0.03          3
## 21    montse                   1     0.01          1
## 22     pedro                   1     0.01          1
## 23      rosa                   1     0.01          1
## 24   salvdor                   6     0.06          6
## 25  samantha                   4     0.04          4
## 26    victor                   3     0.03          3
## 27    yahira                   5     0.05          5
## 28     zayra                   1     0.01          1

grafica de barra

barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de nombres. ")

grafica de barra top 5

tabla.frecuencia <- tabla.frecuencia[order(tabla.frecuencia$`Frecuencia de clase`, decreasing = TRUE), ]
tabla.frecuencia <- tabla.frecuencia[1:5,]
tabla.frecuencia
##      Clases Frecuencia de clase Relativa Porcentual
## 13 emmanuel                   8     0.08          8
## 16    jarod                   8     0.08          8
## 2      alan                   6     0.06          6
## 15    jaime                   6     0.06          6
## 17    jenny                   6     0.06          6
barplot(height = tabla.frecuencia$`Frecuencia de clase`, names.arg = tabla.frecuencia$Clases, main = "Frecuencia de nombres. Top 5")

grafica pastel

pie(x = tabla.frecuencia$`Frecuencia de clase`, labels = tabla.frecuencia$Clases)

Interpretación del caso

Contestar de manera descriptiva cada una de las siguientes preguntas:

¿Cual es el nombre de personas que más se repite y su frecuencia de clase?

yahira con frecuencia de clase 7 # ¿Cuál es el nombre de persona que menos se repite y su frecuencia de clase? emmanuel con 1 sola frecuencia de clase # ¿Cuáles son las frecuencias relativas de cada nombres de persona? datos aaron alan alejandro ana angel antonio aurora 0.03 0.03 0.03 0.02 0.03 0.05 0.04 benito berenice beto brenda claudia emilio emmanuel 0.06 0.04 0.03 0.06 0.06 0.03 0.01 fernando jaime jarod jenny leslie miguel montse 0.02 0.02 0.05 0.03 0.01 0.04 0.03 pedro rosa salvdor samantha victor yahira zayra 0.02 0.04 0.04 0.05 0.03 0.07 0.03 # ¿Cuales son los procentajes de nombres de personas más y menos ? datos aaron alan alejandro ana angel antonio aurora 3 3 3 2 3 5 4 benito berenice beto brenda claudia emilio emmanuel 6 4 3 6 6 3 1 fernando jaime jarod jenny leslie miguel montse 2 2 5 3 1 4 3 pedro rosa salvdor samantha victor yahira zayra 2 4 4 5 3 7 3 # ¿Que representa la tabla de distribución de frecuencias, la gráfica de barra y gráfica de pastel? los nombres con mayor clase

Aspectos generales del caso:

¿qué aprendizajes se obtuvieron?,

como ordenar una tbala basado en sus clases y aprender y usar mejor Rstudio # ¿qué deja el caso?, aprendizaje y conocimientos basicos que debemos manejar y saber las frecuencias de cada uno de los caos # ¿qué habilidades se desarrollan?, analisis saber como manejar los casos con cada dato que nos den # ¿qué formación se obtiene? estadistica y de programacion en Rstudio

Referencias bibliográficas

Anderson, D., Sweeney, D., & Williams, T. (2008). Estadística para administración y economía Estadística para administración y economía. 10a. Edición. México, D.F: Cengage Learning Editores,S.A. de C.V.

Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introducción a la probabilidad y estadística. México, D.F.: Cengage Learning Editores, S.A. de C.V.

Walpole, R., Myers, R. H., Myers, S. L., & Ye, K. (2007). Probabilidad y estadística para Ingeniería y Ciencias. Octava Edición (Octava Edición ed.). México: Prentice Hill. Pearson Educación.

Walpole, R., Myers, R., Myers, S., & Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición ed.). Cd. México: Pearson.