Determinar tablas de frecuencias con datos alumnos PyE14
Alumnos inscritos en periodo Septiembre 2020- Enero 2021 en escuela de educación superior.
Analizar un conjunto de datos académicos de alumnos para determinar tablas de frecuencias que permitan interpretar acontecimientos de la vida escolar de estudiantes de una Institución de educación superior.
Una distribución de frecuencia es un resumen tabular de datos que muestra el número (frecuencia) de elementos en cada una de las diferentes clases disyuntas (que no se sobreponen). Anderson, D., Sweeney, D., & Williams, T. (2008).
Las tablas de frecuencia usualmente tienen dos columnas; una de ellas, la primera,muestra todos los posibles valores que asume la variable y la segunda, para cada valor de la variable muestra el número de veces que se presenta dicho valor, en el contexto en el que se está trabajando; tal número se denomina frecuencia.
Se puede tener tablas de atributos, de variables discretas y de variables continuas. De acuerdo a la forma como se organizan las frecuencias se tiene: tablas de frecuencias absolutas, de frecuencias relativas, de frecuencias porcentuales, de frecuencias acumuladas absolutas, de frecuencias acumuladas relativas y de frecuencias acumuladas porcentuales. (Sarmiento & Fernández, 2013, p. 42).
Frecuencia o Frecuencia Absoluta: Es el número de veces que se presenta un determinado dato de un carácter en los diferentes elementos de una población o la muestra. Se representa por \(ni\). Es el número de repeticiones de un determinado valor de la variable o una modalidad del atributo. La frecuencia absoluta también representa el número de elementos de la muestra que tiene el mismo valor o modalidad. La suma total de todas las frecuencias absolutas es el tamaño de la muestra de elementos observados y se representa por \(N\). (Cordero, Córdoba & Fernández, 2002, p. 48)
\[fi = {ni}\]
Frecuencia Relativa:
La frecuencia relativa de una clase es igual a la parte o proporción de los elementos que pertenecen a cada clase Anderson, D., Sweeney, D., & Williams, T. (2008).. Se obtiene dividiendo la frecuencia absoluta de un determinado valor o categoria de la variable entre la suma de las frecuencias absolutas de todos los valores observados, es decir, entre el tamaño de la muestra. Por tanto, la frecuencia relativa es una porción entre el número de veces que se repite un dato y el tamaño de la población y/o muestra. (Cordero, Córdoba & Fernández, 2002, p. 48).
En un conjunto de datos, en el que hay N observaciones, la frecuencia relativa de cada clase se determina:
\[fr = fi/N\]
Frecuencia Porcentual:
La frecuencia porcentual de una clase es la frecuencia relativa multiplicada por 100.Anderson, D., Sweeney, D., & Williams, T. (2008).
Es otra forma de presentar las frecuencias relativas, las cuales muestran una porción de la unidad, mientras que la frecuencia porcentual muestra qué tanto porciento de la muestra presenta un determiando valor (o categoría de la variable). “las frecuencias relativas se suelen presentar en porcentajes \(%fr\) que se obtienen al multiplicar por 100 el valor correspondiente de \(fr\). En este caso, la suma total de todas las frecuencias relativas porcentuales será 100 Cordero, Córdoba y Fernández (2002)
\[fp = {fr \cdot 100}\]
Una gráfica de barras o un diagrama de barras, es una gráfica para representar los datos cualitativos de una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual. En uno de los ejes de la gráfica (por lo general en el horizontal), se especifican las etiquetas empleadas para las clases (categorías). Para el otro eje de la gráfica (el vertical) se usa una escala para frecuencia, frecuencia relativa o frecuencia porcentual.Anderson, D., Sweeney, D., & Williams, T. (2008).
Una presentación gráfica usual para datos cuantitativos es el histograma. Esta gráfica se hace con datos previamente resumidos mediante una distribución de frecuencia, de frecuencia relativa o de frecuencia porcentual. Un histograma se construye colocando la variable de interés en el eje horizontal y la frecuencia, la frecuencia relativa o la frecuencia porcentual en el eje vertical. La frecuencia, frecuencia relativa o frecuencia porcentual de cada clase se indica dibujando un rectángulo cuya base está determinada por los límites de clase sobre el eje horizontal y cuya altura es la frecuencia, la frecuencia relativa o la frecuencia porcentual correspondiente. Anderson, D., Sweeney, D., & Williams, T. (2008).
library(readr) # Cargar datos csv
library(fdth) # Tablas de frecuencias
alumnos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/datos/promedios%20alumnos/datos%20alumnos%20promedios%20SEP%202020.csv")
head(alumnos) # Los primeros seis registros
## No..Control Alumno Semestre Cr..Apr. Carga Promedio Carrera
## 1 20190001 1 11 198 19 80.21 SISTEMAS
## 2 20190002 2 11 235 10 84.33 SISTEMAS
## 3 20190003 3 9 235 10 95.25 SISTEMAS
## 4 20190004 4 9 226 19 95.00 SISTEMAS
## 5 20190005 5 10 231 14 82.32 SISTEMAS
## 6 20190006 6 9 212 23 95.02 SISTEMAS
primer_semestre <- subset(alumnos, Semestre == 1)
tabla.frecuencia <- fdt_cat(primer_semestre$Carrera)
tabla.frecuencia
## Category f rf rf(%) cf cf(%)
## ARQUITECTURA 128 0.12 12.42 128 12.42
## GESTION EMPRESARIAL 89 0.09 8.63 217 21.05
## QUIMICA 89 0.09 8.63 306 29.68
## INDUSTRIAL 88 0.09 8.54 394 38.22
## CIVIL 86 0.08 8.34 480 46.56
## BIOQUIMICA 84 0.08 8.15 564 54.70
## ADMINISTRACION 83 0.08 8.05 647 62.75
## SISTEMAS 78 0.08 7.57 725 70.32
## ELECTRICA 77 0.07 7.47 802 77.79
## MECANICA 76 0.07 7.37 878 85.16
## MECATRONICA 70 0.07 6.79 948 91.95
## ELECTRONICA 36 0.03 3.49 984 95.44
## INFORMATICA 30 0.03 2.91 1014 98.35
## TIC 17 0.02 1.65 1031 100.00
barplot(height = tabla.frecuencia$f,
names.arg = tabla.frecuencia$Category,
main = "Frecuencia de Alumnos de Primer Semestre")
tabla.frecuencia.todos <- fdt_cat(alumnos$Carrera)
tabla.frecuencia.todos
## Category f rf rf(%) cf cf(%)
## INDUSTRIAL 707 0.12 11.92 707 11.92
## ARQUITECTURA 675 0.11 11.38 1382 23.31
## CIVIL 648 0.11 10.93 2030 34.24
## GESTION EMPRESARIAL 585 0.10 9.87 2615 44.11
## QUIMICA 568 0.10 9.58 3183 53.69
## ADMINISTRACION 497 0.08 8.38 3680 62.07
## SISTEMAS 452 0.08 7.62 4132 69.69
## BIOQUIMICA 441 0.07 7.44 4573 77.13
## MECATRONICA 432 0.07 7.29 5005 84.42
## MECANICA 301 0.05 5.08 5306 89.49
## ELECTRICA 280 0.05 4.72 5586 94.21
## ELECTRONICA 161 0.03 2.72 5747 96.93
## INFORMATICA 101 0.02 1.70 5848 98.63
## TIC 81 0.01 1.37 5929 100.00
barplot(height = tabla.frecuencia.todos$f,
names.arg = tabla.frecuencia.todos$Category,
main = "Frecuencia de Alumnos inscritos por Carrera")
SISTEMAS <- subset(alumnos, Carrera == "SISTEMAS")
# cATEGORIZAR AL SEMESTRE, No hay operaciones artiméticas con Semestre
SISTEMAS$Semestre <- factor(SISTEMAS$Semestre)
tabla_frecuencia.SIS <- fdt_cat(SISTEMAS$Semestre)
tabla_frecuencia.SIS
## Category f rf rf(%) cf cf(%)
## 1 78 0.17 17.26 78 17.26
## 3 64 0.14 14.16 142 31.42
## 7 58 0.13 12.83 200 44.25
## 5 51 0.11 11.28 251 55.53
## 8 46 0.10 10.18 297 65.71
## 4 38 0.08 8.41 335 74.12
## 9 35 0.08 7.74 370 81.86
## 2 29 0.06 6.42 399 88.27
## 10 15 0.03 3.32 414 91.59
## 11 15 0.03 3.32 429 94.91
## 6 14 0.03 3.10 443 98.01
## 13 5 0.01 1.11 448 99.12
## 12 4 0.01 0.88 452 100.00
barplot(height = tabla_frecuencia.SIS$f,
names.arg = tabla_frecuencia.SIS$Category,
main = "Frecuencia de Alumnos SISTEMAS por Semestre")
CIVIL <- subset(alumnos, Carrera == "CIVIL")
# CATEGORIZAR AL SEMESTRE, No hay operaciones artiméticas con Semestre
CIVIL$Semestre <- factor(CIVIL$Semestre)
tabla_frecuencia.CIVIL <- fdt_cat(CIVIL$Semestre)
tabla_frecuencia.CIVIL
## Category f rf rf(%) cf cf(%)
## 1 86 0.13 13.27 86 13.27
## 2 74 0.11 11.42 160 24.69
## 6 72 0.11 11.11 232 35.80
## 5 71 0.11 10.96 303 46.76
## 3 66 0.10 10.19 369 56.94
## 4 66 0.10 10.19 435 67.13
## 7 58 0.09 8.95 493 76.08
## 8 57 0.09 8.80 550 84.88
## 9 44 0.07 6.79 594 91.67
## 10 30 0.05 4.63 624 96.30
## 12 15 0.02 2.31 639 98.61
## 11 8 0.01 1.23 647 99.85
## 15 1 0.00 0.15 648 100.00
barplot(height = tabla_frecuencia.CIVIL$f,
names.arg = tabla_frecuencia.CIVIL$Category,
main = "Frecuencia de Alumnos CIVIL por Semestre")
Describir el caso de 80 a 100 palabras Claras, en secuencia y lo que ustedes describan acerca del caso