linkCSV="https://docs.google.com/spreadsheets/d/e/2PACX-1vQjaIOfcqt963uYbmuShDtt5bBcXTUdL33NA1cItQfH2vZICi5S6QtfJjILY1uxYSJf2GUSzduA0iZZ/pub?gid=1795242876&single=true&output=csv"
Alumnos=read.csv(linkCSV, stringsAsFactors = F, na.strings = '')
names(Alumnos)
## [1] "ID" "SEX" "RACE" "SES" "SCTYP" "LOCUS" "CONCPT"
## [8] "MOT" "RDG" "WRTG" "MATH" "SCI" "CIV"
Sirve para identificar variables ordinales (num) y variables nominales (chr)
str(Alumnos)
## 'data.frame': 600 obs. of 13 variables:
## $ ID : int 1 2 3 4 5 6 7 8 9 10 ...
## $ SEX : chr "HOMBRE" "MUJER" "HOMBRE" "HOMBRE" ...
## $ RACE : chr "ASIATICO" "ASIATICO" "ASIATICO" "ASIATICO" ...
## $ SES : chr "ALTO" "ALTO" "ALTO" "MEDIO" ...
## $ SCTYP : chr "PUBLICA" "PUBLICA" "PUBLICA" "PUBLICA" ...
## $ LOCUS : num 0.29 -0.42 0.71 0.06 0.22 0.46 0.44 0.68 0.06 0.05 ...
## $ CONCPT: num 0.88 0.03 0.03 0.03 -0.28 0.03 -0.47 0.25 0.56 0.15 ...
## $ MOT : num 0.67 0.33 0.67 0 0 0 0.33 1 0.33 1 ...
## $ RDG : num 33.6 46.9 41.6 38.9 36.3 49.5 62.7 44.2 46.9 44.2 ...
## $ WRTG : num 43.7 35.9 59.3 41.1 48.9 46.3 64.5 51.5 41.1 49.5 ...
## $ MATH : num 40.2 41.9 41.9 32.7 39.5 46.2 48 36.9 45.3 40.5 ...
## $ SCI : num 39 36.3 44.4 41.7 41.7 41.7 63.4 49.8 47.1 39 ...
## $ CIV : num 40.6 45.6 45.6 40.6 45.6 35.6 55.6 55.6 55.6 50.6 ...
summary(Alumnos)
## ID SEX RACE SES
## Min. : 1.0 Length:600 Length:600 Length:600
## 1st Qu.:150.8 Class :character Class :character Class :character
## Median :300.5 Mode :character Mode :character Mode :character
## Mean :300.5
## 3rd Qu.:450.2
## Max. :600.0
## SCTYP LOCUS CONCPT
## Length:600 Min. :-2.23000 Min. :-2.620000
## Class :character 1st Qu.:-0.37250 1st Qu.:-0.300000
## Mode :character Median : 0.21000 Median : 0.030000
## Mean : 0.09653 Mean : 0.004917
## 3rd Qu.: 0.51000 3rd Qu.: 0.440000
## Max. : 1.36000 Max. : 1.190000
## MOT RDG WRTG MATH
## Min. :0.0000 Min. :28.3 Min. :25.50 Min. :31.80
## 1st Qu.:0.3300 1st Qu.:44.2 1st Qu.:44.30 1st Qu.:44.50
## Median :0.6700 Median :52.1 Median :54.10 Median :51.30
## Mean :0.6608 Mean :51.9 Mean :52.38 Mean :51.85
## 3rd Qu.:1.0000 3rd Qu.:60.1 3rd Qu.:59.90 3rd Qu.:58.38
## Max. :1.0000 Max. :76.0 Max. :67.10 Max. :75.50
## SCI CIV
## Min. :26.00 Min. :25.70
## 1st Qu.:44.40 1st Qu.:45.60
## Median :52.60 Median :50.60
## Mean :51.76 Mean :52.05
## 3rd Qu.:58.65 3rd Qu.:60.50
## Max. :74.20 Max. :70.50
table(Alumnos$SES)
##
## ALTO BAJO MEDIO
## 139 162 299
library(questionr)
library(magrittr)
DataSES=freq(Alumnos$SES,total = F,sort = 'dec',exclude = c(NA)) %>% data.frame()
DataSES=data.frame(variable=row.names(DataSES),DataSES,row.names = NULL)
DataSES
## variable n X.
## 1 MEDIO 299 49.8
## 2 BAJO 162 27.0
## 3 ALTO 139 23.2
library(ggplot2)
base = ggplot(data = DataSES,aes(x=variable,y=n))
barSES = base + geom_bar(stat = 'identity')
barSES
* Gráfico según orden de la tabla
barSES = barSES + scale_x_discrete(limits = DataSES$variable)
barSES
text1="¿Qué SES es más común entre los estudiantes?"
text2="Condición económico-social (SES)"
text3="Estudiantes"
text4="Fuente:National Center for Education Statistcs"
barSES2 = barSES + labs(title = text1,
x = text2,
y = text3,
caption = text4)
barSES2
barSES2 + theme_classic() +
theme(plot.title = element_text(hjust = 0.5,size=15), # centrar y agrandar
plot.caption = element_text(hjust = 0), # a la derecha
axis.text.x = element_text(angle=45,hjust = 1)) # angulo
Se realiza en función del 80% de consecuencias causadas por el 20% de los problemas. Muestra dos medidas, los conteos y los porcentajes acumulados.
library(qcc)
## Package 'qcc' version 2.7
## Type 'citation("qcc")' for citing this R package in publications.
pareto.chart(table(Alumnos$SES),cumperc = c(0,50,80,100))
##
## Pareto chart analysis for table(Alumnos$SES)
## Frequency Cum.Freq. Percentage Cum.Percent.
## MEDIO 299.00000 299.00000 49.83333 49.83333
## BAJO 162.00000 461.00000 27.00000 76.83333
## ALTO 139.00000 600.00000 23.16667 100.00000
library(DescTools)
Mode(Alumnos$SES)
## [1] "MEDIO"
dataTable=table(Alumnos$SES)
Herfindahl(dataTable)
## [1] 0.3749056
# * < 0.01 : indica que la moda no es significativa, las categorias tienen pesos similares.
# * < 0.15 : indica que la moda no es significativa, varias categorias tienen pesos similares.
# * entre 0.15 - 0.3: hay una moda.
# * > 0.3: La moda se diferencia de los demas
1/sum(prop.table(dataTable)**2)
## [1] 2.667338
table(Alumnos$LOCUS)
##
## -2.23 -1.99 -1.81 -1.78 -1.76 -1.74 -1.58 -1.57 -1.56 -1.55 -1.5 -1.34
## 2 1 1 2 1 1 2 1 1 1 1 1
## -1.33 -1.3 -1.28 -1.15 -1.14 -1.13 -1.1 -1.09 -1.06 -1.05 -1.02 -0.93
## 9 2 3 2 1 1 3 3 1 3 1 3
## -0.91 -0.9 -0.89 -0.88 -0.86 -0.84 -0.83 -0.82 -0.8 -0.71 -0.69 -0.68
## 1 2 4 1 2 7 3 2 1 1 1 3
## -0.67 -0.66 -0.65 -0.64 -0.63 -0.61 -0.6 -0.59 -0.54 -0.51 -0.49 -0.47
## 1 3 2 2 1 3 9 3 1 1 2 2
## -0.45 -0.44 -0.43 -0.42 -0.41 -0.4 -0.39 -0.38 -0.37 -0.36 -0.35 -0.34
## 3 10 3 2 3 14 2 8 2 1 1 1
## -0.33 -0.27 -0.24 -0.23 -0.22 -0.21 -0.2 -0.19 -0.18 -0.17 -0.16 -0.14
## 1 2 2 2 3 3 1 7 4 3 7 7
## -0.11 -0.04 -0.03 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08
## 1 2 3 15 1 9 4 2 3 41 1 5
## 0.09 0.1 0.11 0.2 0.21 0.22 0.23 0.24 0.25 0.26 0.27 0.28
## 1 7 1 6 2 9 9 2 5 12 6 7
## 0.29 0.3 0.31 0.32 0.33 0.42 0.43 0.44 0.45 0.46 0.47 0.48
## 3 5 4 7 2 2 3 5 7 41 5 7
## 0.49 0.5 0.51 0.52 0.53 0.55 0.57 0.65 0.66 0.67 0.68 0.69
## 4 2 3 8 1 5 1 1 9 2 18 3
## 0.7 0.71 0.73 0.75 0.87 0.89 0.91 0.93 0.94 0.96 1.11 1.12
## 3 17 3 6 1 6 12 4 2 4 6 1
## 1.13 1.14 1.16 1.36
## 10 2 11 13
DataLocus=freq(Alumnos$LOCUS,total = F,exclude = c(NA)) %>% data.frame()
DataLocus=data.frame(variable=row.names(DataLocus),DataLocus,row.names = NULL)
DataLocus
## variable n X.
## 1 -2.23 2 0.3
## 2 -1.99 1 0.2
## 3 -1.81 1 0.2
## 4 -1.78 2 0.3
## 5 -1.76 1 0.2
## 6 -1.74 1 0.2
## 7 -1.58 2 0.3
## 8 -1.57 1 0.2
## 9 -1.56 1 0.2
## 10 -1.55 1 0.2
## 11 -1.5 1 0.2
## 12 -1.34 1 0.2
## 13 -1.33 9 1.5
## 14 -1.3 2 0.3
## 15 -1.28 3 0.5
## 16 -1.15 2 0.3
## 17 -1.14 1 0.2
## 18 -1.13 1 0.2
## 19 -1.1 3 0.5
## 20 -1.09 3 0.5
## 21 -1.06 1 0.2
## 22 -1.05 3 0.5
## 23 -1.02 1 0.2
## 24 -0.93 3 0.5
## 25 -0.91 1 0.2
## 26 -0.9 2 0.3
## 27 -0.89 4 0.7
## 28 -0.88 1 0.2
## 29 -0.86 2 0.3
## 30 -0.84 7 1.2
## 31 -0.83 3 0.5
## 32 -0.82 2 0.3
## 33 -0.8 1 0.2
## 34 -0.71 1 0.2
## 35 -0.69 1 0.2
## 36 -0.68 3 0.5
## 37 -0.67 1 0.2
## 38 -0.66 3 0.5
## 39 -0.65 2 0.3
## 40 -0.64 2 0.3
## 41 -0.63 1 0.2
## 42 -0.61 3 0.5
## 43 -0.6 9 1.5
## 44 -0.59 3 0.5
## 45 -0.54 1 0.2
## 46 -0.51 1 0.2
## 47 -0.49 2 0.3
## 48 -0.47 2 0.3
## 49 -0.45 3 0.5
## 50 -0.44 10 1.7
## 51 -0.43 3 0.5
## 52 -0.42 2 0.3
## 53 -0.41 3 0.5
## 54 -0.4 14 2.3
## 55 -0.39 2 0.3
## 56 -0.38 8 1.3
## 57 -0.37 2 0.3
## 58 -0.36 1 0.2
## 59 -0.35 1 0.2
## 60 -0.34 1 0.2
## 61 -0.33 1 0.2
## 62 -0.27 2 0.3
## 63 -0.24 2 0.3
## 64 -0.23 2 0.3
## 65 -0.22 3 0.5
## 66 -0.21 3 0.5
## 67 -0.2 1 0.2
## 68 -0.19 7 1.2
## 69 -0.18 4 0.7
## 70 -0.17 3 0.5
## 71 -0.16 7 1.2
## 72 -0.14 7 1.2
## 73 -0.11 1 0.2
## 74 -0.04 2 0.3
## 75 -0.03 3 0.5
## 76 0 15 2.5
## 77 0.01 1 0.2
## 78 0.02 9 1.5
## 79 0.03 4 0.7
## 80 0.04 2 0.3
## 81 0.05 3 0.5
## 82 0.06 41 6.8
## 83 0.07 1 0.2
## 84 0.08 5 0.8
## 85 0.09 1 0.2
## 86 0.1 7 1.2
## 87 0.11 1 0.2
## 88 0.2 6 1.0
## 89 0.21 2 0.3
## 90 0.22 9 1.5
## 91 0.23 9 1.5
## 92 0.24 2 0.3
## 93 0.25 5 0.8
## 94 0.26 12 2.0
## 95 0.27 6 1.0
## 96 0.28 7 1.2
## 97 0.29 3 0.5
## 98 0.3 5 0.8
## 99 0.31 4 0.7
## 100 0.32 7 1.2
## 101 0.33 2 0.3
## 102 0.42 2 0.3
## 103 0.43 3 0.5
## 104 0.44 5 0.8
## 105 0.45 7 1.2
## 106 0.46 41 6.8
## 107 0.47 5 0.8
## 108 0.48 7 1.2
## 109 0.49 4 0.7
## 110 0.5 2 0.3
## 111 0.51 3 0.5
## 112 0.52 8 1.3
## 113 0.53 1 0.2
## 114 0.55 5 0.8
## 115 0.57 1 0.2
## 116 0.65 1 0.2
## 117 0.66 9 1.5
## 118 0.67 2 0.3
## 119 0.68 18 3.0
## 120 0.69 3 0.5
## 121 0.7 3 0.5
## 122 0.71 17 2.8
## 123 0.73 3 0.5
## 124 0.75 6 1.0
## 125 0.87 1 0.2
## 126 0.89 6 1.0
## 127 0.91 12 2.0
## 128 0.93 4 0.7
## 129 0.94 2 0.3
## 130 0.96 4 0.7
## 131 1.11 6 1.0
## 132 1.12 1 0.2
## 133 1.13 10 1.7
## 134 1.14 2 0.3
## 135 1.16 11 1.8
## 136 1.36 13 2.2
base=ggplot(data = DataLocus, aes(x=variable, y=n))
barLOCUS= base + geom_bar(stat = 'identity')
barLOCUS
pareto.chart(table(Alumnos$LOCUS),cumperc = c(0,50,80,100))
##
## Pareto chart analysis for table(Alumnos$LOCUS)
## Frequency Cum.Freq. Percentage Cum.Percent.
## 0.06 41.0000000 41.0000000 6.8333333 6.8333333
## 0.46 41.0000000 82.0000000 6.8333333 13.6666667
## 0.68 18.0000000 100.0000000 3.0000000 16.6666667
## 0.71 17.0000000 117.0000000 2.8333333 19.5000000
## 0 15.0000000 132.0000000 2.5000000 22.0000000
## -0.4 14.0000000 146.0000000 2.3333333 24.3333333
## 1.36 13.0000000 159.0000000 2.1666667 26.5000000
## 0.26 12.0000000 171.0000000 2.0000000 28.5000000
## 0.91 12.0000000 183.0000000 2.0000000 30.5000000
## 1.16 11.0000000 194.0000000 1.8333333 32.3333333
## -0.44 10.0000000 204.0000000 1.6666667 34.0000000
## 1.13 10.0000000 214.0000000 1.6666667 35.6666667
## -1.33 9.0000000 223.0000000 1.5000000 37.1666667
## -0.6 9.0000000 232.0000000 1.5000000 38.6666667
## 0.02 9.0000000 241.0000000 1.5000000 40.1666667
## 0.22 9.0000000 250.0000000 1.5000000 41.6666667
## 0.23 9.0000000 259.0000000 1.5000000 43.1666667
## 0.66 9.0000000 268.0000000 1.5000000 44.6666667
## -0.38 8.0000000 276.0000000 1.3333333 46.0000000
## 0.52 8.0000000 284.0000000 1.3333333 47.3333333
## -0.84 7.0000000 291.0000000 1.1666667 48.5000000
## -0.19 7.0000000 298.0000000 1.1666667 49.6666667
## -0.16 7.0000000 305.0000000 1.1666667 50.8333333
## -0.14 7.0000000 312.0000000 1.1666667 52.0000000
## 0.1 7.0000000 319.0000000 1.1666667 53.1666667
## 0.28 7.0000000 326.0000000 1.1666667 54.3333333
## 0.32 7.0000000 333.0000000 1.1666667 55.5000000
## 0.45 7.0000000 340.0000000 1.1666667 56.6666667
## 0.48 7.0000000 347.0000000 1.1666667 57.8333333
## 0.2 6.0000000 353.0000000 1.0000000 58.8333333
## 0.27 6.0000000 359.0000000 1.0000000 59.8333333
## 0.75 6.0000000 365.0000000 1.0000000 60.8333333
## 0.89 6.0000000 371.0000000 1.0000000 61.8333333
## 1.11 6.0000000 377.0000000 1.0000000 62.8333333
## 0.08 5.0000000 382.0000000 0.8333333 63.6666667
## 0.25 5.0000000 387.0000000 0.8333333 64.5000000
## 0.3 5.0000000 392.0000000 0.8333333 65.3333333
## 0.44 5.0000000 397.0000000 0.8333333 66.1666667
## 0.47 5.0000000 402.0000000 0.8333333 67.0000000
## 0.55 5.0000000 407.0000000 0.8333333 67.8333333
## -0.89 4.0000000 411.0000000 0.6666667 68.5000000
## -0.18 4.0000000 415.0000000 0.6666667 69.1666667
## 0.03 4.0000000 419.0000000 0.6666667 69.8333333
## 0.31 4.0000000 423.0000000 0.6666667 70.5000000
## 0.49 4.0000000 427.0000000 0.6666667 71.1666667
## 0.93 4.0000000 431.0000000 0.6666667 71.8333333
## 0.96 4.0000000 435.0000000 0.6666667 72.5000000
## -1.28 3.0000000 438.0000000 0.5000000 73.0000000
## -1.1 3.0000000 441.0000000 0.5000000 73.5000000
## -1.09 3.0000000 444.0000000 0.5000000 74.0000000
## -1.05 3.0000000 447.0000000 0.5000000 74.5000000
## -0.93 3.0000000 450.0000000 0.5000000 75.0000000
## -0.83 3.0000000 453.0000000 0.5000000 75.5000000
## -0.68 3.0000000 456.0000000 0.5000000 76.0000000
## -0.66 3.0000000 459.0000000 0.5000000 76.5000000
## -0.61 3.0000000 462.0000000 0.5000000 77.0000000
## -0.59 3.0000000 465.0000000 0.5000000 77.5000000
## -0.45 3.0000000 468.0000000 0.5000000 78.0000000
## -0.43 3.0000000 471.0000000 0.5000000 78.5000000
## -0.41 3.0000000 474.0000000 0.5000000 79.0000000
## -0.22 3.0000000 477.0000000 0.5000000 79.5000000
## -0.21 3.0000000 480.0000000 0.5000000 80.0000000
## -0.17 3.0000000 483.0000000 0.5000000 80.5000000
## -0.03 3.0000000 486.0000000 0.5000000 81.0000000
## 0.05 3.0000000 489.0000000 0.5000000 81.5000000
## 0.29 3.0000000 492.0000000 0.5000000 82.0000000
## 0.43 3.0000000 495.0000000 0.5000000 82.5000000
## 0.51 3.0000000 498.0000000 0.5000000 83.0000000
## 0.69 3.0000000 501.0000000 0.5000000 83.5000000
## 0.7 3.0000000 504.0000000 0.5000000 84.0000000
## 0.73 3.0000000 507.0000000 0.5000000 84.5000000
## -2.23 2.0000000 509.0000000 0.3333333 84.8333333
## -1.78 2.0000000 511.0000000 0.3333333 85.1666667
## -1.58 2.0000000 513.0000000 0.3333333 85.5000000
## -1.3 2.0000000 515.0000000 0.3333333 85.8333333
## -1.15 2.0000000 517.0000000 0.3333333 86.1666667
## -0.9 2.0000000 519.0000000 0.3333333 86.5000000
## -0.86 2.0000000 521.0000000 0.3333333 86.8333333
## -0.82 2.0000000 523.0000000 0.3333333 87.1666667
## -0.65 2.0000000 525.0000000 0.3333333 87.5000000
## -0.64 2.0000000 527.0000000 0.3333333 87.8333333
## -0.49 2.0000000 529.0000000 0.3333333 88.1666667
## -0.47 2.0000000 531.0000000 0.3333333 88.5000000
## -0.42 2.0000000 533.0000000 0.3333333 88.8333333
## -0.39 2.0000000 535.0000000 0.3333333 89.1666667
## -0.37 2.0000000 537.0000000 0.3333333 89.5000000
## -0.27 2.0000000 539.0000000 0.3333333 89.8333333
## -0.24 2.0000000 541.0000000 0.3333333 90.1666667
## -0.23 2.0000000 543.0000000 0.3333333 90.5000000
## -0.04 2.0000000 545.0000000 0.3333333 90.8333333
## 0.04 2.0000000 547.0000000 0.3333333 91.1666667
## 0.21 2.0000000 549.0000000 0.3333333 91.5000000
## 0.24 2.0000000 551.0000000 0.3333333 91.8333333
## 0.33 2.0000000 553.0000000 0.3333333 92.1666667
## 0.42 2.0000000 555.0000000 0.3333333 92.5000000
## 0.5 2.0000000 557.0000000 0.3333333 92.8333333
## 0.67 2.0000000 559.0000000 0.3333333 93.1666667
## 0.94 2.0000000 561.0000000 0.3333333 93.5000000
## 1.14 2.0000000 563.0000000 0.3333333 93.8333333
## -1.99 1.0000000 564.0000000 0.1666667 94.0000000
## -1.81 1.0000000 565.0000000 0.1666667 94.1666667
## -1.76 1.0000000 566.0000000 0.1666667 94.3333333
## -1.74 1.0000000 567.0000000 0.1666667 94.5000000
## -1.57 1.0000000 568.0000000 0.1666667 94.6666667
## -1.56 1.0000000 569.0000000 0.1666667 94.8333333
## -1.55 1.0000000 570.0000000 0.1666667 95.0000000
## -1.5 1.0000000 571.0000000 0.1666667 95.1666667
## -1.34 1.0000000 572.0000000 0.1666667 95.3333333
## -1.14 1.0000000 573.0000000 0.1666667 95.5000000
## -1.13 1.0000000 574.0000000 0.1666667 95.6666667
## -1.06 1.0000000 575.0000000 0.1666667 95.8333333
## -1.02 1.0000000 576.0000000 0.1666667 96.0000000
## -0.91 1.0000000 577.0000000 0.1666667 96.1666667
## -0.88 1.0000000 578.0000000 0.1666667 96.3333333
## -0.8 1.0000000 579.0000000 0.1666667 96.5000000
## -0.71 1.0000000 580.0000000 0.1666667 96.6666667
## -0.69 1.0000000 581.0000000 0.1666667 96.8333333
## -0.67 1.0000000 582.0000000 0.1666667 97.0000000
## -0.63 1.0000000 583.0000000 0.1666667 97.1666667
## -0.54 1.0000000 584.0000000 0.1666667 97.3333333
## -0.51 1.0000000 585.0000000 0.1666667 97.5000000
## -0.36 1.0000000 586.0000000 0.1666667 97.6666667
## -0.35 1.0000000 587.0000000 0.1666667 97.8333333
## -0.34 1.0000000 588.0000000 0.1666667 98.0000000
## -0.33 1.0000000 589.0000000 0.1666667 98.1666667
## -0.2 1.0000000 590.0000000 0.1666667 98.3333333
## -0.11 1.0000000 591.0000000 0.1666667 98.5000000
## 0.01 1.0000000 592.0000000 0.1666667 98.6666667
## 0.07 1.0000000 593.0000000 0.1666667 98.8333333
## 0.09 1.0000000 594.0000000 0.1666667 99.0000000
## 0.11 1.0000000 595.0000000 0.1666667 99.1666667
## 0.53 1.0000000 596.0000000 0.1666667 99.3333333
## 0.57 1.0000000 597.0000000 0.1666667 99.5000000
## 0.65 1.0000000 598.0000000 0.1666667 99.6666667
## 0.87 1.0000000 599.0000000 0.1666667 99.8333333
## 1.12 1.0000000 600.0000000 0.1666667 100.0000000
library(DescTools)
Mode(Alumnos$LOCUS)
## [1] 0.06 0.46
dataTable=table(Alumnos$LOCUS)
Herfindahl(dataTable)
## [1] 0.01954444
1/sum(prop.table(dataTable)**2)
## [1] 51.16543
Median(Alumnos$LOCUS)
## [1] 0.21
En la ordinal ya se puede pedir mediana. La mediana indica hasta qué valor llega el 50% de los valores que han tomado los datos.
ggplot(Alumnos,aes(y=LOCUS)) + geom_boxplot() + scale_y_discrete(limits=DataLocus$variable)