Descarguen el archivo desde aca
https://www.dropbox.com/s/q4z76hj96r35i7q/peso.xlsx?dl=0
Guardenlo en la computadora e importenlo como lo indica el video
Recuerden las fórmulas para construir los intervalos
\(\Delta\)m = Xmax-Xmin
k = 1 + 3,3 . log (n)
\(\Delta\)x = \(\Delta\)m/ k
Teniendo en cuenta lo obtenido en el documento sabemos que: \(\Delta\)m = 230.29 g – 112.07 g = 118.22 g
k = 1 + 3,3 . log (80) = 7.28.
Como el número de intervalos es un entero, redondeamos, así k =8. (Siempre es aconsejable que este número sea impar, porque la existencia de un intervalo central facilita, como veremos más adelante, los cálculos posteriores) Si n no es muy grande podemos disminuir el número de intervalos; en nuestro ejemplo trabajaremos con 7 intervalos
\(\Delta\)x = 118.22 g / 7 = 16.89 g luego por redondeo \(\Delta\)x = 17 g
bins<-seq(112, 231, by=17)
bins
## [1] 112 129 146 163 180 197 214 231
Intervalos <-cut(peso$gramos, bins)
table(Intervalos)
## Intervalos
## (112,129] (129,146] (146,163] (163,180] (180,197] (197,214] (214,231]
## 8 17 12 17 8 1 17
transform(table(Intervalos))
## Intervalos Freq
## 1 (112,129] 8
## 2 (129,146] 17
## 3 (146,163] 12
## 4 (163,180] 17
## 5 (180,197] 8
## 6 (197,214] 1
## 7 (214,231] 17
transform(table(Intervalos), Frec.rel =prop.table(Freq), Frec.acum=cumsum(Freq), Frec.rel.acum
= cumsum(Frec.rel=prop.table(Freq)))
## Intervalos Freq Frec.rel Frec.acum Frec.rel.acum
## 1 (112,129] 8 0.1000 8 0.1000
## 2 (129,146] 17 0.2125 25 0.3125
## 3 (146,163] 12 0.1500 37 0.4625
## 4 (163,180] 17 0.2125 54 0.6750
## 5 (180,197] 8 0.1000 62 0.7750
## 6 (197,214] 1 0.0125 63 0.7875
## 7 (214,231] 17 0.2125 80 1.0000
hist(peso$gramos)
R por defecto determina el número de intervalos de clases. Si deseamos trabajar con determinada cantidad de intervalos de clases, en base a los cálculos que realizamos por fórmula, realizamos lo siguiente:
hist(peso$gramos, breaks=bins, main="Peso de los racimos Malbec",xlab="Peso de los racimos, en
gramos", ylab="Frecuencia",xlim=c(100,240),ylim=c(0,20))
boxplot(peso$gramos)
A continuación se muestra una explicación de el diagrama de cajas y bigotes o boxplot
Procederemos a calcular las distintas medidas descriptivas
media<-mean(peso$gramos)
media
## [1] 170.5083
mediana<-median(peso$gramos)
mediana
## [1] 166.13
Para mostrar el resultado del primer cuartil
q1<-quantile(peso$gramos,.25)
q1
## 25%
## 144.66
Para mostrar el resultado del segundo cuartil
q2<-quantile(peso$gramos,.50)
q2
## 50%
## 166.13
Para mostrar el resultado del tercer cuartil
q3<-quantile(peso$gramos,.75)
q3
## 75%
## 193.9675
varianza<-var(peso$gramos)
varianza
## [1] 1171.514
desvioestandar<-sd(peso$gramos)
desvioestandar
## [1] 34.22738
cv<-desvioestandar/media
cv
## [1] 0.2007374
También puedo utilizar la siguiente función para tener un resumen de los parámetros más importantes de una variable
summary(peso$gramos)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 112.1 144.7 166.1 170.5 194.0 230.3