Primero Importar el archivo de excel peso.xlsx a R studio

Descarguen el archivo desde aca

https://www.dropbox.com/s/q4z76hj96r35i7q/peso.xlsx?dl=0

Guardenlo en la computadora e importenlo como lo indica el video

Recuerden las fórmulas para construir los intervalos

1 Amplitud muestral: se obtiene a partir de los límites reales de la muestra

\(\Delta\)m = Xmax-Xmin

2 Cálculo del número de intervalos

k = 1 + 3,3 . log (n)

3 Longitud de los intervalos de clases

\(\Delta\)x = \(\Delta\)m/ k

Teniendo en cuenta lo obtenido en el documento sabemos que: \(\Delta\)m = 230.29 g – 112.07 g = 118.22 g
k = 1 + 3,3 . log (80) = 7.28.
Como el número de intervalos es un entero, redondeamos, así k =8. (Siempre es aconsejable que este número sea impar, porque la existencia de un intervalo central facilita, como veremos más adelante, los cálculos posteriores) Si n no es muy grande podemos disminuir el número de intervalos; en nuestro ejemplo trabajaremos con 7 intervalos
\(\Delta\)x = 118.22 g / 7 = 16.89 g luego por redondeo \(\Delta\)x = 17 g

Procedo a construir la tabla de frecuencias

Muestra los límites inferiores y superiores de los intervalos de clase teniendo en cuenta la amplitud de los mismos.
bins<-seq(112, 231, by=17)
bins
## [1] 112 129 146 163 180 197 214 231
Muestra los intervalos de clase obtenidos.
Intervalos <-cut(peso$gramos, bins)
table(Intervalos)
## Intervalos
## (112,129] (129,146] (146,163] (163,180] (180,197] (197,214] (214,231] 
##         8        17        12        17         8         1        17
transform(table(Intervalos))
##   Intervalos Freq
## 1  (112,129]    8
## 2  (129,146]   17
## 3  (146,163]   12
## 4  (163,180]   17
## 5  (180,197]    8
## 6  (197,214]    1
## 7  (214,231]   17
transform(table(Intervalos), Frec.rel =prop.table(Freq), Frec.acum=cumsum(Freq), Frec.rel.acum
= cumsum(Frec.rel=prop.table(Freq)))
##   Intervalos Freq Frec.rel Frec.acum Frec.rel.acum
## 1  (112,129]    8   0.1000         8        0.1000
## 2  (129,146]   17   0.2125        25        0.3125
## 3  (146,163]   12   0.1500        37        0.4625
## 4  (163,180]   17   0.2125        54        0.6750
## 5  (180,197]    8   0.1000        62        0.7750
## 6  (197,214]    1   0.0125        63        0.7875
## 7  (214,231]   17   0.2125        80        1.0000
hist(peso$gramos)

R por defecto determina el número de intervalos de clases. Si deseamos trabajar con determinada cantidad de intervalos de clases, en base a los cálculos que realizamos por fórmula, realizamos lo siguiente:

hist(peso$gramos, breaks=bins, main="Peso de los racimos Malbec",xlab="Peso de los racimos, en
gramos", ylab="Frecuencia",xlim=c(100,240),ylim=c(0,20))

Diagrama de cajas y bigotes

boxplot(peso$gramos)

A continuación se muestra una explicación de el diagrama de cajas y bigotes o boxplot

Procederemos a calcular las distintas medidas descriptivas

Medidas de tendencia central

Cálculo de la media muestral

media<-mean(peso$gramos)
media
## [1] 170.5083

Muestra el valor de la mediana la variable.

mediana<-median(peso$gramos)
mediana
## [1] 166.13

Medidas de posición no central

Cuartiles

Para mostrar el resultado del primer cuartil

q1<-quantile(peso$gramos,.25)
q1
##    25% 
## 144.66

Para mostrar el resultado del segundo cuartil

q2<-quantile(peso$gramos,.50)
q2
##    50% 
## 166.13

Para mostrar el resultado del tercer cuartil

q3<-quantile(peso$gramos,.75)
q3
##      75% 
## 193.9675

Medidas de dispersión

Varianza muestral

varianza<-var(peso$gramos)
varianza
## [1] 1171.514

Desvío estándar

desvioestandar<-sd(peso$gramos)
desvioestandar
## [1] 34.22738

Coeficiente de variación

cv<-desvioestandar/media
cv
## [1] 0.2007374

También puedo utilizar la siguiente función para tener un resumen de los parámetros más importantes de una variable

summary(peso$gramos)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   112.1   144.7   166.1   170.5   194.0   230.3