ob <- c(16.9, 17.9, 20.3, 22.7, 25.1, 27.5, 28.8, 28.3, 27.1, 24.7, 21.3, 18.3)
*El bloque de código es conocido como “chunk”, en los archivos R Markdown nos permite producir resultados de texto, tablas o gráficos, pueden ser ejecutados de forma individual, se pueden invocar con el comando “CTRL-ALT-I”. Fuente: https://bookdown.org/yihui/rmarkdown/r-code.html
*Se concatenan los datos de temperatura bajo la variable “ob” utilizando “c”.
sort(ob, decreasing = FALSE)
## [1] 16.9 17.9 18.3 20.3 21.3 22.7 24.7 25.1 27.1 27.5 28.3 28.8
“sort” es la función utilizada para arreglar los datos ya sea de manera ascendente o descendente. Fuente: https://stats.idre.ucla.edu/r/faq/how-can-i-sort-my-data-in-r/
Si la variable decreasing es igual a False entonces los datos se presentarán de forma ascendente.
sort(ob, decreasing = TRUE)
## [1] 28.8 28.3 27.5 27.1 25.1 24.7 22.7 21.3 20.3 18.3 17.9 16.9
*Histograma de frecuencia absoluta
hist(ob)
*“hist” es la función estándar para un histograma de frecuencia. Fuente: https://www.rdocumentation.org/packages/lessR/versions/4.0.2/topics/Histogram
library(fdth)
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
tabla <- fdt(ob)
tabla
## Class limits f rf rf(%) cf cf(%)
## [16.731,19.202) 3 0.25 25.00 3 25.00
## [19.202,21.674) 2 0.17 16.67 5 41.67
## [21.674,24.145) 1 0.08 8.33 6 50.00
## [24.145,26.617) 2 0.17 16.67 8 66.67
## [26.617,29.088) 4 0.33 33.33 12 100.00
*El paquete fdth se encarga de realizar tablas de distribución de frecuencia, histogramas y polígonos asociados a partir de objetos vectoriales, data.frame y matriz para variables numéricas y categóricas. Fuente: https://cran.r-project.org/web/packages/fdth/index.html
*La tabla se interpreta tal como:
*f= frecuencia absoluta
*rf= frecuencia relativa
*rf(%) frecuencia relativa porcentual
*cf= frecuencia acumulada
*cf(%)=frecuencia acumulada porcentual
*Declaramos la variable “tabla” y le asignamos la tabla de distribución de frecuencia de “ob”
plot(tabla, type = "fh")
*“fh” se refiere al histograma de frecuencia, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen.
plot(tabla, type = "fp")
*“fp” se refiere al polígono de frecuencia, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen, a diferencia de “fh”, la frecuencia se representa con vectores.
plot(tabla, type = "rfh")
*“rfh” hace referencia al histograma de frecuencia relativa, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen considerando el número total de dichos datos.
plot(tabla, type = "rfp")
*“rfp” hace referencia al polígono de frecuencia relativa, tomando en cuenta los límites de clase, siendo estos los datos encontrados en ambos extremos, se representa la frecuencia que los datos aparecen dentro de este margen considerando el número total de dichos datos, la frecuencia se representa como vectores.
*Histograma
plot(tabla, type = "cfh")
*“cfh” el histograma de frecuencia acumulada toma en cuenta los datos previamente representados en el límite de clase y los añade al límite sucesivo creando una frecuencia progresiva.
*Polígonos
plot(tabla, type = "cfp")
*“cfp” el polígono de frecuencia acumulada toma en cuenta los datos previamente representados en el límite de clase y los añade al límite sucesivo creando una frecuencia progresiva, la frecuencia se representa con vectores.
mean(ob)
## [1] 23.24167
median(ob)
## [1] 23.7
library(modeest)
##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
mlv(ob, method = "mfv")
## [1] 16.9 17.9 18.3 20.3 21.3 22.7 24.7 25.1 27.1 27.5 28.3 28.8
summary(ob)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 16.90 19.80 23.70 23.24 27.20 28.80
“summary” es una función genérica que se utiliza para producir resúmenes de los resultados de varias funciones de ajuste de modelos. La función invoca métodos particulares que dependen de la clase del primer argumento. Fuente: https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/summary
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria. Fuente: https://es.wikipedia.org/wiki/Cuantil
boxplot(ob)
*En ambos extremos podemos ver reflejado el mínimo y el máximo, el inicio de la caja representa el primer cuantil, el punto medio representa la media dentro de las variables y la parte superior de la caja representa el tercer cuantil.