A continuación, la siguiente base es una muestra sobre el servicio meteorologico del clima en Canada

#install.packages("seas") # Corre está linea si no tiene instalado el paquete seas
library(seas)
data(mscdata)
head(mscdata)
##        id year yday       date t_max t_min t_mean rain snow precip
## 1 1096450 1975    1 1975-01-01   1.1  -7.2   -3.1    0  2.0    1.5
## 2 1096450 1975    2 1975-01-02   0.6  -7.2   -3.3    0  0.0    0.0
## 3 1096450 1975    3 1975-01-03   0.6  -7.2   -3.3    0  0.3    0.3
## 4 1096450 1975    4 1975-01-04  -4.4 -10.0   -7.2    0  0.5    0.5
## 5 1096450 1975    5 1975-01-05  -0.6  -6.1   -3.4    0  3.8    3.8
## 6 1096450 1975    6 1975-01-06  -1.1 -10.6   -5.9    0  0.0    0.0

Esta información consiste en la medición de 10 variables (medicas en grados centigrados y meses por dia) de 26358 dias de observación. A continuación se describe cada una de las variables:

Variable Etiqueta
id Variable cualitativa usada para distinguir las diferentes estaciones
year Variable numérica entera que identifica el año
yday Variable númerica entre del dia de cada año; 1-365 o 1-366
date Fecha
t_max Temperatura máxima diaria
t_min Temperatura mínima diaria
t_mean Temperatura media diaria
precip Precipitación total diaria
rain Precipitación total diaria en fase líquida
snow Precipitación total diaria en fase solida

La siguiente nomenclatura identifica cada una de las estaciones

ID Station Location Province
1096450 Prince George BC
1108447 Vancouver BC
2100630 Haines Junction YT

Todos los datos son tomados desde 1975 hasta 2004 para cada estación. Los observaciones sin registro indican datos faltantes.

Ejercicio

Teniendo en cuenta lo anterior determine los siguiente:

  1. Realice tablas de distribución de frecuencias para las variables cualitativas y cuantitativas según sea el caso.
  2. Realice resúmenes estadísticos de las variables cualitativas, cuantitativas.
  3. Represente los resultados anteriores mediante gráficos (diagrama de barras, diagrama circular, histograma, según sea el caso).
  4. Teniendo en cuenta el siguiente codigo con el cual se calcula el valor de la moda para un conjunto de datos, determine el valor de la moda en las variables cuantitativas.
ejemplo <-c(1,1,1,1,1,1,2,2,2,3,3,3,4,4,4,4,5,5,5,5,5,5) 
t <- table(ejemplo) # Notese que los valores de mayor frecuencias son el 1 y el 5
which(t == max(t))
## 1 5 
## 1 5
  1. Filtre la información por los útimos cinco años y construya un diagrama de boxplot para el promedio de temperatura diaria de cada uno de los meses. La gráfica debe quedar de la siguiente manera