Carga librerias

PUNTO 1

Utilice la función de ayuda para explorar las series gold, woolyrnq y gas.

  1. Use autoplot() para trazar cada uno de estos en diagramas separados.
  2. Cuál es la frecuencia de cada serie? Sugerencia: aplique la función frequency() .
  3. Use which.max()para detectar el valor atipico en la serie gold. Qué observación fue?

Descripción de series golds, woolyrnq y gas, frecuencia de cada serie

SERIE GOLD

Datos correspondientes Precios diarios del oro por la mañana en dolares estadounidenses.1 January 1985

#help(gold)
print ("Precios diarios del oro por la mañana en dólares estadounidenses.1 January 1985 – 31 March 1989")
## [1] "Precios diarios del oro por la mañana en dólares estadounidenses.1 January 1985 – 31 March 1989"
# gold
str(gold)
##  Time-Series [1:1108] from 1 to 1108: 306 300 303 297 304 ...
#gold
autoplot(gold)

frequency(gold)
## [1] 1

El precio diario del oro muestra una tendencia positiva hasta el día 800, luego la tendencia disminuye lentamente. A los 770 días, hay un aumento en el precio, el cual puede ser valor atípico, y alparecer tuvo algún impacto económico en el precio ya que en este momento inicia un descenso en el precio el cual llega a menos de 400 dólares.

No se identifica una serie estacional

En este caso la frecuencia es 1, pero las observaciones son diarias

SERIE WOOLYRNQ

Datos correspondientes Producción trimestral de hilados de lana en Australia: toneladas. Mar 1965 - Sep 1994

#Producción trimestral de hilados de lana en Australia: toneladas. Mar 1965 - Sep 1994
#help (woolyrnq)
str(woolyrnq)
##  Time-Series [1:119] from 1965 to 1994: 6172 6709 6633 6660 6786 ...
autoplot(woolyrnq)

ggseasonplot(woolyrnq)

frequency(woolyrnq)
## [1] 4

En esta serie alcanzamos a observar estacionalidad y observamos ciclicidad

Observamos que que la producción que los primeros años de la serie es mucho mayor (casi el doble) en relación con los últimos años

se evidencia estacionalidad en donde el segundo y tercer trimestre tienen una mayor producción en relación con el primer y cuarto trimestre

En el autoplot se corrobora lo mencionado anteriormente y muestra con mayor claridad la producción más alta y baja, las cuales se dan entre los primeros 10 años. En 1970 se llega a tener una producción de casi 8000 toneladas y 1975 menos a 3500 toneladas.

La frecuencia es 4 (trimestral)

SERIE GAS

#Produccion de gas mensual en Australia desde: 1956–1994
#help(gas)
str(gas)
##  Time-Series [1:476] from 1956 to 1996: 1709 1646 1794 1878 2173 ...
autoplot(gas)

ggseasonplot(gas)

frequency(gas)
## [1] 12

se puede observar una tendencia creciente, con patrón estacional que aumenta de tamaño a medida que aumenta el nivel de la serie.

El autoplot nos permite observar que la producción de gas mensual en Australia en los primeros años de la serie es mucho menor (casi 30 veces menos) en relación con los últimos años y que también la producción es más estable entre los meses de los primeros años a diferencia de en los últimos años donde la producción muestra un pico en el mes de julio. se observa produccion baja entre 1956 y 1970 a partir de este año inicia crecimiento en la produccion.

A pesar de estas diferencias de forma general se evidencia que desde los primeros años la producción tiene un comportamiento con tendencia positiva de febrero a julio y e partir de allí se invierte

La frecuencia es 12 (mensual)

VALOR ATIPICO DE LA SERIE GOLD

which.max(gold)
## [1] 770
gold[which.max(gold)]
## [1] 593.7
#gold

El máximo valor es localizado en el día 770 de la lista con un valor de 593.70

PUNTO 3

La Base2 contiene datos mensuales de ventas minoristas en varias categorías para diferentes estados australianos.

  1. Lea los datos en R. Utilice esta función: retaildata<-readxl::read_excel(“base2.xlsx”,skip=1)

  2. Seleccione una de las series temporales de la siguiente manera (pero reemplace el nombre de la columna con su propia columna elegida): myts<-ts(retaildata[,“A3349873A”],frequency=12,start=c(1982,4))

  3. Explore la serie de tiempo de venta minorista elegida utilizando las siguientes funciones:autoplot(), ggseasonplot(), gglagplot(), ggAcf() Puedes detectar alguna estacionalidad, ciclicidad y tendencia? Qué aprendes sobre la serie?

LECTURA DE BASE DE DATOS RETAILDATA

retaildata<-readxl::read_excel("base2.xlsx",skip=1)
#str( retaildata)
# SELECCION DE SERIE VENTA AL POR MENOR DE ROPA A3349399C
 myts <- ts(retaildata[,"A3349399C"], frequency=12, start=c(1982,4))

EXPLORACION GRAFICA

autoplot(myts)

En la serie “venta al por menor de ropa” observamos un claro patrón estacional y cíclico en la serie y una tendencia creciente.

Los datos también muestran un aumento considerable de las ventas para 2013.

ggseasonplot(myts)

Hay un incremento considerable en las ventas en diciembre de cada año, puede ser relacionado con la navidad. El gráfico también muestra que hubo un número alto de ventas en noviembre de 2011, 2012 y 2013.

Se observa siempre una pequeña caída en febrero de cada año y crecimiento hasta junio, crecimiento alto en noviembre a diciembre.

gglagplot(myts, lags = 16)

ggAcf(myts)

El diagrama de lags muestra que los retrasos del 1 al 16 están todos altamente y positivamente correlacionados, el lag 12 es el mas correlacionado; y el gráfico de autocorrelación confirma esta observación.

PUNTO 6

Utilizar las funciones siguientes gráficos: autoplot(), ggseasonplot(),gglagplot(), ggAcf() y explore las características de las siguientes series de tiempo: hsales, usdeaths, bricksq, sunspotarea, gasoline.

a.Puedes detectar alguna estacionalidad, ciclicidad y tendencia?

b.Que aprendes sobre la serie?

EXPLORACION DE SERIES E INTERPRETACION

HSALES

Serie de Ventas mensuales de nuevas casas unifamiliares vendidas en los EE. UU. Desde 1973.

autoplot(hsales)

ggseasonplot(hsales)

gglagplot(hsales)

ggAcf(hsales, lag.max = 400)

Se observa estacionalidad y ciclicidad , el periodo del ciclo es de 4 años, En la mayoría de los años de la serie se observa un aumento en las ventas los primeros tres meses y decrecimiento en ventas los restantes meses del año

De la serie se aprende

Las ventas mensuales de nuevas casas unifamiliares vendidas en los EE. UU. En años mas recientes han disminuido en comparación con años anteriores.

Parece que hay una gran cantidad de ventas mensuales de nuevas casas unifamiliares vendidas en los meses de marzo, abril y mayo de 1987, con algunas excepciones

El mes de diciembre parece representar el número más bajo de nuevas casas unifamiliares vendidas.

USDEATHS

Serie sobre Muertes accidentales mensuales en EE. UU.

autoplot(usdeaths)

ggseasonplot(usdeaths)

gglagplot(usdeaths)

ggAcf(usdeaths, lag.max = 60)

De los gráficos anteriores, podríamos identificar tendencias crecientes y decrecientes, también hay una estacionalidad presente y se puede ver cierta ciclicidad ya que parece haber un ciclo de 8 a 12 años

De la serie se aprende

Las muertes accidentales mensuales en los EE. UU. en 1973 fue bastante alta y En los últimos años parecen tener una tendencia al alza.

Parece haber un aumento considerable de muertes accidentales mensuales en el mes de julio, y la más alta en julio de 1973.

En los primeros meses del año se observa un número bajo de muertes accidentales

BRICKSQ

Producción trimestral de ladrillos de arcilla en Australia: 1956–1994

autoplot(bricksq)

ggseasonplot(bricksq)

gglagplot(bricksq)

ggAcf(bricksq, lag.max = 200)

De los gráficos anteriores, podríamos identificar tendencias crecientes y decrecientes, también hay una estacionalidad presente y se puede ver ciclicidad ya que parece haber un ciclo de 4 a 5 años.

De la serie se aprende

Parece que hay una baja producción trimestral de ladrillos en el primer trimestre, con un aumento de las tendencias en los otros 3 trimestres.

La producción trimestral de ladrillos desde 1990 bajo bastante en comparación con años anteriores desde 1974 a 1929

En el cuarto trimestre de 1981 parece haber una caída muy profunda en la producción trimestral australiana de ladrillos de arcilla en comparación con otros años.

SUNSPOTAREA

Área promedio anual de manchas solares (1875-2015)

#?sunspotarea
autoplot(sunspotarea)

# ggseasonplot(sunspotarea) 
gglagplot(sunspotarea)

ggAcf(sunspotarea, lag.max = 50)

Se observan ciclos, pero no estacionalidad, los ciclos tienen periodos de 8 0 10 años aproximadamente,

la función ggseasonplot no se pudo realizar

A partir de los gráficos anteriores, podríamos identificar tendencias crecientes y decrecientes

De la serie se aprende

En la serie se observa comportamiento de tendencia ascendente y descendente.

Parece haber un aumento anual promedio del área de manchas solares en 1957, con una tendencia a la baja después.

El “área anual promedio de manchas solares” parece reducirse conforme pasan los años ej. se observa en el año 2000 valores bajos comparando con decadas anteriores

GASOLINE

Producto de gasolina de motor en millones de barriles por día

#gasoline
autoplot(gasoline)

ggseasonplot(gasoline)

gglagplot(gasoline)

ggAcf(gasoline, lag.max = 1000)

Según el gráfico de estacionalidad, la serie es estacional, también muestra tendencia creciente y decreciente de acuerdo al autoplot

De la serie se aprende

El producto de gasolina de motor terminado de EE. UU. suministrado parece tener un comportamiento de tendencia ascendente y descendente.

El producto de gasolina de motor terminado de EE. UU. Suministrado parece tener una tendencia ascendente en los últimos años, con relación a los años entre 2005 y 2010 y anteriores; se observa tendencia creciente entre 1990 y 2005

PUNTO 9

Los datos de pigs muestran el número total mensual de cerdos sacrificados en Victoria, Australia, desde enero de 1980 hasta agosto de 1995.
Use mypigs <-window(pigs, start=1990), para seleccionar los datos a partir de 1990. Use autoplot y ggAcf para mypigs y compárelos con los gráficos de ruido blanco. Considera que son un ruido blanco?

mypigs <- window(pigs, start=1990)
str(mypigs)
##  Time-Series [1:68] from 1990 to 1996: 75982 78074 77588 84100 97966 ...
autoplot(mypigs)

ggseasonplot(mypigs)

ggAcf(mypigs)

Se observa estacionalidad. El ACF muestra picos altos en los lags 1,2 y 3.
También hay un pico en el lag 12.

No es una serie de ruido blanco

PUNTO 10

dj contiene 292 días hábiles consecutivos del indice Dow Jones. Usela función diff() para observar los cambios diarios en la serie. ddj <-diff(dj), Grafique ddjy su ACF. ¿Los cambios en el Indice Dow Jones parecen ruido blanco?

ddj <- diff(dj)
str(ddj)
##  Time-Series [1:291] from 2 to 292: -6 -19 8 -13.5 -13.5 -18 1 32 12 -18 ...
autoplot(ddj)

ggAcf(ddj)

Se observa que la mayoría de los picos están dentro de los limites, esto es todos los coeficientes de correlación están dentro de esos limites, Por lo tanto, hay evidencia de que ddj puede ser ruido blanco