1. Selección y preparación del conjunto de datos

1.1Seleccion conjunto de datos

Para este taller se tomo el conjunto de datos aus_livestock, el cual contiene información acerca de la industria ganadera en Australia. El conjunto de datos tiene 29,364 registros y cuatro columnas en la cual se describe diferentes tipos de ganado destinados a su comercializacion. Acontinuación se hace una breve descripción de las variables en la siguiente tabla:

Nombre variable Tipo Descripción
Month yearmonth Año y mes
Animal fctr Nombre de la especie o ganado
State fctr Nombre del estado
Count dbl Cantidad de la especie sacrificada

1.2 Importacion conjunto de datos

Aqui podemos observa la carga o importacion de los datos, asi mismo la asignacion de este al nombre “Datosanimalitos”

aus_livestock
## # A tsibble: 29,364 x 4 [1M]
## # Key:       Animal, State [54]
##        Month Animal                     State                        Count
##        <mth> <fct>                      <fct>                        <dbl>
##  1 1976 jul. Bulls, bullocks and steers Australian Capital Territory  2300
##  2 1976 ago. Bulls, bullocks and steers Australian Capital Territory  2100
##  3 1976 sep. Bulls, bullocks and steers Australian Capital Territory  2100
##  4 1976 oct. Bulls, bullocks and steers Australian Capital Territory  1900
##  5 1976 nov. Bulls, bullocks and steers Australian Capital Territory  2100
##  6 1976 dic. Bulls, bullocks and steers Australian Capital Territory  1800
##  7 1977 ene. Bulls, bullocks and steers Australian Capital Territory  1800
##  8 1977 feb. Bulls, bullocks and steers Australian Capital Territory  1900
##  9 1977 mar. Bulls, bullocks and steers Australian Capital Territory  2700
## 10 1977 abr. Bulls, bullocks and steers Australian Capital Territory  2300
## # ℹ 29,354 more rows
Datosanimalitos <- aus_livestock 

1.3 formato tsibble

Este conjunto de datos ya estaba en formato tsibble; sin embargo, para el análisis que se busca, se requiere cambiar el índice de 1 M (un mes) a 1 Q (un trimestre) con el fin de analizar el comportamiento de los datos en las variaciones estacionales.

 Datosanimalitos<- as_tibble(Datosanimalitos)


  Datosanimalitos
## # A tibble: 29,364 × 4
##        Month Animal                     State                        Count
##        <mth> <fct>                      <fct>                        <dbl>
##  1 1976 jul. Bulls, bullocks and steers Australian Capital Territory  2300
##  2 1976 ago. Bulls, bullocks and steers Australian Capital Territory  2100
##  3 1976 sep. Bulls, bullocks and steers Australian Capital Territory  2100
##  4 1976 oct. Bulls, bullocks and steers Australian Capital Territory  1900
##  5 1976 nov. Bulls, bullocks and steers Australian Capital Territory  2100
##  6 1976 dic. Bulls, bullocks and steers Australian Capital Territory  1800
##  7 1977 ene. Bulls, bullocks and steers Australian Capital Territory  1800
##  8 1977 feb. Bulls, bullocks and steers Australian Capital Territory  1900
##  9 1977 mar. Bulls, bullocks and steers Australian Capital Territory  2700
## 10 1977 abr. Bulls, bullocks and steers Australian Capital Territory  2300
## # ℹ 29,354 more rows

Lo primero que se hizo fue convertir el conjunto de datos de un formato tsibble a un tibble. Luego se tomaron los datos y se utilizó la función mutate() para crear una nueva varible llamada Quarter y cambiar la frecuencia de la variable de 1 M (mensual) a 1 Q (trimestral).

 Datosanimalitos <- Datosanimalitos|>
  mutate(Quarter= yearquarter(Month))

 Datosanimalitos
## # A tibble: 29,364 × 5
##        Month Animal                     State                      Count Quarter
##        <mth> <fct>                      <fct>                      <dbl>   <qtr>
##  1 1976 jul. Bulls, bullocks and steers Australian Capital Territ…  2300 1976 Q3
##  2 1976 ago. Bulls, bullocks and steers Australian Capital Territ…  2100 1976 Q3
##  3 1976 sep. Bulls, bullocks and steers Australian Capital Territ…  2100 1976 Q3
##  4 1976 oct. Bulls, bullocks and steers Australian Capital Territ…  1900 1976 Q4
##  5 1976 nov. Bulls, bullocks and steers Australian Capital Territ…  2100 1976 Q4
##  6 1976 dic. Bulls, bullocks and steers Australian Capital Territ…  1800 1976 Q4
##  7 1977 ene. Bulls, bullocks and steers Australian Capital Territ…  1800 1977 Q1
##  8 1977 feb. Bulls, bullocks and steers Australian Capital Territ…  1900 1977 Q1
##  9 1977 mar. Bulls, bullocks and steers Australian Capital Territ…  2700 1977 Q1
## 10 1977 abr. Bulls, bullocks and steers Australian Capital Territ…  2300 1977 Q2
## # ℹ 29,354 more rows

Después de esto, se tomaron las variables Animal, State y Quarter y, se agruparon para aplicar summarise() a la variable Count, lo cual permitio tener la suma trimestral de los valores, adicionalmente, se genero una nueva variable llamada Total la cual guardara la suma.

Datosanimalitos <- Datosanimalitos |> 
  group_by(Animal, State, Quarter) |> 
  summarise(Total = sum(Count, na.rm = TRUE))
## `summarise()` has grouped output by 'Animal', 'State'. You can override using
## the `.groups` argument.
  Datosanimalitos
## # A tibble: 9,788 × 4
## # Groups:   Animal, State [54]
##    Animal                     State                        Quarter Total
##    <fct>                      <fct>                          <qtr> <dbl>
##  1 Bulls, bullocks and steers Australian Capital Territory 1976 Q3  6500
##  2 Bulls, bullocks and steers Australian Capital Territory 1976 Q4  5800
##  3 Bulls, bullocks and steers Australian Capital Territory 1977 Q1  6400
##  4 Bulls, bullocks and steers Australian Capital Territory 1977 Q2  7700
##  5 Bulls, bullocks and steers Australian Capital Territory 1977 Q3  7000
##  6 Bulls, bullocks and steers Australian Capital Territory 1977 Q4  6900
##  7 Bulls, bullocks and steers Australian Capital Territory 1978 Q1  7800
##  8 Bulls, bullocks and steers Australian Capital Territory 1978 Q2  8500
##  9 Bulls, bullocks and steers Australian Capital Territory 1978 Q3  7900
## 10 Bulls, bullocks and steers Australian Capital Territory 1978 Q4  7900
## # ℹ 9,778 more rows

Como nuestro conjunto de datos seguía siendo un tibble debido a la transformación previa,se tuvo que convirtir de nuevo a un tsibble tomando como índice quarter (1 Q) y como llaves las variables State y Animal

  Datosanimalitos<- Datosanimalitos|>
  as_tsibble(
    index = Quarter,
    key   = c(State, Animal)
  )

  
  Datosanimalitos
## # A tsibble: 9,788 x 4 [1Q]
## # Key:       State, Animal [54]
## # Groups:    Animal, State [54]
##    Animal                     State                        Quarter Total
##    <fct>                      <fct>                          <qtr> <dbl>
##  1 Bulls, bullocks and steers Australian Capital Territory 1976 Q3  6500
##  2 Bulls, bullocks and steers Australian Capital Territory 1976 Q4  5800
##  3 Bulls, bullocks and steers Australian Capital Territory 1977 Q1  6400
##  4 Bulls, bullocks and steers Australian Capital Territory 1977 Q2  7700
##  5 Bulls, bullocks and steers Australian Capital Territory 1977 Q3  7000
##  6 Bulls, bullocks and steers Australian Capital Territory 1977 Q4  6900
##  7 Bulls, bullocks and steers Australian Capital Territory 1978 Q1  7800
##  8 Bulls, bullocks and steers Australian Capital Territory 1978 Q2  8500
##  9 Bulls, bullocks and steers Australian Capital Territory 1978 Q3  7900
## 10 Bulls, bullocks and steers Australian Capital Territory 1978 Q4  7900
## # ℹ 9,778 more rows

1.4 función select()

La funcion select se uso aqui tomando las variables necesarias para el analisis

Datosanimalitos<- Datosanimalitos|>
  select(Quarter,State,Animal,Total )

1.5 Conjunto de datos resultante

Datosanimalitos
## # A tsibble: 9,788 x 4 [1Q]
## # Key:       State, Animal [54]
## # Groups:    Animal, State [54]
##    Quarter State                        Animal                     Total
##      <qtr> <fct>                        <fct>                      <dbl>
##  1 1976 Q3 Australian Capital Territory Bulls, bullocks and steers  6500
##  2 1976 Q4 Australian Capital Territory Bulls, bullocks and steers  5800
##  3 1977 Q1 Australian Capital Territory Bulls, bullocks and steers  6400
##  4 1977 Q2 Australian Capital Territory Bulls, bullocks and steers  7700
##  5 1977 Q3 Australian Capital Territory Bulls, bullocks and steers  7000
##  6 1977 Q4 Australian Capital Territory Bulls, bullocks and steers  6900
##  7 1978 Q1 Australian Capital Territory Bulls, bullocks and steers  7800
##  8 1978 Q2 Australian Capital Territory Bulls, bullocks and steers  8500
##  9 1978 Q3 Australian Capital Territory Bulls, bullocks and steers  7900
## 10 1978 Q4 Australian Capital Territory Bulls, bullocks and steers  7900
## # ℹ 9,778 more rows

1.6 Justificacion elección de las columnas

Estas variables se eligieron porque el objetivo del análisis es identificar el comportamiento del consumo interno de carne de oveja en los ocho estados de Australia

Quarter: variable que permite identificar el tiempo y se usa como index en la serie temporal State: variable categórica sobre los seis estados de Australia Animal: variable que indica la categorización del producto Total: variable que permite el registro de la cantidad de animales usados para la produccion de carne

2. Generación de variables temporales y derivadas

2.1. Aplicar mutate()

Se usó mutate() para aplicar el logaritmo natural a la columna Total, de modo que los números muy grandes quedaran en una escala más pequeña sin perder la relación entre los valores

Datosanimalitos <- Datosanimalitos |>
  filter(Total > 0) |>
  mutate(Total = log(Total))

2.2. derivar otras variables relevantes

Datosanimalitos <- Datosanimalitos |> mutate( Qtr = quarter(Quarter) )

2.3. Mostrar el resultado de la transformación

Datosanimalitos
## # A tsibble: 8,788 x 4 [1Q]
## # Key:       State, Animal [54]
## # Groups:    Animal, State [54]
##    Quarter State                        Animal                     Total
##      <qtr> <fct>                        <fct>                      <dbl>
##  1 1976 Q3 Australian Capital Territory Bulls, bullocks and steers  8.78
##  2 1976 Q4 Australian Capital Territory Bulls, bullocks and steers  8.67
##  3 1977 Q1 Australian Capital Territory Bulls, bullocks and steers  8.76
##  4 1977 Q2 Australian Capital Territory Bulls, bullocks and steers  8.95
##  5 1977 Q3 Australian Capital Territory Bulls, bullocks and steers  8.85
##  6 1977 Q4 Australian Capital Territory Bulls, bullocks and steers  8.84
##  7 1978 Q1 Australian Capital Territory Bulls, bullocks and steers  8.96
##  8 1978 Q2 Australian Capital Territory Bulls, bullocks and steers  9.05
##  9 1978 Q3 Australian Capital Territory Bulls, bullocks and steers  8.97
## 10 1978 Q4 Australian Capital Territory Bulls, bullocks and steers  8.97
## # ℹ 8,778 more rows

3. Filtrado de datos

3.1. Utilizar filter()

Datosanimalitos <- Datosanimalitos |>
  filter( year(Quarter) >= 2000, Animal =="Sheep"  )

3.2.evidencia del filtrado aplicado

Datosanimalitos
## # A tsibble: 456 x 4 [1Q]
## # Key:       State, Animal [6]
## # Groups:    Animal, State [6]
##    Quarter State           Animal Total
##      <qtr> <fct>           <fct>  <dbl>
##  1 2000 Q1 New South Wales Sheep   14.2
##  2 2000 Q2 New South Wales Sheep   14.1
##  3 2000 Q3 New South Wales Sheep   14.1
##  4 2000 Q4 New South Wales Sheep   14.1
##  5 2001 Q1 New South Wales Sheep   14.3
##  6 2001 Q2 New South Wales Sheep   14.2
##  7 2001 Q3 New South Wales Sheep   14.2
##  8 2001 Q4 New South Wales Sheep   14.2
##  9 2002 Q1 New South Wales Sheep   14.2
## 10 2002 Q2 New South Wales Sheep   14.1
## # ℹ 446 more rows

3.3. Justificar la elección del periodo seleccionado.

Se usa la función select() para quedarnos solo con la carne del tipo de animal que se quiere analizar. Además, se filtra el período a partir de 2000, año desde el cual se cuentan con cuatro trimestres completos.

4. Agrupamiento y resumen estadístico

4.1. Aplicar group_by()

Aplicados seccion 1.3

4.2. Utilizar summarise()

Aplicados seccion 1.3

4.3. Presentar la tabla resumen obtenida.

Datosanimalitos
## # A tsibble: 456 x 4 [1Q]
## # Key:       State, Animal [6]
## # Groups:    Animal, State [6]
##    Quarter State           Animal Total
##      <qtr> <fct>           <fct>  <dbl>
##  1 2000 Q1 New South Wales Sheep   14.2
##  2 2000 Q2 New South Wales Sheep   14.1
##  3 2000 Q3 New South Wales Sheep   14.1
##  4 2000 Q4 New South Wales Sheep   14.1
##  5 2001 Q1 New South Wales Sheep   14.3
##  6 2001 Q2 New South Wales Sheep   14.2
##  7 2001 Q3 New South Wales Sheep   14.2
##  8 2001 Q4 New South Wales Sheep   14.2
##  9 2002 Q1 New South Wales Sheep   14.2
## 10 2002 Q2 New South Wales Sheep   14.1
## # ℹ 446 more rows

4.4. Interpretar brevemente los valores obtenidos

Aquí se observa el total registrado en cada trimestre, junto con la identificación del trimestre dentro del año (número de período)

5. Visualización general de la serie

5.1. gráfico con autoplot()

Datosanimalitos |>
  autoplot(Total) +
  labs(y = "Cantidad", title = "Producción Carne de Oveja (Australia)")
## `mutate_if()` ignored the following grouping variables:
## • Columns `Animal`, `State`

5.2. Interpretar la tendencia general

En el gráfico anterior, se muestra que la producción de carne de oveja en los distintos estados de Australia presenta una tendencia general a la baja, más evidente a partir del año 2010. Esta disminución es mucho mas notoria en el estado de Victoria y Queensland, donde se observa una caída marcada alrededor de 2015.

6. Análisis de estacionalidad

6.1. Aplicar gg_season()

Datosanimalitos |> 
  gg_season(Total, labels = "right") +
  facet_wrap(vars(State), nrow = 2, scales = "free_y") +
  labs(y = "Cantidad", title = "Estacionalidad de producción por Estado") 

### 6.2. Identificar repeticiones sistemáticas El gráfico muestra un patrón estacional en casi todos los estados. La producción de carne de oveja tiene altos en el primer y cuarto trimestre del año y presenta valles en el segundo y tercer trimestre. Este comportamiento se repite a lo largo de los años, aunque de diferente manera según el estado.

7. Análisis por subseries

7.1. Utilizar gg_subseries()

Datosanimalitos|> 
   gg_subseries(Total)+
  labs(y = "Cantidad", title = "Producción de carne de oveja (Australia)")

7.2. Indicar qué patrones adicionales aporta esta visualización

En el grafico anterior se muestra una tendencia descendente de largo plazo, caídas puntuales (2010 y 2015) y diferencias en la intensidad de esa disminución según el estado. ## 8. Análisis de relación por la variable

8.1. Aplicar ggpairs()

#Datosanimalitos |>
 # ggpairs()

9. Interpretación final

9.1. interpretación global de la serie analizada

En el análisis de la producción de carne de oveja en Australia, utilizando datos trimestrales desde el año 2000, se observa una disminución general en la producción a lo largo del tiempo. La serie temporal muestra que la producción durante el tercer y cuarto trimestre es significativamente menor en comparación con el primer trimestre, que corresponde a los meses de marzo a mayo, durante la primavera.

Este patrón se explica considerando factores ambientales y de salud animal, como la esquila de las ovejas. Esta práctica se realiza generalmente en primavera, cuando el clima es más estable, lo que reduce el estrés térmico en los animales y permite un mayor rendimiento cárnico.

En resumen, la sincronización del esquilado con las estaciones del año es un factor clave tanto para la calidad de la lana como para la producción eficiente de carne, lo que explica por qué la producción tiende a disminuir durante el otoño e invierno

9.2. La tendencia general de la serie, Comportamientos estacionales observados, Ciclos o fluctuaciones que no correspondan a estacionalidad

En términos generales, la tendencia de la serie es descendente. La mayoría de los estados presentan una reducción gradual en la producción de carne de oveja, especialmente a partir de 2011, lo que sugiere posibles cambios estructurales en el mercado o en las prácticas ganaderas.

Además de los patrones estacionales, se observan variaciones irregulares en ciertos períodos; por ejemplo, se registran caídas pronunciadas alrededor de 2010 y 2015. Regiones como Victoria y New South Wales concentran los mayores volúmenes de producción, mientras que territorios como Northern Territory y Australian Capital Territory muestran cifras muy bajas e incluso períodos de inactividad. Estas fluctuaciones podrían estar relacionadas con cambios en la producción o la demanda de carne de oveja.