A análise de dados é compreender a estrutura de um conjunto de dados, identificar padrões e apoiar a formulação de hipóteses. No contexto da produção animal e dos estudos de fermentação ruminal, técnicas experimentais podem ser utilizadas para avaliar parâmetros como produção de metano (CH4), degradabilidade da matéria orgânica (DMO) e concentração de metabólitos da fermentação.
O banco de dados utilizado neste trabalho contém informações de diferentes técnicas experimentais (in vitro, in vivo e Rumiflow), bem como diferentes tratamentos aplicados durante o experimento. Entre as variáveis analisadas estão a produção de CH4, a degradabilidade da matéria orgânica (DMO), a concentração de amônia (NH3) e os ácidos graxos de cadeia curta (AGCC).
O objetivo deste relatório é realizar uma análise do conjunto de dados utilizando a linguagem R e os pacotes do tidyverse, especialmente o pacote dplyr para manipulação de dados e ggplot2 para visualização gráfica. A partir dessa análise, busca-se responder perguntas de pesquisa relacionadas às diferenças entre técnicas experimentais e ao efeito dos tratamentos sobre a produção de CH4.
library(readr)
library(dplyr)
# 3. Carregar a base de dados
dados <- read_csv2("dados.csv")
# 3. Visualizar primeiras linhas
knitr::kable(head(dados))
| Tecnica | Periodo | Tratamento | DMO | CH4 | N-NH3 | AGCC |
|---|---|---|---|---|---|---|
| in vitro | 1 | 1 | 62667 | 557 | 5453 | 23681 |
| in vitro | 1 | 2 | 54369 | 262 | 6622 | 25165 |
| in vitro | 1 | 3 | 57008 | 454 | 566 | 25191 |
| in vitro | 2 | 1 | 52435 | 306 | 4963 | 26562 |
| in vitro | 2 | 2 | 54506 | 355 | 5943 | 27578 |
| in vitro | 2 | 3 | 5243 | 362 | 4606 | 23486 |
# Estrutura das variáveis
glimpse(dados)
## Rows: 54
## Columns: 7
## $ Tecnica <chr> "in vitro", "in vitro", "in vitro", "in vitro", "in vitro",…
## $ Periodo <dbl> 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 1, 1,…
## $ Tratamento <dbl> 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2,…
## $ DMO <dbl> 62667, 54369, 57008, 52435, 54506, 5243, 50273, 4847, 5454,…
## $ CH4 <dbl> 557, 262, 454, 306, 355, 362, 385, 347, 375, 417, 228, 24, …
## $ `N-NH3` <dbl> 5453, 6622, 566, 4963, 5943, 4606, 5334, 5653, 4998, 6132, …
## $ AGCC <dbl> 23681, 25165, 25191, 26562, 27578, 23486, 24459, 23515, 238…
# Número de linhas e colunas
dim(dados)
## [1] 54 7
summary(dados)
## Tecnica Periodo Tratamento DMO CH4
## Length:54 Min. :1.0 Min. :1 Min. : 4847 Min. : 10.0
## Class :character 1st Qu.:2.0 1st Qu.:1 1st Qu.:54403 1st Qu.: 356.8
## Mode :character Median :3.5 Median :2 Median :61547 Median : 695.0
## Mean :3.5 Mean :2 Mean :55654 Mean : 802.3
## 3rd Qu.:5.0 3rd Qu.:3 3rd Qu.:68453 3rd Qu.:1105.5
## Max. :6.0 Max. :3 Max. :74516 Max. :2403.0
## N-NH3 AGCC
## Min. : 252 Min. : 1237
## 1st Qu.:2370 1st Qu.:14899
## Median :4913 Median :17436
## Mean :3983 Mean :17952
## 3rd Qu.:5508 3rd Qu.:23515
## Max. :6622 Max. :27578
Técnica: variável qualitativa nominal
Período: variável numérica discreta
Tratamento: variável qualitativa nominal
DMO(degradabilidade da matéria orgânica): variável numérica contínua
CH4(Produção de Metano): variável numérica contínua
NH3(N-Amoniacal): variável numérica contínua
AGCC(Acidos Graxos de Cadeia Curta): variável numérica contínua
Com base no conjunto de dados analisado, foram formuladas as seguintes perguntas:
Pergunta 1. A produção média de CH4 difere entre as técnicas utilizadas no experimento?
library(readr)
library(dplyr)
library(ggplot2)
dados %>%
group_by(Tecnica) %>%
summarise(
media_CH4 = mean(CH4, na.rm = TRUE),
desvio_padrao_CH4 = sd(CH4, na.rm = TRUE),
n = n()
)
## # A tibble: 3 × 4
## Tecnica media_CH4 desvio_padrao_CH4 n
## <chr> <dbl> <dbl> <int>
## 1 in vitro 340. 141. 18
## 2 in vivo 1383. 670. 18
## 3 rumiflow 684. 324. 18
dados <- dados %>%
mutate(
Tecnica = as.factor(Tecnica),
Tratamento = as.factor(Tratamento)
)
ggplot(dados, aes(x = Tecnica, y = CH4, fill = Tecnica)) +
geom_boxplot() +
labs(
title = "Produção de CH4 por técnica",
x = "Técnica",
y = "Produção de CH4"
) +
theme_minimal()+
theme(legend.position = "none")
Para avaliar diferenças na produção de CH4 entre os tratamentos, foram calculadas as médias e desvios-padrão utilizando as funções group_by() e summarise() do pacote dplyr.
Resposta a pergunta 1 de pesquisa: A produção média de CH4
difere entre as técnicas utilizadas no experimento?
A análise descritiva mostrou diferenças na produção média de CH4 entre
as técnicas avaliadas. Observou-se que a técnica in vivo
apresentou valores médios mais elevados de produção de CH4 em comparação
com as técnicas in vitro e Rumiflow, indicando que o
método experimental pode influenciar a estimativa da produção de
metano.
Pergunta 2. A degradabilidade da matéria orgânica (DMO) apresenta diferenças entre as técnicas avaliadas?
library(readr)
library(dplyr)
library(ggplot2)
# Carregar os dados
dados <- read_csv2("dados.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 54 Columns: 7
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (1): Tecnica
## dbl (2): Periodo, Tratamento
## num (4): DMO, CH4, N-NH3, AGCC
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
# Estatísticas por técnica
dados %>%
group_by(Tecnica) %>%
summarise(
media_DMO = mean(DMO, na.rm = TRUE),
desvio_padrao_DMO = sd(DMO, na.rm = TRUE),
n = n()
)
## # A tibble: 3 × 4
## Tecnica media_DMO desvio_padrao_DMO n
## <chr> <dbl> <dbl> <int>
## 1 in vitro 40486. 22918. 18
## 2 in vivo 66439. 15592. 18
## 3 rumiflow 60037 5166. 18
# Gráfico
ggplot(dados, aes(x = Tecnica, y = DMO, fill = Tecnica)) +
geom_boxplot() +
labs(
title = "Degradabilidade da matéria orgânica (DMO) por técnica",
x = "Técnica",
y = "DMO"
) +
theme_minimal() +
theme(legend.position = "none")
Resposta 2 : A degradabilidade da matéria orgânica (DMO)
apresenta diferenças entre as técnicas avaliadas?
A comparação da DMO entre as técnicas indicou variações nos valores
observados. As diferenças sugerem que a técnica utilizada pode afetar a
estimativa da degradabilidade da matéria orgânica, possivelmente devido
às condições experimentais específicas de cada método.
Pergunta 3. O efeito do tratamento sobre a produção de CH4 é diferente entre as técnicas?
Os tratamentos avaliados no experimento diferiram na composição da dieta fornecida aos animais, especialmente na substituição do feno de Tifton por Tithonia diversifolia. Foram considerados três tratamentos experimentais:
T1: dieta composta por 70% de concentrado e 30% de feno de Tifton. T2: inclusão de 15% de Tithonia diversifolia em substituição parcial ao feno de Tifton. T3: inclusão de 45% de Tithonia diversifolia em substituição ao feno de Tifton.
library(readr)
library(dplyr)
library(ggplot2)
dados <- dados %>%
mutate(
Tecnica = as.factor(Tecnica),
Tratamento = as.factor(Tratamento)
)
ggplot(dados, aes(x = Tratamento, y = CH4, fill = Tecnica)) +
geom_boxplot() +
labs(
title = "Produção de CH4 por tratamento e técnica",
x = "Tratamento",
y = "Produção de CH4",
fill = "Técnica"
) +
theme_minimal()
Resposta 3: O efeito do tratamento sobre a produção de CH4 é
diferente entre as técnicas?
A análise mostrou que a produção de CH4 varia entre os tratamentos e que
esse efeito pode se comportar de forma diferente dependendo da técnica
utilizada. A visualização gráfica sugere que a resposta dos tratamentos
não é idêntica entre as técnicas, indicando possível interação entre
técnica e tratamento na produção de CH4.
A análise descritiva dos dados permitiu observar variações nos parâmetros de fermentação ruminal entre as técnicas experimentais avaliadas. Observou-se que a produção média de CH4 apresentou variações entre as técnicas, indicando que diferentes métodos experimentais podem influenciar a estimativa da produção de metano.