A seguir, estatística básicas, o intervalo de confianla para a media, teste-t e o -valor. Em seguida, calcula-se a Matriz de Correlação. Matriz do diagrama de dispersão - basic/GGally
Matriz de correlação
Plotar múltiplos boxplots usando ggplot2
regCarbonizas1 <- lm(biochar_kg ~ .,
data = dfCarbonizas )
summary(regCarbonizas1)
##
## Call:
## lm(formula = biochar_kg ~ ., data = dfCarbonizas)
##
## Residuals:
## ALL 5 residuals are 0: no residual degrees of freedom!
##
## Coefficients: (3 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -12.5452360 NaN NaN NaN
## biomassa_acai_kg 0.2758281 NaN NaN NaN
## rendimento_percent 0.4551434 NaN NaN NaN
## minutos_total -0.0001964 NaN NaN NaN
## gas_kg 0.0202306 NaN NaN NaN
## temp_maxima NA NA NA NA
## med_temp_acima_250_graus NA NA NA NA
## minutos_acima_250_graus NA NA NA NA
##
## Residual standard error: NaN on 0 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: NaN
## F-statistic: NaN on 4 and 0 DF, p-value: NA
regCarbonizas2 <- lm(biochar_kg ~ biomassa_acai_kg +
minutos_total +
gas_kg +
temp_maxima +
med_temp_acima_250_graus +
minutos_acima_250_graus,
data = dfCarbonizas)
summary(regCarbonizas2)
##
## Call:
## lm(formula = biochar_kg ~ biomassa_acai_kg + minutos_total +
## gas_kg + temp_maxima + med_temp_acima_250_graus + minutos_acima_250_graus,
## data = dfCarbonizas)
##
## Residuals:
## ALL 5 residuals are 0: no residual degrees of freedom!
##
## Coefficients: (2 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -101.22419 NaN NaN NaN
## biomassa_acai_kg 0.72565 NaN NaN NaN
## minutos_total 0.04266 NaN NaN NaN
## gas_kg -3.24341 NaN NaN NaN
## temp_maxima 0.15082 NaN NaN NaN
## med_temp_acima_250_graus NA NA NA NA
## minutos_acima_250_graus NA NA NA NA
##
## Residual standard error: NaN on 0 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: NaN
## F-statistic: NaN on 4 and 0 DF, p-value: NA
regCarbonizas <- lm(biochar_kg ~ . ,
data = dfCarbonizas )
summary(regCarbonizas)
##
## Call:
## lm(formula = biochar_kg ~ ., data = dfCarbonizas)
##
## Residuals:
## ALL 5 residuals are 0: no residual degrees of freedom!
##
## Coefficients: (3 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -12.5452360 NaN NaN NaN
## biomassa_acai_kg 0.2758281 NaN NaN NaN
## rendimento_percent 0.4551434 NaN NaN NaN
## minutos_total -0.0001964 NaN NaN NaN
## gas_kg 0.0202306 NaN NaN NaN
## temp_maxima NA NA NA NA
## med_temp_acima_250_graus NA NA NA NA
## minutos_acima_250_graus NA NA NA NA
##
## Residual standard error: NaN on 0 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: NaN
## F-statistic: NaN on 4 and 0 DF, p-value: NA
VarSigCarbonizas <- lm(biochar_kg ~ biomassa_acai_kg,
data = dfCarbonizas)
summary(VarSigCarbonizas)
##
## Call:
## lm(formula = biochar_kg ~ biomassa_acai_kg, data = dfCarbonizas)
##
## Residuals:
## 1 2 3 4 5
## 1.0293 -3.8823 0.6318 1.4993 0.7219
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.5344 8.4932 -0.298 0.785
## biomassa_acai_kg 0.3119 0.1805 1.727 0.183
##
## Residual standard error: 2.536 on 3 degrees of freedom
## Multiple R-squared: 0.4987, Adjusted R-squared: 0.3316
## F-statistic: 2.984 on 1 and 3 DF, p-value: 0.1825
A interpretação do sumário do modelo linear (lm) para a
variável dependente biochar_kg é a seguinte:
Intercepto (Intercept): O valor do intercepto é
aproximadamente -11.12, o que indica que, quando todas as variáveis
independentes são 0, o valor esperado de biochar_kg é
-11.12. Este valor é estatisticamente significativo (p < 0.001), o
que significa que há evidências suficientes para afirmar que o
intercepto é diferente de 0.
biomassa_acai_kg: Para cada unidade aumentada em
biomassa_acai_kg, espera-se que biochar_kg
aumente em média 0.239. Este coeficiente é estatisticamente
significativo (p < 0.001), indicando uma forte relação positiva entre
biomassa_acai_kg e biochar_kg.
rendimento_percent: Para cada unidade aumentada
em rendimento_percent, espera-se que
biochar_kg aumente em média 0.447. Este coeficiente também
é estatisticamente significativo (p < 0.001), sugerindo uma relação
positiva significativa entre rendimento_percent e
biochar_kg.
minutos_total: O coeficiente para
minutos_total é aproximadamente 0.001, mas este não é
estatisticamente significativo (p = 0.322), o que indica que não há
evidências suficientes para afirmar que minutos_total tem
um efeito sobre biochar_kg.
Resíduos (Residuals): Os resíduos variam de -0.58 a 0.49, com a mediana próxima de zero, o que é bom para o modelo.
Erro Padrão Residual (Residual standard error): O erro padrão residual é 0.2811, o que indica a quantidade de variação que não é explicada pelo modelo.
R-quadrado (Multiple R-squared): O valor de
R-quadrado é 0.9862, o que significa que aproximadamente 98.62% da
variação em biochar_kg é explicada pelas variáveis
independentes no modelo.
R-quadrado Ajustado (Adjusted R-squared): O valor de R-quadrado ajustado é 0.9832, que ajusta o R-quadrado com base no número de preditores no modelo, fornecendo uma medida mais precisa para modelos com múltiplas variáveis.
Estatística F (F-statistic): A estatística F é 333.4 com um p-valor extremamente baixo (próximo de zero), o que indica que o modelo como um todo é estatisticamente significativo.
Os códigos de significância são representados por asteriscos, onde
mais asteriscos indicam maior significância estatística. No seu modelo,
biomassa_acai_kg e rendimento_percent são
altamente significativos, enquanto minutos_total não é.