1) Somando ou subtraindo uma constante k a cada valor do
conjunto:
Suponha que temos um conjunto de dados \(x_1, x_2, \ldots, x_n\) e a média \(\mu(x)\) dada por:
\[ \mu(x) = \frac{1}{n} \sum_{i=1}^{n} x_i \]
Agora, somamos ou subtraímos uma constante \(k\) a cada valor \(x_i\), o novo conjunto será:
\[ x_1 + k, x_2 + k, \ldots, x_n + k \]
A nova média \(\mu(x \pm k)\) será:
\[ \mu(x \pm k) = \frac{1}{n} \sum_{i=1}^{n} (x_i \pm k) \]
Usando a propriedade da soma, podemos separar a soma dos \(x_i\) e a soma das constantes \(k\):
\[ \mu(x \pm k) = \frac{1}{n} \left( \sum_{i=1}^{n} x_i \pm \sum_{i=1}^{n} k \right) \]
Sabemos que \(\sum_{i=1}^{n} k = n \cdot k\), então:
\[ \mu(x \pm k) = \frac{1}{n} \sum_{i=1}^{n} x_i \pm \frac{1}{n} n \cdot k \]
\[ \mu(x \pm k) = \mu(x) \pm k \]
2) Multiplicando ou dividindo cada valor do conjunto por uma
constante k:
Agora, multiplicamos ou dividimos cada valor \(x_i\) por uma constante \(k\), e o novo conjunto será:
\[ x_1 \cdot k, x_2 \cdot k, \ldots, x_n \cdot k \]
A nova média \(\mu(x \cdot k)\) será:
\[ \mu(x \cdot k) = \frac{1}{n} \sum_{i=1}^{n} (x_i \cdot k) \]
Usando a propriedade distributiva da multiplicação:
\[ \mu(x \cdot k) = \frac{1}{n} \cdot k \sum_{i=1}^{n} x_i \]
\[ \mu(x \cdot k) = k \cdot \frac{1}{n} \sum_{i=1}^{n} x_i \]
\[ \mu(x \cdot k) = k \cdot \mu(x) \]
### Exemplo prático: Vamos criar um conjunto de dados de
temperatura, com distribuição normal, e realizar a operação de soma de
uma constante k para ver o efeito na média e na distribuição.
# Pacotes necessários
library(dplyr)
# Definindo seed para reprodutibilidade
set.seed(123)
# Gerando dados de temperatura com distribuição normal
n <- 100
temperatura <- rnorm(n, mean = 25, sd = 5) # Média de 25°C, desvio padrão de 5
# Somando uma constante k = 3
k <- 3
temperatura_somada <- temperatura + k
# Definindo função para criar tabela de frequência usando Regra de Sturges
criar_tabela_frequencia <- function(dados) {
# Calculando o número de classes com a Regra de Sturges
num_classes <- ceiling(1 + log2(length(dados)))
# Usando hist() para criar intervalos de classe
hist_data <- hist(dados, breaks = num_classes, plot = FALSE)
# Criando tabela de frequência
tabela_frequencia <- data.frame(
Intervalo = paste(hist_data$breaks[-length(hist_data$breaks)],
hist_data$breaks[-1], sep = " - "),
Frequencia = hist_data$counts
)
return(tabela_frequencia)
}
# Tabelas de frequência antes e depois da soma da constante
tabela_original <- criar_tabela_frequencia(temperatura)
tabela_somada <- criar_tabela_frequencia(temperatura_somada)
# Exibindo as tabelas de frequência
tabela_original
## Intervalo Frequencia
## 1 10 - 15 1
## 2 15 - 20 13
## 3 20 - 25 34
## 4 25 - 30 35
## 5 30 - 35 14
## 6 35 - 40 3
tabela_somada
## Intervalo Frequencia
## 1 15 - 20 3
## 2 20 - 25 19
## 3 25 - 30 42
## 4 30 - 35 28
## 5 35 - 40 8
A média original do conjunto de dados de temperatura é μ(x) e, após a soma da constante k=3, a nova média é μ(x+k).
### Histograma antes e depois da soma da constante:
# Pacote para visualização
library(ggplot2)
# Plotando os histogramas
p1 <- ggplot(data.frame(temperatura), aes(x = temperatura)) +
geom_histogram(binwidth = 5, fill = "skyblue", color = "black") +
ggtitle("Histograma - Temperatura Original") +
xlab("Temperatura (ºC)") +
ylab("Frequência") +
theme_minimal()
p2 <- ggplot(data.frame(temperatura_somada), aes(x = temperatura_somada)) +
geom_histogram(binwidth = 5, fill = "salmon", color = "black") +
ggtitle("Histograma - Temperatura Após Soma de k = 3") +
xlab("Temperatura (ºC)") +
ylab("Frequência") +
theme_minimal()
# Exibindo os dois gráficos lado a lado
library(gridExtra)
grid.arrange(p1, p2, ncol = 2)