#Dessa vez não temos formulário. É só esse RMD aqui mesmo.

Questão 1

a) Qual a diferença entre estatística t, distribuição t e teste t?
b) Qual a diferença entre razão F, distribuição F e teste F?

resposta_a <- “a) A diferença entre estatística t, distribuição t e teste t é:

Estatística t: é o valor calculado a partir da amostra, usado para testar hipóteses sobre a média de uma população, considerando a variabilidade e o tamanho da amostra.

Distribuição t: é uma distribuição de probabilidade que se aproxima da distribuição normal à medida que o tamanho da amostra aumenta. É usada para modelar a estatística t sob a hipótese nula.

Teste t: é um teste estatístico que utiliza a estatística t para verificar se existe uma diferença significativa entre a média de uma amostra e a média da população ou entre as médias de duas amostras.”

resposta_b <- “b) A diferença entre razão F, distribuição F e teste F é:

#Razão F: é a razão entre duas variâncias, usada para comparar a variabilidade entre dois grupos ou modelos.

#Distribuição F: é uma distribuição de probabilidade usada para modelar a razão F em testes de hipóteses, geralmente em análise de variância (ANOVA).

#Teste F: é um teste estatístico que utiliza a razão F para testar a hipótese de que as variâncias de dois ou mais grupos são iguais.*

Para as questões 2-5

Resolva cada as questões explicitando quais são as hipóteses, desenhando a distribuição das estatísticas esperadas pela H0 e incluindo nesse desenho os valores críticos e observados nas escalas de valor bruto e na escala de erro padrão. Mostre como obteve cada um desses valores e qual a decisão tomada. Confira se você fez o exercício bem usando a função do R que executa esse teste.

Questão 2

Uma empresa propagandeia que a média ± desvio padrão do tempo de espera para atendimento dos clientes é de 10 minutos. Foram amostrados 9 casos e foi observada espera média de 14 minutos com desvio padrão de 6 minutos.
foto
a) Há evidência suficiente para dizer que o tempo de espera médio difere do que afirma a empresa?

Definindo os dados

media_amostral <- 14 media_populacional <- 10 desvio_padrao_amostral <- 6 tamanho_amostra <- 9

Calculando a estatística t

t <- (media_amostral - media_populacional) / (desvio_padrao_amostral / sqrt(tamanho_amostra)) t

Calculando o valor crítico para 8 graus de liberdade e nível de significância 0,05 (teste bilateral)

valor_critico <- qt(0.975, df = tamanho_amostra - 1) valor_critico

Decisão

if (abs(t) > valor_critico) { resultado <- “Rejeitar H0” } else { resultado <- “Não rejeitar H0” } resultado

#H0: A média do tempo de espera é 10 minutos (μ = 10). #H1: A média do tempo de espera é diferente de 10 minutos (μ ≠ 10). #Usando a fórmula da estatística do teste t: Temos o resultado igual a 2. Para um teste bilateral com nível de significância de 0,05 e 8 graus de liberdade, o valor crítico t é ±2,306. Como o valor calculado (t = 2) não ultrapassa o valor crítico, não rejeitamos a hipótese nula.

b) A empresa afirma que o desvio padrão é de 4 minutos. Há evidência suficiente para dizer que o desvio padrão do tempo de espera difere do que afirma a empresa?
Obs: seus resultados precisam estar de acordo com o gabarito abaixo.
Resposta

Definindo os dados

desvio_padrao_populacional <- 4 desvio_padrao_amostral <- 6 tamanho_amostra <- 9

Calculando a estatística qui-quadrado

qui_quadrado <- (tamanho_amostra - 1) * (desvio_padrao_amostral^2) / (desvio_padrao_populacional^2) qui_quadrado

Calculando os valores críticos para 8 graus de liberdade e nível de significância 0,05 (teste bilateral)

valor_critico_inferior <- qchisq(0.025, df = tamanho_amostra - 1) valor_critico_superior <- qchisq(0.975, df = tamanho_amostra - 1) valor_critico_inferior valor_critico_superior

Decisão

if (qui_quadrado < valor_critico_inferior | qui_quadrado > valor_critico_superior) { resultado <- “Rejeitar H0” } else { resultado <- “Não rejeitar H0” } resultado

#H0: O desvio padrão é 4 minutos #H1:O desvio padrão é diferente de 4 minutos #Utilizando a fórmula do qui quadrado podemos verificar que devemos rejeitar HO

Questão 3

Um pesquisador quer comparar a satisfação no trabalho entre empregados de duas empresas diferentes. Ele coleta uma amostra aleatória de 13 empregados de cada empresa e obtém os seguintes escores de satisfação (de 1 a 10):
Empresa X: 8, 3, 7, 9, 5, 9, 8, 6, 7, 6, 5, 6, 6
Empresa Y: 7, 6, 5, 6, 6, 4, 6, 5, 4, 5, 5, 2, 2
foto
Resposta # Dados das amostras empresa_x <- c(8, 3, 7, 9, 5, 9, 8, 6, 7, 6, 5, 6, 6) empresa_y <- c(7, 6, 5, 6, 6, 4, 6, 5, 4, 5, 5, 2, 2)

Cálculo das médias e desvios padrão

media_x <- mean(empresa_x) media_y <- mean(empresa_y)

desvio_x <- sd(empresa_x) desvio_y <- sd(empresa_y)

Exibindo as médias e desvios padrão

cat(“Média da Empresa X:”, media_x, “”) cat(“Média da Empresa Y:”, media_y, “”) cat(“Desvio Padrão da Empresa X:”, desvio_x, “”) cat(“Desvio Padrão da Empresa Y:”, desvio_y, “”)

Realizando o teste t para duas amostras independentes

teste_t <- t.test(empresa_x, empresa_y)

Exibindo o resultado do teste t

cat(“do teste t:”) print(teste_t)

Interpretação do p-valor

if (teste_t$p.value < 0.05) { cat(“a hipótese nula: Existe diferença significativa entre as médias das empresas.”) } else { cat(“rejeitamos a hipótese nula: Não existe diferença significativa entre as médias das empresas.”) }

#Rejeitamos a hipótese nula: Existe diferença significativa entre as médias das empresas.

Questão 4

A média ± desvio padrão da velocidade dos grupos de cães tomando os aditivos “Happy-Horse” (R$200/dose) e “Ultra-Urso” (R$20/dose) são, respectivamente 79 ± 10 km/h (n= 31) e 76 ± 11 km/h (n=29).
foto
Você quer que seus cães recebam do bom e do melhor e sejam vitoriosos na corrida, mas também não quer desperdiçar dinheiro. Que aditivo você deve usar? Justifique sua resposta.
Resposta

Definindo os dados

media_1 <- 79 desvio_1 <- 10 n_1 <- 31

media_2 <- 76 desvio_2 <- 11 n_2 <- 29

Calculando o valor t

t_value <- (media_1 - media_2) / sqrt((desvio_1^2 / n_1) + (desvio_2^2 / n_2)) t_value

Calculando o grau de liberdade (df) com a fórmula de Welch

df <- ((desvio_1^2 / n_1 + desvio_2^2 / n_2)^2) / (((desvio_1^2 / n_1)^2) / (n_1 - 1) + ((desvio_2^2 / n_2)^2) / (n_2 - 1)) df

Calculando o valor-p

p_value <- 2 * (1 - pt(abs(t_value), df)) p_value

#Como p valor é maior do que 0.05, nâo rejeitamos H0

Questão 5

Um pesquisador quer comparar a variabilidade na duração do sono entre dois grupos de pacientes: um grupo que recebeu terapia cognitivo-comportamental (TCC) e outro grupo que recebeu terapia medicamentosa. Ele mede a duração do sono (em horas) de 15 pacientes de cada grupo:
TCC: 4.4, 5.3, 6.3, 6.1, 6.9, 4.7, 7.2, 6.8, 5.8, 6.1, 7.0, 7.4, 6.4, 5.7, 6.3
Medicamento: 5.0, 7.7, 6.8, 7.9, 8.0, 7.1, 7.8, 6.0, 8.7, 7.0, 6.9, 7.0, 8.0, 6.9, 8.4
foto

Resposta

Dados dos grupos

TCC <- c(4.4, 5.3, 6.3, 6.1, 6.9, 4.7, 7.2, 6.8, 5.8, 6.1, 7.0, 7.4, 6.4, 5.7, 6.3) Medicamento <- c(5.0, 7.7, 6.8, 7.9, 8.0, 7.1, 7.8, 6.0, 8.7, 7.0, 6.9, 7.0, 8.0, 6.9, 8.4)

Calcular as médias dos grupos

media_TCC <- mean(TCC) media_Medicamento <- mean(Medicamento)

Calcular as variâncias dos grupos

var_TCC <- var(TCC) var_Medicamento <- var(Medicamento)

Calcular a estatística F (variância de TCC dividida pela variância de Medicamento)

F_observado <- var_TCC / var_Medicamento

Graus de liberdade dos grupos

df_TCC <- length(TCC) - 1 # 15 - 1 = 14 df_Medicamento <- length(Medicamento) - 1 # 15 - 1 = 14

Calcular o valor crítico de F usando a distribuição F

Significância de 0.05, com 14 graus de liberdade para cada grupo

F_critico <- qf(0.95, df_TCC, df_Medicamento)

Resultados

media_TCC media_Medicamento var_TCC var_Medicamento F_observado F_critico

Comparação entre o valor observado e o valor crítico

if (F_observado > F_critico) { resultado <- “Rejeita-se a hipótese nula: as variâncias são diferentes.” } else { resultado <- “Não rejeita-se a hipótese nula: as variâncias são iguais.” }

resultado