Numero de caras = NC
NC = 470:610 plot(NC, dbinom(NC, size = 1000, prob = .541), type=‘h’)
!= significa desigual
prop.test(541,1000,conf.level = 0.95)
Resultado:
1-sample proportions test with continuity correction
data: 541 out of 1000, null probability 0.5 X-squared = 6.561, df = 1, p-value = 0.01042 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.5095159 0.5721653 sample estimates: p 0.541
Porque entre 0,51 e 0,57 é o valor de flutuação, e o 0,5 não está no meio desses valores, logo, a moeda está em um extremo e é viciada.
#——————————————————
N = 10000 p = 5030
# H0: p = 0,5 # H1: p != 0,5 # alpha = 0,05
prop.test(5030,10000,conf.level = 0.95)
1-sample proportions test with continuity correction
data: 5030 out of 10000, null probability 0.5 X-squared = 0.3481, df = 1, p-value = 0.5552 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4931511 0.5128466 sample estimates: p 0.503
#flutuação/intervalo de confiança, o 0,5 está entre 0,49 e 0,51. Ou seja, não rejeita H0.
Há também outra regra, a regra do pvalor/p.value
Quanto menor o pvalor, mais forte a evidência de H0.
Na prática comparamos o pvalor com o alpha.
Se p.valor <= alpha Rej H0
Se p.valor > alpha NÃO rej H0
alpha = 0.05 p.valor = 0.5552
#——————————————————————
prop.test(7,10,conf.level = 0.95)
1-sample proportions test with continuity correction
data: 7 out of 10, null probability 0.5 X-squared = 0.9, df = 1, p-value = 0.3428 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.3536707 0.9190522 sample estimates: p 0.7
#—————————————————————-
library(readxl) QE <- read_excel(“C:/Users/18112914737/Downloads/Questionario_Estresse.xls”) View(QE)
load(“C:/Users/18112914737/Downloads/CARROS.RData”) summary(CARROS)
0 - 10 (variavel quantitativa continua)
?t.test()
options(scipen = 999) t.test(QE$Desempenho, mu = 7, conf.level = 0.95)
Resultado:
One Sample t-test
data: QE$Desempenho t = 20.036, df = 94, p-value < 0.00000000000000022 alternative hypothesis: true mean is not equal to 7 95 percent confidence interval: 8.435849 8.751730 sample estimates: mean of x 8.593789
o pvalor é muito menor que o alpha, logo, a hipótese nula(H0) é rejeitada. Ou seja, a média não é 7.
E usando o intervalo de confiança o 7 também não é contemplado dentro desse intervalo de confiança.
#———————————————————– # O que é esse alpha?
Rejeitar a hipótese nula, dado que é verdadeira. Consequencia desse erro pode ser grande.
Não culpado não é a mesma coisa de inocente.
Rejeitar a hipotese nula(h0) não é a mesma coisa de aceitar a h0
É NESSESSÁRIO DIZER QUE: REJEITO HIPÓTESE NULA OU NÃO REJEITO A HIPÓTESE NULA!!!!
É NECESSÁRIO TAMBÉM FAZER O TESTE DE HIPÓTESE NO SEMINÁRIO.
#—————————————————
t.test(QE$Estresse, mu=30, conf.level = 0.95)
p-value = 0.005913 alpha = 0,05
Como o valor é menor que alpha, rejeito H0.
Em média, esses alunos não tem estresse igual a 30
Poderia formular que 30 pode ser burnout
t.test(QE$Horas_estudo, mu=30, conf.level = 0.99)
p-value = 0.3331 alpha = 0.01
a um nível de 0,01 não rejeito h0, logo as horas de estudo podem ser 30 Como o valor é maior que alpha, não rejeito H0.
#———————————————– # Testes nba base de dados carros
Km por litro Mean: 18
#alpha = 0,05
t.test(CARROS$Kmporlitro, mu=18, conf.level = 0.95)
p-value = 0.05876 alpha = 0,05
Como pvalor é maior que o alpha, não rejeito H0; Logo é razoável que a média pode ser 18
Preço
#alpha: 0,05
t.test(CARROS$Preco, mu=200, conf.level = 0.95)
p-value = 0.1708 alpha = 0,05
Como o pvalor é maior que o alpha, a H0 não é rejeitada Logo, pode ser 200.
Como
Hp
t.test(CARROS$HP, mu=150, conf.level = 0.95)
p-value = 0.7864 alpha = 0,05
Como o pvalor é maior que alpha, então a H0 não é rejeitada.
amperagem: mean: 3.2
t.test(CARROS$Amperagem_circ_eletrico, mu=3.2, conf.level = 0.95)
p-value = 0.7864 alpha = 0,05
Como o pvalor é maior dp que alpha, então H0 não é rejeitada.
#—————————————- for(i 1:N) t.test(i, mu=j, con) }
#—————————————– Nível de significância é o pvalor.
names(CARROS)
variaveis = c(“Kmporlitro”,“Cilindros”,“Preco” ,“HP”,“Amperagem_circ_eletrico”,“Peso”,“RPM”)
variaveis2 =
medias = c(18, 3, 200, 150, 3.2, 1, 7)
library(dplyr)
N <- 7 for (variaveis in 1:7) { CARROS %>% select(variaveis(i)) %>% t.test(CARROS$Variaveis(i),mu=medias(i), conf.level = 0.95)}
#—————————————-
Pacote speechbr
Pacote que traz taquilografias(?) do site do congresso nacional
library(speechbr) library(wordcloud2) library(tibble) library(tidytext)
?speech_data
deputados <- speech_data( keyword = “desigualdade”, start_date = “2021-12-10”, end_date = “2023-06-07”)
podíamos fazer uma análise se há alguma movimentação no congresso nacionhal que se preocupe com a distribui8ção de faculdades no rio de janeiro
stop_words <- get_stopwords(“pt”)
outras_palavras <- tibble(word=“é”, lexicon = “steven”)
stop_words = stop_words %>% add_row(outras_palavras)
deputados %>% tibble::rowid_to_column(‘id’) %>% select(id, discurso) %>% unnest_tokens(word, discurso) %>% group_by(word) %>% count(word, sort = TRUE) %>% wordcloud2::wordcloud2()
anti join é tudo que está em A mas não está em B, tudo que é palavra mas não é stop_words