Numero de caras = NC

NC = 470:610 plot(NC, dbinom(NC, size = 1000, prob = .541), type=‘h’)

H0: p = 0,5

H1: p != 0,5

!= significa desigual

Vamos utilizar o teste de proporção

Escolher o nível de significância: É chamado de alpha

alpha = 0,5

Realizar o teste

prop.test(541,1000,conf.level = 0.95)

Resultado:

1-sample proportions test with continuity correction

data: 541 out of 1000, null probability 0.5 X-squared = 6.561, df = 1, p-value = 0.01042 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.5095159 0.5721653 sample estimates: p 0.541

Rejeitar ou não a hipótese nula (H0, que é a hipotese de que a moeda é honesta)

Rejeito H0, logo a moeda é viciada/desonesta

Porque entre 0,51 e 0,57 é o valor de flutuação, e o 0,5 não está no meio desses valores, logo, a moeda está em um extremo e é viciada.

#——————————————————

N = 10000 p = 5030

Essa moeda é honesta?

Primeiro passo

# H0: p = 0,5 # H1: p != 0,5 # alpha = 0,05

prop.test(5030,10000,conf.level = 0.95)

1-sample proportions test with continuity correction

data: 5030 out of 10000, null probability 0.5 X-squared = 0.3481, df = 1, p-value = 0.5552 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.4931511 0.5128466 sample estimates: p 0.503

Conclusão: Essa moeda é honesta, pois o valor está entre o valor de

#flutuação/intervalo de confiança, o 0,5 está entre 0,49 e 0,51. Ou seja, não rejeita H0.

Há também outra regra, a regra do pvalor/p.value

Quanto menor o pvalor, mais forte a evidência de H0.

Na prática comparamos o pvalor com o alpha.

Se o pvalor for menor ou igual a alhpha eu rejeito o h0:

Se p.valor <= alpha Rej H0

se o valor for maior do que alpha eu não rejeito o h0

Se p.valor > alpha NÃO rej H0

alpha = 0.05 p.valor = 0.5552

Como o pvalor é maior que alpha, não rej H0

A nossa moeda é honesta!

#——————————————————————

7 Caras em 10 lançamentos

A moeda é honesta?

H0: p = 0,5

H1: p != 0,5

alpha = 0,05

prop.test(7,10,conf.level = 0.95)

1-sample proportions test with continuity correction

data: 7 out of 10, null probability 0.5 X-squared = 0.9, df = 1, p-value = 0.3428 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.3536707 0.9190522 sample estimates: p 0.7

Logo, a moeda é honesta, pvalor > alpha, não rejeito H0

#—————————————————————-

library(readxl) QE <- read_excel(“C:/Users/18112914737/Downloads/Questionario_Estresse.xls”) View(QE)

load(“C:/Users/18112914737/Downloads/CARROS.RData”) summary(CARROS)

Quero testar se o aluno é nota 7

0 - 10 (variavel quantitativa continua)

H0: média = 7

H1: média != 7

alpha: 0,05

Se meu pvalor for menor ou igual a alpha, ou seja 0,05, eu rejeito H0

Se pvalor <= 0,05 REJ H0

Se pvalor for > 0,05, eu NÃO Rej H0

Teste

?t.test()

options(scipen = 999) t.test(QE$Desempenho, mu = 7, conf.level = 0.95)

Resultado:

One Sample t-test

data: QE$Desempenho t = 20.036, df = 94, p-value < 0.00000000000000022 alternative hypothesis: true mean is not equal to 7 95 percent confidence interval: 8.435849 8.751730 sample estimates: mean of x 8.593789

o pvalor é muito menor que o alpha, logo, a hipótese nula(H0) é rejeitada. Ou seja, a média não é 7.

E usando o intervalo de confiança o 7 também não é contemplado dentro desse intervalo de confiança.

Como o valor é menor do que alpha, eu REJ H0

mesmo de fosse um alpha de 0,01, eu ainda rejeitaria o H0.

#———————————————————– # O que é esse alpha?

É o rigor do nosso teste.

Erro do tipo 1 e erro do tipo 2

O erro do tipo 1 é pior, é como se fosse condenar o inocente (mais rigoroso)

Rejeitar a hipótese nula, dado que é verdadeira. Consequencia desse erro pode ser grande.

O erro do tipo 2 é como não condenar o culpado(menos rigoroso).

Fixamos o alpha em 5% porque

O alpha depende do tamanho das consequências, nas ciencias sociais nós temos uma tolerância

maior ao erro. Devido também a dificuldade de mensurar as coisas nas

ciencias sociais.

Rejeitar a hipótese nula ou não rejeitar a hipótese nula

Não culpado não é a mesma coisa de inocente.

Rejeitar a hipotese nula(h0) não é a mesma coisa de aceitar a h0

É NESSESSÁRIO DIZER QUE: REJEITO HIPÓTESE NULA OU NÃO REJEITO A HIPÓTESE NULA!!!!

É NECESSÁRIO TAMBÉM FAZER O TESTE DE HIPÓTESE NO SEMINÁRIO.

#—————————————————

A média do estresse é igual a 30?

H0: média(mu = letra grega mi) = 30

H1: média != 30

alpha: 0,05 (5%)

t.test(QE$Estresse, mu=30, conf.level = 0.95)

p-value = 0.005913 alpha = 0,05

Como o valor é menor que alpha, rejeito H0.

Em média, esses alunos não tem estresse igual a 30

Poderia formular que 30 pode ser burnout

Horas de estudo, quero saber se em média os estudantes estudam 30horas por semana

H0: mu = 30

H1: média != 30

alpha: 0,01 (mais rigoroso)

t.test(QE$Horas_estudo, mu=30, conf.level = 0.99)

p-value = 0.3331 alpha = 0.01

a um nível de 0,01 não rejeito h0, logo as horas de estudo podem ser 30 Como o valor é maior que alpha, não rejeito H0.

#———————————————– # Testes nba base de dados carros

Km por litro Mean: 18

H0: mu = 18

H1: média != 18

#alpha = 0,05

t.test(CARROS$Kmporlitro, mu=18, conf.level = 0.95)

p-value = 0.05876 alpha = 0,05

Como pvalor é maior que o alpha, não rejeito H0; Logo é razoável que a média pode ser 18

Preço

H0: mu = 200

H1: média != 200

#alpha: 0,05

t.test(CARROS$Preco, mu=200, conf.level = 0.95)

p-value = 0.1708 alpha = 0,05

Como o pvalor é maior que o alpha, a H0 não é rejeitada Logo, pode ser 200.

Se pvalor <= 0,05 REJ H0

Se pvalor for > 0,05, eu NÃO Rej H0

Como

Hp

H0: mu = 150

H1: média != 150

alpha = 0,05

t.test(CARROS$HP, mu=150, conf.level = 0.95)

p-value = 0.7864 alpha = 0,05

Como o pvalor é maior que alpha, então a H0 não é rejeitada.

amperagem: mean: 3.2

H0: mu = 3.2

H1: média != 3.2

alpha = 0,05

t.test(CARROS$Amperagem_circ_eletrico, mu=3.2, conf.level = 0.95)

p-value = 0.7864 alpha = 0,05

Como o pvalor é maior dp que alpha, então H0 não é rejeitada.

#—————————————- for(i 1:N) t.test(i, mu=j, con) }

#—————————————– Nível de significância é o pvalor.

names(CARROS)

variaveis = c(“Kmporlitro”,“Cilindros”,“Preco” ,“HP”,“Amperagem_circ_eletrico”,“Peso”,“RPM”)

variaveis2 =

medias = c(18, 3, 200, 150, 3.2, 1, 7)

library(dplyr)

N <- 7 for (variaveis in 1:7) { CARROS %>% select(variaveis(i)) %>% t.test(CARROS$Variaveis(i),mu=medias(i), conf.level = 0.95)}

#—————————————-

Pacote speechbr

Pacote que traz taquilografias(?) do site do congresso nacional

library(speechbr) library(wordcloud2) library(tibble) library(tidytext)

?speech_data

deputados <- speech_data( keyword = “desigualdade”, start_date = “2021-12-10”, end_date = “2023-06-07”)

podíamos fazer uma análise se há alguma movimentação no congresso nacionhal que se preocupe com a distribui8ção de faculdades no rio de janeiro

stop_words <- get_stopwords(“pt”)

outras_palavras <- tibble(word=“é”, lexicon = “steven”)

stop_words = stop_words %>% add_row(outras_palavras)

deputados %>% tibble::rowid_to_column(‘id’) %>% select(id, discurso) %>% unnest_tokens(word, discurso) %>% group_by(word) %>% count(word, sort = TRUE) %>% wordcloud2::wordcloud2()

anti join é tudo que está em A mas não está em B, tudo que é palavra mas não é stop_words