Objetivo:

Essa atividade consiste em resumir os 2 primeiros capítulos da obra “Métodos Estatísticos para as Ciências Sociais”, de autoria de Alan Agresti e Barbara Finley

Capítulo 1

O capítulo se inicia na busca de trasmitir ao leitor a importância do Método Estatístico para o dia a dia dos cientistas sociais. Cada vez mais o vemos ser incorporado às áreas de Ciências Humanas, para colaborar nas análises de bancos de dados. Isto pode se dar ao fato de que muitos Cientistas Sociais ingressaram em órgãos do governo que necessitavam indivíduos capazes de entender e formular relatórios qualitativos e quantitativos. Além disso, a iniciativa privada encaminha seu desejo de contratar profissionais de humanas que detenham o conhecimento estatístico.

(Na minha opinião, existe também o próprio desenvolvimento da Ciência/Academia, fortalecendo lanços de interdisciplinariedade e retirando os antigos rótulos de “disciplinas auxiliares”. A própria Ciência Política e Antropoologia conseguem se desenvolver como disciplinas independentes, como a Estatística o faz dentro do campo da Matetática).

Os Cientistas Sociais podem se utilizar de um levantamento de informações com características específicas para embasar e desenvolver suas pesquisas. Esse mecanismo recebe o nome de Banco de Dados e pode ser criado pelo mesmo ou retirado de terceiros (é muito comum dentre estudantes de Comportamento Eleitoral se utilizarem das Pesquisas de Opinião Pública, como IBOPE e DATAFOLHA).

A Estatística é definida como um conjuto de métodos para obter e analisar dados. Ela fornece um delineamento - isto é - a orientação para obtenção de dados de pesquisa; apresenta uma descrição com o resumo dos dados; Realiza Inferência, que se trata de traçar previsões baseada nos dados. Quando estudamos um banco de dados, encontramos os sujeitos que lá estão. Para isso, faz-se importante a distinção entre População e Amostra. A população seria todo o universo que buscamos manipular, mas por razões quaisquer que sejam (limitações de tempo e espaço, ou não necessidade de submissão de um grupo inteiro ao teste), optamos por fazer um recorte do conjunto e criar um subconjunto específico que chamamos de Amostra (Um exemplo de estudo com a população é o Censo; um exemplo de estudo com a amostra são as pesquisas de opinião pública).

  • A Estatística Descritiva vai tratar primordialmente do resumo dos dados do banco para apresentá-lo de forma clara e reduzida. São exemplos de tal fenômeno os gráficos, tabelas, estudos de média, moda e desvio padrão. (no R, principalmente as operações com a função “table”, “mean”, “Plot” e “sd”).

  • A Estatística Inferencial aborda previsões sobre a população, baseados nos dados de uma amostra da mesma. São exemplos de tal fenômeno os testes de associação e correlação de variáveis para afirmarem futuramente uma relação ou não de dois ou mais aspectos (ex: traçar a correlação entre voto e renda para inferir que pessoas da Classe X tendem a votar no Cadidato A, e pessoas da Classe Y tendem a votar no Candidato B; No R, os comandos utilizados podem ser “chisq.test”, “cor.test”, etc, a depender do tipo e quantidade das variáveis). Os parâmetros são resumos númericos da população, enquanto que a estatística é um resumo numérico dos dados amostrais.

Capítulo 2

Para realizarmos a análise Estatística Descritiva e Inferencial temos de estabelecer os dados amostrais e seus respectivos sujeitos. Por isso, é de suma importância selecionar com cuidado como e quais fenômenos serão estudados. Dentro da estatística atribuímos conceitos para tal:

  • Validade: descrição exata do que se pretende estudar;
  • Credibilidade: capacidade de replicar o mesmo elemento, caso seja novamente submetido a teste;
  • Instrumentalidade: justificativa para um resultado diferente observado.

As variáveis são características do sujeito que podem ser mensuradas, isto é,que são dignas de manipulação (no sentido de cálculo). Elas podem ou não terem valores iguais entre os sujeitos de uma população ou amostra, onde sujeitos diferentes podem ter valores distintos para a mesma variável.

A primeira divisão que fazemos entre as variáveis é se elas são quantitativas ou categóricas. As quantitativas expressam valores numéricos em sua mensuração.As variáveis Categóricas (também chamadas de Qualitativas) apresentam características mensuráveis através de expressões linguísticas (obs: não vincular necessariamente um aspecto à uma variável específica. Por exemplo, idade geralmente é um número e, portanto uma variável quantitativa, mas se fizermos um estudo com faixas etárias - como “de 10 a 20 anos”; “60 anos ou mais” -, essa variável passa a ser qualitativa).

As variáveis podem apresentar 3 escalas de mensuração: Nominal, Ordinal ou Intervalar.

  • As variáveis quantitativas geralmente se organizam na escala intervalar, que apresenta distâncias numéricas específicas entre cada nível.

  • As variáveis qualitativas podem ser de 2 tipos: Ordinal (caso os elementos apresentem uma ordem natural de valores, a exemplo as faixas etárias mencionadas anteriormente, bem como as divisões que se utilizam de termos como “Alto”, “Médio”, “Baixo”,“Bom”, “Regular”, “Ruim”) ou Nominal (quando a ordem em que os fatores aparecem não alteram a mensuração. ex: uma variável que trate do curso de graduação que os alunos apresentam).

As variáveis podem também se bifurcar em Discretas (quando apresentam valores que formam um conjunto separado de números; ex: número de filhos) e Contínuas (quando formam conjuntos com valores muito distintos e não específicos, com intervalos infinitos de vários valores; ex: peso e altura).

Um ponto a ser observado é a aleatoriedade dos dados. É importante que durante a análise estatística cada sujeito (linha do banco) tenha tanta probabilidade de ser selecionado quanto as demais. Ao gerar um grupo amostral, portanto, você deve numerar os sujeitos e gerá-lo através de números aleatórios. Para o levantamento de dados podemos utilizar o mesmo método para selecionar aleatoriamente os sujeitos a serem acrescentados ao campo amostral (o exemplo dado é a aleatoriedade dos dígitos de telefone para a discagem digital aleatória que definem quem será entrevistado).

Dentro da área das Ciências Sociais é comum nos depararmos com Estudos Observacionais, uma vez que raramente se torna possível manipular experimentalmente os sujeitos. O pesquisador têm acesso às respostas do questionário, mas não à pessoa em si, por isso é difícil se traçar comparativos entre grupos, pois pode haver uma outra variável explicativa a qual não se tem acesso pelas informações do banco. Caí-se, logo, em um dilema de causa x efeito. Temos um problema mas não sabemos explicar o fenômeno com as variáveis disponíveis.

O Erro Amostral pode ocorrer nesse momento em que existe a seleção dos sujeitos para o grupo amostral, onde pesquisadores com o mesmo banco geram grupos distintos e podem chegar a resultados diferentes.Então, o erro pode ser visto e calculado com a variação do parâmetro obtido pelo seu grupo amostral e o resultado da população/universo. Daí a relevância de se ter uma amostragem probabilística (já mencionada onde a chance de um sujeito dentre um grupo n têm uma probabilidade conhecida e igual de ser selecionado). Em análises não probabilísticas podemos encontrar, além dos erros amostrais, uma tendenciosidade amostral. Outros exemplos são a Amostragem Voluntária (onde as pessoas que pedem para fazer parte) e as Respostas Tendenciosas (quando se tem uma pergunta mal colocada; ex: perguntas que começam na negativa) e os Dados Faltosos (algumas perguntas vêm sem resposta).