Apresentação

Neste curso iremos aprender como realizar as análise estatisticas de dados obtidos por meio de questionários com escalas de likert.

Na primeira aula, recordaremos algumas noções básicas sobre variáveis e introduziremos o conceito de variável latente, muito usado em pesquisas nas Ciências humanas. Também serão apresentadas as escalas de atitudes mais comuns, com ênfase na escala de likert, objeto desse curso.

Na segunda aula, serão apresentados o R, o R-studio e serão introduzidos os conceitos básicos para utilizar o R na pesquisa em educação. Ainda nessa seção aprenderemos a reelizar análises descritivas e testes de hipóteses mais comuns como, por exemplo, o test t e a anova.

Na terceira aula, vamos focar nas análises descritivas que podem ser feitas nas escalas de likert com ênfase nos pacotes likert e psych.

Na quarta aula iniciaremos o estudo de Análise Fatorial com uma breve introdução teórica seguida da implementação prática da Análise Fatorial Exploratória (EFA) utilizando o pacote psych.

Na quinta aula, abordaremos a Análise Fatorial Confirmatória (CFA) no R utilizando o pacote lavaan.

Na sexta aula focaremos a técnica de Modelagem de Equações Estruturais (SEM), também com o pacote lavaan.

Na sétima aula, faremos uma pequena introdução à Teoria da Resposta ao Item (TRI) e seus ussos na pesquisa em educação. Para essa aula serão utilizados os pacotes mirt.

Em todas aulas serão sugeridos artigos ou livros para aprofundamento dos temas.


Pesquisa com Questionário

É possível realizar pesquisas utilizando questionários em qualquer área do conhecimento desde que sejam levados em conta os problemas e objetivos da pesquisa. Nem todo problema de pesquisa pode ser respondido com o uso de questionários.

Em educação, os questionários são muito usados para fazer pesquisas relacionadas à percepção e atitudes em relação à um tema específico. Por exemplo, é possível inveestigar, por meio de questioários, as percepções e atitudes de professores em relação à educação inclusiva e se existe alguma variável preditora dessas percepções e atitudes.

Em geral, para avalair atitudes e percepções, são usadas escalas de Likert sobre as quais nos aprofundaremos mais adiante.

De maneira geral, os questionários são compostos por algumas seções. Uma delas, geralmente a primeira a aparecer, coleta informações básicas sobre os respondentes como idade, formação, anos de experiência, entre outras.

Em outra seção do questionário são adicionados os ítens (questões) relacionados ao problema de epsquisa que está sendo investigado. Por exemplo, se a pesquisa for sobre educação inclusiva, esta seção trará itens relacionados a esse tema. É possível adicionar uma escala de atitudes, como a escala de Likert, para avaliar a atitudes dos professores em relação ao problema de pesquisa. É possivel adicionar quantas seções forem necessárias para abordar o problema ou problemas de pesquisa.

Finalmente, é muito comum adicionar uma seção socioeconômica ao final do quesqionário. Em geral essa seção contem itens sensíveis quee devem ser de resposta opcional. Como sugestão, para isso, é possivel utilizar o Critério Brasil que é publicado pela ABEP (Associação Brasileira de Empresas de Pesquisa).


Tipos de Variáveis

Uma variável, de maneira simples, é qualquer característica de interesse que varia entre os elementos de uma população. Por exemplo, em uma pesquisa em educação, a ansiedade é considerada uma variável que pode influenciar no desempenho escolar, que por sua vez também é uma variável. Diferentes pessoas têm diferentes níveis de ansiedade que podem ser medidos de diversas maneiras. Diferentes pessoas podem ter diferentes desempenhos escolares. Será que existe alguma relação entre essas variáveis? Caso exista, como seria essa relação?

A seguir veremos os tipos mais comuns de variáveis. É importante notar que o entendimento sobre varáveis é extremamente importante pois há determinados tipos de pacotes e funções no R que pedem que as variáveis sejam de determinado tipo para funcionar.

Variáveis Categóricas

As variáveis categóricas são aqueles que atribuem um nome às coisas. Essa é uma forma muito simples de definir, mas ajuda a começar a entender o conceito.

Um exemplo de variável categórica é o nome das pessoas como Pedro, Maria e João. Porém, de maneira geral, essa variável não tem muita utilidade em uma pesquisa, pois os nomes costuma ser substituidos por outra variável categórica de identificação (id). Assim, em um banco de dados, cada pessoa vai receber uma id. A primeira pessoa que responder o questionário receberá a id 001, a segunda pessoa receberá 002 e assim por diante. Perceba que a variável categórtica tanto pode ser uma palavra quanto um número.

São exemplos de variáveis categóricas a religião, a cor da pele, o local de nascimento, a formação educacional, o nível de escolaridade, o CEP, o CPF, o número de telefone, enre outras.

As variáveis categóricas podem ser diferenciadas em nominais e em ordinais.

As variáveis categóricas nominais têm valores que são nomes. Por exemplo, a variável “religião” pode ser composta pelos senguintes valores: “católica”, “protestante”, “umbanda”, “candomblé”, entre outras. Perceba que a variável se chama religião e ela apode assusmir diferentes valores que são os nomes das religiões. Também é possível atribuir um número para cada religião e, na verade, o R já faz isso internamente. Assim, você pode usar 0 para católica, 1 para protestante, 2 para umbanda e 3 para candomblé. Nesse casos os calores da variável religião são 0, 1, 2 e 3 e, mesmo sendo números, representam os nomes das religiões de maneira que a variável contínua sendo categórica.

As variáveis categóricas ordinais têm valores que são nomes e que têm uma ordem específica. De maneira geral, tudo que se aplica a uma variável nominal se aplica à variável oridinal. A principal diferença é, contudo, a ordenação dos valores. A variável “nível de escolaridade” pode assumir os valores “sem escolarização”, “ensino fundamental”, “ensino médio”, “graduação”, e “pós-graduação). Peceba que os valores são nomes e que eles têm uma hierarquia, uma ordem em que a educação ocorre ou uma ordem de valor.

As escalas de Likert, possuem ítens que são variáveis oridinais, ou seja, cada afirmação da escala é uma variável. Os valores que essa variável assume são “discordo totalmente”, “discordo”, “nem concordo e nem discordo”, “concordo” e “concordo totalmente”. Esses valores também podem ser substituídos por números, sendo a sequência mais comum o 1, 2, 3, 4 e 5.

Outro tipo de variável categórica são as variáveis binárias. Elas são representadas por itens que têm somente duas respostas (ou valores) como, por exemplo, “não” e sim”. Em geral ao não pode ser atribuido o valor “0” e ao sim o valor “1”. No R também é possível considerar essa variável como lógica, atribuindo os valores FALSE (= 0) ou TRUE (= 1). Um tipo de variável binária são as variáveis Dummy que indicam a presença ou ausência de um atributo.

Em muitas análises estatísticas as variáveis categóricas são consideradas fatores. Por exemplo, a variável categórica nível de escolaridade é um fator que pode afetar atitude em relação à ciência.

Variáveis Numéricas

Também de uma forma simples, uma variável númerica ou métrica são variável cujos valores são números que representam contagens. Por exemplo, a “velocidade” de um veículo, a “altura” de uma pessoa, a “distância” de uma cidade a outra, a “nota” em um teste de QI e a “pressão sanguínea”.

As variáveis númericas podem ainda ser divididades em contínuas e discretas.

As variáveis discretas têm valores que são números inteiros enquanto as variáveis contínuas têm valores que são números decimais. Dessa forma, são exemplos de variáveis discretas o “numero de filhos” de um casal (pense bem, ninguem, até onde se sabe, tem 1,3 filhos). Outro exemplo são o “número de glóbulos vermelhos” do sangue. Como exemplo de variável contínua, temos a “altura” das pessoas que podem ser, por exemplo, 1.5m, 1.55m ou 1,555m. Nas varáveis contínuas, entre um inteiro e outro, existem infinitas possibilidades de decimais.


Níveis de Mensuração

Stevens (STEVENS, 1946) desenvolveu, em 1946, a ideia de níveis de mensuração: nominal, ordinal, intervalar e de razão. Os dois primeiros níveis são categóricos enquanto os dois ultimos são numéricos.

É importante ter em mente que o nível de mensuração nominal corresponde ao que já tratamos sobre uma varável nominal, podendo ela ser representada por um nome ou um número. O mesmo raciocínio se aplica ao nível de mensuração ordinal, mas, neste caso, também é importante ressaltar que as distências que existem entre uma categoria e outra não são, necessariamente, as mesmas. Ou seja, nada é possivel afirmar que a distância entre discordo totalmente e discordo e a mesma que entre concordo e concordo totalmente. Por outro lado, a maioria dos testes estatísticos irá partir da pressuposição de que os valores são equidistantes. Para resolver esse problema, o ideal é utilizar métodos estatisticos apropriados como Teoria da Resposta ao Item.

No nivel de mensuração intervalar, os valores das variaveis são equidistantes, mas não existe um zero verdadeiro, de maneira que é possivel fazer algumas operações matemáticas limitadas com eles. Veja a figura 1 a seguir. A maioria das medidas psicológicas, como o QI, se enquadra nesse nível de mensuração. No nível de mensuração de razão os valores das variáveis são equidistantes e há um zero verdadeiro como ocorre, por exemplo, na variável pressão sanguínea e na maioria das medidas estatísticas.

Níveis de mensuração e suas características segundo @stevensTheoryScalesMeasurement1946

Figura 1: Níveis de mensuração e suas características segundo STEVENS (1946)


Variáveis latentes

Variáveis latentes são aquelas que não podem ser medidas diretamente. Também são conhecidas como construto teórico, pois muitas delas são idealizações teóricas dos pesquisadores que teorizam sobre suas características e daí desenvolvem instrumentos para medi-las. São exemplos de variáveis latentes a personalidade, a depressão, a ansiedade, o burnout e o medo de baratas.

Em geral as variáveis latentes são medidas por meio de questionários. Para medir a personalidade, por exemplo, existem vários questionários que são conhecidos que, em geral, são escalas de likert. Um deles é conhecido como Marcadores reduzidos para avaliação da personalidade (HAUCK FILHO et al., 2012).

Para resalziar pesquisas com variáveis latentes é importante ter domínio teórico do construto, principalmente se o instrumento de medida (questionário/escala) for desenvolvido do zero. A eleboração dos ítens do questionário têm que levar em conta a teoria sobre o construto.

Após a aplicação do questionário em um grupo de respondentes, a variável latente pode ser analizada utilizando diferentes abordagens estatisticas a depender dos objetivos da pesquisa. Mais comumente são produzidos escores e, dessa forma, cada respondente terá um escore dentro daquele construto. Isso será abordado nas próximas aulas.


Escalas de Atitudes

Uma das primeiras escalas de atitudes foi desenvolvida por Thurstone e Chave.

O trabalho de Thurstone e Chave são o marco procedimental nas pesquisas sobre atitudes e vem sendo usado e aprimorados desde então. Neste trabalho (THURSTONE; CHAVE, 1929) os pesquisadores desenvolveram uma escala com 130 afirmações para mediar as atitudes das pessoas em relação à igreja. Rensis Likert (LIKERT, 1932) também teve uma grande contribuição nos estudos das atitudes ao desenvolver uma escala que hoje leva seu nome. As escalas de Likert são compostas por itens que nada mais são que afirmações que devem ser avaliadas de acordo com o grau de concordância do respondente da escala. Atualmente as escalas de Likert são as mais utilizadas nas pesquisas que envolvem a investigação de percepções e atitudes.

Pesquisaodres que trabalham com escalas de atitude podem elaborar suas escalas do zero ou podem utilizar escalas já existentes. Caso a escala existente tenha sido desenvolvida em outro idioma ou em outro contexto cultural é necessário fazer uma adaptação e validação do instrumento de medida. A validação também deve ser feita mesmo se a escala for elaborada do zero. Para mais informações sobre esse tópico, recomendo a leitura do capítulo de Borsa e Seize (BORSA; SEIZE, 2017).

Escalas de Likert

Escalas de Thurstone

Escalas de Osgood

Escalas de Guttmann


Análise de Escalas de Likert

Existem várias possibildiades para a análise de escalas de likert a depender, é claro, do problema de pesquisa. Todavia, alguns procedimentos são básicos e serão o foco deste curso. A seguir temos uma síntese do que veremos no curso.

Tópicos que serão abordads ao longo do curso

Figura 2: Tópicos que serão abordads ao longo do curso


Informações da Sessão

## R version 4.2.2 (2022-10-31 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 19045)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Portuguese_Brazil.utf8  LC_CTYPE=Portuguese_Brazil.utf8   
## [3] LC_MONETARY=Portuguese_Brazil.utf8 LC_NUMERIC=C                      
## [5] LC_TIME=Portuguese_Brazil.utf8    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## loaded via a namespace (and not attached):
##  [1] bslib_0.4.2     compiler_4.2.2  pillar_1.8.1    jquerylib_0.1.4
##  [5] highr_0.10      tools_4.2.2     digest_0.6.31   jsonlite_1.8.4 
##  [9] evaluate_0.20   lifecycle_1.0.3 tibble_3.2.0    pkgconfig_2.0.3
## [13] rlang_1.0.6     cli_3.6.0       rstudioapi_0.14 curl_5.0.0     
## [17] yaml_2.3.7      xfun_0.37       fastmap_1.1.1   stringr_1.5.0  
## [21] httr_1.4.5      knitr_1.42      vctrs_0.5.2     sass_0.4.5     
## [25] hms_1.1.2       rprojroot_2.0.3 glue_1.6.2      here_1.0.1     
## [29] R6_2.5.1        fansi_1.0.4     rmarkdown_2.20  bookdown_0.33  
## [33] readr_2.1.4     tzdb_0.3.0      magrittr_2.0.3  ellipsis_0.3.2 
## [37] htmltools_0.5.4 rbbt_0.0.0.9000 utf8_1.2.3      stringi_1.7.12 
## [41] cachem_1.0.7

Referências

BORSA, J. C.; SEIZE, M. DE M. Construção e adaptação de instrumentos psicológicos: dois caminhos possíveis. Em: DAMÁSIO, B. F.; BORSA, J. C. (Eds.). Manual de desenvolvimento de instrumentos psicológicos. São Paulo: Vetor, 2017. p. 15–37.
HAUCK FILHO, N. et al. Evidências de validade de marcadores reduzidos para a avaliação da personalidade no modelo dos cinco grandes fatores. Psicologia: Teoria e Pesquisa, v. 28, n. 4, p. 417–423, dez. 2012.
LIKERT, R. A technique for the measurement of attitudes. Archives of Psychology, v. 22, n. 140, p. 55–55, 1932.
STEVENS, S. S. On the Theory of Scales of Measurement. Science, v. 103, n. 2684, p. 677–680, 1946.
THURSTONE, L. L.; CHAVE, E. J. The measurement of attitude: a psychophysical method and some experiments with a scale for measuring attitude toward the church. Chicago, Illinois: University of Chicago Press, 1929.