1 Congresso Ibero-Americano de História da Educação Matemática (CIHEM)

O Congresso Ibero-Americano de História da Educação Matemática (CIHEM) teve sua primeira edição em 2011, na Universidade da Beira Interior, em Covilhã, Portugal. Seu principal objetivo era fomentar o intercâmbio entre pesquisadores da história da educação matemática na Ibero-América, promovendo debates sobre metodologias e temas históricos que impactaram a formação docente e o ensino da matemática. Em 2013, a segunda edição foi realizada em Cancún, México, consolidando a iniciativa e ampliando a participação de especialistas da Espanha, Portugal e América Latina.

Desde então, o evento passou a ocorrer bienalmente, com edições marcantes em Belém do Pará (Brasil, 2016), Murcia (Espanha, 2017), Bogotá (Colômbia, 2019) e, mais recentemente, de forma virtual, sediada na Venezuela em 2021, devido à pandemia. A primeira edição contou com debates sobre as relações entre a história da matemática e sua aplicação no ensino, estabelecendo uma base para pesquisas futuras na área. Ao longo das edições, o congresso expandiu sua abordagem, incorporando estudos sobre materiais didáticos históricos, formação de professores e metodologias inovadoras para o ensino da matemática.
O VI CIHEM, realizado em 2021, manteve a tradição de debates qualificados, com conferências e mesas-redondas que discutiram a transnacionalidade da pesquisa na área e os desafios contemporâneos da história da educação matemática. Com uma rede consolidada de pesquisadores e instituições acadêmicas, o evento segue como um dos principais espaços de divulgação científica nesse campo, promovendo a integração entre historiadores da matemática, educadores e matemáticos ibero-americanos.

2 Organização do banco de dados

O banco de dados utilizado neste estudo foi obtido a partir do Centro Brasileiro de Referência em Pesquisa sobre História da Matemática – CREPHIMat. Os dados foram coletados por meio do download e da organização dos anais dos Congressos Internacionais de História da Educação Matemática (CIHEM), abrangendo os eventos realizados entre os anos de 2011 a 2023. Após a obtenção dos arquivos, os dados foram cuidadosamente organizados em tabelas estruturadas, garantindo a padronização e a consistência das informações. O processo de revisão foi conduzido por dois juízes independentes, que avaliaram a qualidade e a integridade dos registros, assegurando a precisão dos dados extraídos.

O foco principal desse trabalho foi a extração e sistematização dos metadados contidos nos anais dos congressos, incluindo o ano do evento, título dos trabalhos apresentados, autores, instituição de afiliação dos autores, resumo, palavras-chave e idioma da publicação. A base de dados resultante constitui um recurso valioso para a pesquisa em História da Educação Matemática, permitindo análises detalhadas sobre a produção acadêmica no campo, tendências temáticas e redes de colaboração científica ao longo dos anos. Para mais informações sobre os anais do CIHEM, consulte o site do CREPHIMat1.

A base de dados contou com aproximadamente 400 pesquisa, produzido por mais de 300 autores de diversos países.

3 Carregamento dos pacotes

require(quanteda)
require(quanteda.textstats)
require(quanteda.textplots)
require(quanteda.textstats)
require(quanteda.corpora)
require(ggplot2)
require(dplyr)
require(kableExtra)
require(data.table)

4 Leitura e visualização do banco de dados

CIHEM_dados <- read.csv2("C:/Users/alexa/OneDrive/Área de Trabalho/Rmarkdown CIHEM/CIHEM_2.csv")
glimpse(CIHEM_dados)
## Rows: 401
## Columns: 11
## $ Ano            <int> 2011, 2011, 2011, 2011, 2011, 2011, 2011, 2011, 2011, 2…
## $ Página         <int> 47, 59, 59, 85, 95, 110, 121, 132, 141, 154, 167, 179, …
## $ ID             <chr> "2011-47", "2011-59", "2011-59", "2011-85", "2011-95", …
## $ Categoria      <chr> "Comunicação", "Comunicação", "Comunicação", "Comunicaç…
## $ Título         <chr> "As primeiras aplicações das derivadas nos manuais esco…
## $ idioma         <chr> "pt", "pt", "pt", "pt", "pt", "pt", "pt", "pt", "pt", "…
## $ autores        <chr> "Ana Paula Aires; Ana Elisa Esteves Santiago", "Mária A…
## $ instituição    <chr> "Universidade de Trás-os-Montes e Alto Douro; Instituto…
## $ Resumo         <chr> "N/A", "O trabalho aqui descrito faz parte de um estudo…
## $ Palavras.chave <chr> "N/A", "N/A", "N/A", "N/A", "N/A", "N/A", "N/A", "N/A",…
## $ Final          <chr> ".", ".", ".", ".", ".", ".", ".", ".", ".", ".", ".", …
CIHEM_corpus <- corpus(CIHEM_dados, text_field = "Resumo")
CIHEM_toks<- tokens(CIHEM_corpus)
CIHEM_dfmat <- dfm(CIHEM_toks)

5 Índice de Diversidade Lexical (TTR)

A Análise do Type-Token Ratio (TTR) com o pacote quanteda no R é uma métrica usada para avaliar a diversidade lexical de um texto. No contexto da produção acadêmica do Congresso Ibero-Americano de História da Educação Matemática (CIHEM), o TTR pode indicar a variação do vocabulário nos artigos apresentados ao longo dos anos.

Um TTR alto sugere uma linguagem mais diversificada, possivelmente refletindo inovação ou uma ampla gama de conceitos abordados. Já um TTR baixo pode indicar repetições frequentes, sugerindo temas mais consolidados ou padronização na escrita acadêmica.

Ao aplicar essa métrica, podemos comparar diferentes edições do congresso, identificar tendências na evolução dos debates e até mesmo mapear padrões de escrita dentro da comunidade. Isso ajuda a entender se a pesquisa na área está se diversificando ou mantendo um núcleo temático mais estável ao longo do tempo.

5.1 Análise em linha

5.2 Análise em box plot

6 Colocação

A análise de colocação com o quanteda identifica palavras que aparecem frequentemente juntas em textos. No contexto do CIHEM, essa técnica ajuda a revelar termos-chave e padrões linguísticos nos artigos do congresso.

Ao detectar expressões recorrentes como “história da educação” ou “ensino matemático”, podemos entender quais temas dominam as discussões e como eles evoluem ao longo dos anos.

Essa abordagem é útil para mapear tendências acadêmicas, comparar edições do evento e até mesmo identificar novas áreas de pesquisa emergindo na história da educação matemática.

6.1 Tabela colocação

collocation count count_nested length lambda z
educação matemática 177 0 2 5.960078 42.730489
universidade federal 33 0 2 8.791899 23.092420
escola normal 16 0 2 7.655412 19.175371
escola nova 15 0 2 8.466556 16.280485
rio grande 38 0 2 10.733496 15.680762
ensino primário 18 0 2 8.418468 15.578045
matemática moderna 35 0 2 6.822908 14.816710
história oral 32 0 2 8.685605 13.134429
são paulo 21 0 2 11.376798 12.718462
história cultural 22 0 2 8.254767 12.297627
santa catarina 21 0 2 15.611076 7.760535
mato grosso 16 0 2 15.346455 7.615736

6.2 Gráfico 2

7 N-gramas

A análise de n-gramas no quanteda identifica sequências de n palavras consecutivas em um texto. No contexto do CIHEM, permite detectar padrões textuais frequentes, como “educação matemática crítica” ou “desenvolvimento do currículo”, auxiliando na identificação de temas recorrentes nos artigos.

🔹 Diferença entre n-gramas e colocações:

N-gramas são simplesmente sequências de palavras, independentemente da frequência esperada. Colocações destacam combinações que ocorrem mais do que o esperado por acaso. Fazer ambas as análises permite identificar tanto expressões comuns no corpus quanto associações semânticas relevantes, enriquecendo a compreensão das discussões acadêmicas

7.1 Tabela N-gramas

x
educação_matemática 236
história_educação 135
ensino_matemática 112
formação_professores 107
professores_matemática 75
ensino_primário 54
en_la 51
livros_didáticos 50
matemática_moderna 42
en_el 42

7.2 Gráfico bi-gramas

7.3 Gráfico tri-gramas

8 Nuvem de palavras

Uma nuvem de palavras é uma ferramenta visual para analisar frequência de palavras em um corpos de forma intuitiva. Ela destaca os termos mais frequentes nas pesquisas analisadas, revelando tendências temáticas, áreas de interesse das edições do congresso. Isso facilita a identificação de conceitos-chave e até lacunas na pesquisa. Além disso, ao sintetizar grandes volumes de texto de forma intuitiva, a nuvem de palavras auxilia pesquisadores a compreender rapidamente o foco das discussões e a direcionar novos estudos com base nos temas mais recorrentes.

8.1 Sem tratamento

8.2 Texto Lematizado

9 Análise de frequência relativa

A frequência relativa em Keyness mede quão mais comum uma palavra é em um grupo de textos comparado a outro. Em pesquisas acadêmicas, essa análise é útil para identificar mudanças no discurso, tendências em notícias ou diferenças entre autores. Por exemplo, em estudos políticos, pode revelar quais termos ganharam destaque após um evento. Na comunicação, ajuda a entender a evolução de narrativas na mídia. Assim, a técnica permite insights profundos sobre linguagem e contexto.