Bakgrund

Analytikern Filip Wästberg från Ferrologic Analytics har analyserat alla regeringsförklaringar från 1976 fram till idag. Den första regeringsförklaringen som inte hölls av kungen var Torbjörn Fälldin 1976.

Hur skiljer sig de olika regeringsförklaringarna mot varandra och har Centerpartiet och Liberalernas stöd till regeringen ändrat årets regeringsförklaring?

Om analysen

Regeringsförklaringarna är i första hand hämtade från regeringen.se. De äldre regeringsförklaringarna är hämtade från inscannade dokument från riksdagens arkiv (där datakvalitén kan variera). Samtliga regeringsförklaringar är “tvättade” från stoppord som och, eller men.

Den första frågan är: vilka är de vanligast använda orden i samtliga regeringsförklaringar?

Att Sverige toppar listan är kanske inte så förvånande.

Följfrågan här blir hur det här varierar mellan olika statsministrar. Vem använder vilka ord mest?

Vilka ord är de vanligaste i Stefan Löfvens regeringsförklaringar?

ord Antal ord
sverige 186
jobb 53
tas 48
barn 46
arbete 45
år 43
ny 42
svenska 42
sveriges 42
regeringen 41

Hur skiljer sig Stefan Löfvens regeringsförklaringar från 2014 till idag?

Hur har längden på regeringsförklaringar utvecklats över tid? Vi ser en tydlig trend där regeringsförklaringarna blir längre och längre.

Och hur ser det ut specifikt för Stefan Löfven?

Det är tydligt att regeringsförklaringarna blivit längre. Samtidigt är det relativt stor variation över tid. Vilken statsminister hade längst regeringsförklaringar? Nedan ser vi medelvärde för antal ord per regeringsförklaring för varje statsminister.

Vilka är Stefan Löfvens viktigaste ord?

Att Reinfeldt nämner arbete, ansvar och jobb är inte förvånande och har ett visst analysvärde, men att Olof Palme nämner regeringen flest gånger har inget större analytiskt värde, det gör i princip alla andra statsministrar också.

Det här är ett vanligt problem i analys av text. En metod för att hantera det här och istället identifiera de viktigaste orden i en text är så kallad term frequency–inverse document frequency (tf-idf)[saknar svensk översättning]. Principen är, enkelt uttryckt, att väga upp ord som inte används ofta och väga ner de som används nästan hela tiden. Metoden utvecklades av matematikern Karen Spärck Jones. Resultatet av analysen fångar vilka ord som är “viktigast” för Stefan Löfvens respektive regeringsförklaringar.

Det sista vi är intresserade av är hur olika ord hänger samman i Stefan Löfvens regeringsförklaringar. Nedan redovisas relationen mellan ord i Löfvens regeringsförklaringar.