29 september 2022

Temporele patronen in economisch onderzoek

Het verwerken en gebruik van tekstdata neemt tegenwoordig een hoge vlucht. Het vergt echter nieuwe expertise. Het CPB heeft tot dusver weinig onderzoek op dit gebied uitgevoerd. Om deze expertise op te bouwen heeft het Data Science Team een pilot-onderwerp gekozen dat voor economen bekend terrein is: de tekst van korte samenvattingen (zogeheten abstracts) van economische academische publicaties.

Dit project is uitgevoerd om ervaring op te doen met methoden voor tekstverwerking, die we later ook op andere data kunnen toepassen, zoals vacatureteksten. In de pilot maken we verbindingen tussen teksten van economische onderzoeken uit verschillende onderzoeksvelden en over diverse jaren. Hiervoor gebruiken we de abstracts - korte samenvattingen -  van economische papers. Soortgelijke teksten clusteren we met elkaar. Zo kunnen we vaststellen over welke tijdsbestek economische onderwerpen worden beschreven.

Voor de meerderheid van de papers vinden we dat vergelijkbare papers in hetzelfde jaar gepubliceerd worden. Dit suggereert dat er sterke gemeenschappelijke trends zijn in de economische literatuur: veel papers schrijven over hetzelfde onderwerp op hetzelfde moment.  Er zijn echter ook vergelijkbare papers waar 14 jaar tussen het moment van publicatie zit. Er bestaan dus ook economische onderwerpen die langdurig worden beschreven . 

Ten slotte zien we dat het gemiddelde verschil in publicatiejaar is afgenomen van ongeveer 4 jaar tussen 1990 en 2005 tot ongeveer 1 jaar begin 2010. Dit wekt de suggestie dat economisch onderzoek over hetzelfde onderwerp zich meer concentreert in een korte periode.

Contactpersonen

Auteurs

Andrei Dubovik
Clemens Fiedler
Alexei Parakhonyak (University of Oxford)

Lees meer over