DATA - De Koninklijke Bibliotheek in Den Haag is al een aantal jaren bezig met een bijzonder project. Alle historische kranten zijn ingescand, en zodanig bewerkt dat ze volledig doorzoekbaar zijn (via Delpher.nl).
Dat is een enorm rijke bron aan data. Wie zijn familiegeschiedenis onderzoekt, kan in deze database vrij gemakkelijk oude familieadvertenties terugvinden. In een paar minuten vond ik zo het woonadres van mijn grootouders in de Tweede Wereldoorlog: in die tijd werden verhuizingen nog aangekondigd in de krant. Maar ook alle foto’s met bijschriften zijn doorzoekbaar.
De KB gaat verder met innoveren, en heeft nu een website gemaakt met allerlei tools die wetenschappers kunnen gebruiken voor analyses.
De complete database met foto’s uit kranten is doorzoekbaar en er zijn grafische tools om gegevens in beeld te brengen. De toepassingen zijn legio: zo deed men onderzoek naar de perceptie van Europa in De Telegraaf, de verslaggeving rondom politiek. Daarbij worden resultaten van zoekwoorden in ANP nieuwsberichten en Tweede Kamerhandelingen in één venster getoond.
Ik testte de tool waarmee je zinscombinaties kunt tellen. De grafiek toont de relatieve frequentie van namen van universiteiten door de jaren heen. UvA en VU (dichtbij de krantenredacties?) worden het vaakst vermeld.
Bron: KB Lab (2017). Newspaper Ngram viewer.
Het belang van deze site zit niet alleen in de beschikbare datasets. De combinatie van data, met een overzicht van ontwikkelde analyse- en visualisatietools, maakt deze site uniek. Een voorbeeld ook voor andere instanties die open data beschikbaar stellen.
Reacties (5)
De namen van de universiteiten zijn in de loop van de tijd veranderd (Universiteit Twente was eerst TU Twente, ook Utrecht had een Rijksuniversiteit). Heb je dat verdisconteerd in je zoekactie?
En wat verklaart de opvallende piek voor de VU in 1904. Heb je daar naar gezocht?
Ik mis plusjes, daarom +++
Oh wat geweldig, dit! Dank, dank, dank!
@1: het was eerst Technische Hogeschool Twente en vanaf 1986 Universiteit Twente. Dus nooit TUT.
@1: Ik heb (nog) niet systematisch alle namen en voorlopers daarvan uitgeprobeerd – al vrij snel bleek dat de VU en de UvA zoveel meer hits hadden dat de anderen in de grafiek niet te zien waren. Mogelijk daarom interessanter om de laatste 20 jaar nog eens te bekijken. Eigenlijk zou je een historische citatie-impact analyse moeten doen om te zien of daar hetzelfde beeld uit komt. Overigens zie je de laatste jaren dat veel universiteiten zich met Engelse namen profileren. De Katholieke Universiteit Brabant (Katholieke Universiteit Tilburg gaf een wat vervelende afkorting) noemt zich nu Tilburg University.