DATA - Een datastukje voor nerds. Welke vleessoorten waren wanneer populair in Nederland? In ieder geval is er een gestage opkomst van varkensvlees sinds de Tweede Wereldoorlog. Een gastbijdrage van Maarten Marx, van de political mashup-groep van de UvA.
Na alle ophef over paardenvlees de laatste tijd waren we benieuwd wat voor soorten vlees er besproken werden in de Nederlandse kranten. Het krantenarchief van de Koninklijke Bibliotheek (KB) is hier de uitgelezen plek voor. We haalden uit alle 88 miljoen artikelen in het KB-archief alle 236.950 artikelen waarin de tekst de reguliere expressie \b\w+vlees(ch)?\b bevatte. Dit is dus een woord eindigend op ‘vlees’ of ‘vleesch’, met minstens één letter ervoor.
Deze 236.950 hits zijn verdeeld over de volgende categorieën:
119.449 advertenties
116.783 artikelen
498 familieberichten
219 illustraties met onderschrift
Per hit hebben we de volgende informatie (hier een voorbeeld over menschenvleesch):
- De context: den in Europa groote hoeveelheden zwart menschenvleesch verslonden.” „Rijken en machthebbenden!
- De datum: 1872-02-23
- Het type bericht: artikel
- de link naar het artikel bij de KB
Wat voor soorten vlees?
We hebben voor alle vleessoorten geteld in hoeveel artikelen ze voorkwamen. Omdat er veel verschillende spellingen zijn geweest, hebben we de woorden wat genormaliseerd: alle hoofdletters werden klein, we haalden de “n” in paarden– en ander vlees weg en vervingen ‘vleesch’ overal door ‘vlees’.
Het resultaat kan je tonen als een histogram, maar ook als een woordenwolk:
46424 rundvlees
35458 varkensvlees
17869 tandvlees
17389 kalfsvlees
16316 rookvlees
8537 paardevlees
7189 schapevlees
5711 lamsvlees
5089 zoutvlees
4941 pekelvlees
3610 soepvlees
3297 ossevlees
3258 vruchtvlees
1989 vrijbankvlees
1846 schaapvlees
1743 kippevlees
1726 menschevlees
1646 nagelhoutvlees
1405 kanonnevlees
1062 braadvlees
1024 blikvlees
De woordenwolken zien er een stuk leuker uit. De eerste is gebaseerd op de absolute tellingen, de tweede op het logaritme daarvan.
De populariteit van het vlees door de tijd
Vervolgens hebben we van vijf vleessoorten geteld hoe vaak die soorten per decennium genoemd werden, en dat als percentage uitgedrukt. De data staan op Google Drive.
Hier is het plaatje:
Wat valt op?
We zien een gestage opkomst van het varken. Tijdens en na de Tweede Wereldoorlog zien we een mooie verschuiving van rund naar paard en schaap. Het zou interessant zijn om de oorlogsjaren met wat meer granulariteit (per jaar, of zelfs kwartaal) te bekijken, en zien wat daar nu speelde.
Zelf een analyse maken?
We hebben de eerste 20.000 hits beschikbaar gemaakt als een gzipped tab separated bestand:vlees20k.tsv.gz.
Voor het maken van andere analyses kan je altijd contact opnemen met [email protected].
Reacties (14)
Je hebt natuurlijk niet gemeten welke vleessoorten populair waren. Die kranten zijn een bron, en geen statistiek, speciaal voor jou gemaakt. In je stuk lopen het voorkomen van een woord in de krant en de populariteit van de materie dwars door elkaar heen.
Je zult dus nog moeten aantonen dat er een relatie tussen tussen het noemen van (een) vlees in de krant en de populariteit ervan.
Handiger nog is het een historicus aan je team toe te voegen.
Het antwoord over de populariteit vind je in de boeken van Bieleman (WUR)
Het aangehaalde voorbeeld over mensenvlees geeft wel een beetje het probleem aan: dat uitdrukkingen over vlees soms vergelijkend worden bedoeld. Context van die mensenvlees-quote:
„Nog altijd kan men den machthebbenden in den staat toeroepen: „Kaïn, wat hebt gij met uwen broeder gedaan?” en zal men van ecu man als ScHaFFLE daarop ten antwoord krijgen: „Iv den vorm van koffie, en suiker, worden in Europa groote hoeveelheden zwart menschenvleesch verslonden.”
Maar om nou voor een paar honderdduizend termen de context te gaan analyseren: pfew.
Pekelvlees! lekker. Tijd voor een top10?
Kip, het meest veelzijdige stukje vlees, Kip! En toch komt kippevlees niet in de top 10 voor (wel veel lager). Misschien omdat je doorgaans spreekt over ‘kip eten’ ipv kippe(n)vlees eten?
Aannemende dat het aantal vermeldingen samenhangt met de consumptie (is dat zo?), is het opmerkelijk dat runderen hebben geprofiteerd van WOII ten koste van de schapen. Wie zei dat Animal Farm slechts een verhaaltje was?
Paardevlees? In correct Nederlands hoort die -n er toch echt bij.
Nee hoor, voor vlees is éen paard voldoende. De nieuwe spellingsregels gelden alleen voor ambtenaren.
Of Tandvlees. Men zou ook kunnen beredeneren dat het aantoont hoeveel ‘problemen’ er waren met specifieke ‘vlezen’. Normaal licht het nieuws natuurlijk alleen opmerkelijke zaken uit. En zo kan je er alle kanten mee op. Leuk bericht toch wel.
@4: Zo zullen ook artikelen waarin vlees wordt aangeduid met termen als ‘biefstuk(je)’, ‘speklapje’, ‘varkenshaasje’ en dergelijke ook niet boven water komen.
Leuk stuk, verder.
@7 en @8
Dat snap ik dan dus niet’, zeggen dat het een leuk artikel is. Het stelt niets meer voor dan laten zien dat je woorden kunt tellen in de KB kranten database. Het is nog dommer dan dataminen.
-‘Laten we vlees kiezen!’
– ‘ja, maar dan ook met -sch, want het is wel historisch, he!
Er is geen analyse – helemaal niet. De opmerking dat varkensvlees opkomt sinds wo2 slaat nergens op: het woord varkensvlees wordt meer gebruikt – in de kranten. Dat is de observatie. De conclusie wordt niet onderbouwd.
Ze hadden net zo goed het woord mens (eventueel met de extra -ch) kunnen tellen en daar de vraag bij zetten of mensen populairder of juist minder populair worden.
eigenlijk ben ik wel blij met deze shit. Het toont nogal duidelijk aan dat er nog altijd markt is voor historici. Toch maar even gegoogled op de political mashup group, dus ik doe ze de lol hier hun site te plaatsen:
http://ccct.uva.nl/user_list
Informatici, informatici en informatici (categorie logici). En wat gedragswetenschappers. kwestie van meer code in dienst van anderen en minder zelf interpreteren. En een historicus erbij halen om ze op het rechte pad te houden.
Misschien een klusje voor Diederik Stapel?
@3: Om mijn ietwat teveel vegetarische vrienden(wat is een vriend?)/kennissen lekker te shockeren zeg ik dan..”hoe liever ze kijken hoe lekkerder ze smaken”..altijd prijs…LOL.
Zelf ben ik opgegroeid met vlees van de paardenslager om de hoek ..mals vlees, niets mis mee.
Niet het vlees van de paardenslager zelf natuurlijk.
@10: Je uit je nogal zuur terwijl je volgens mij er naast zit wat er onderzocht is. Populariteit als in ‘wordt graag gegeten’ is niet onderzocht. Maar populariteit als objectieve frequentie. En ja, de context is onbekend, als het woord ‘ rundvlees’ in een advertentie voorkomt, dan is het wel erg waarschijnlijk dat het aangeprezen wordt. Context is leuk, maar vergeet termen als onderzoekscriterium en waarschijnlijkheid niet.