Top 2000: een analyse

Foto: copyright ok. Gecheckt 15-11-2022

DATA - Even voor middernacht op oudejaarsavond schalde Bohemian Rhapsody van Queen als nummer 1 van de Top 2000 de ether in. In deze gastbijdrage analyseert Arjan van der Meij de Top 2000.

Ik heb er al eens eerder over geschreven en vorige jaar wat getweet. Maar ik kan het niet laten. Een paar dezelfde dingen als de voorgaande jaren en wat nieuwe dingen. Gewoon, op grond van de data die beschikbaar is. Ik gebruik de lijst die staat op wikipedia. Ik heb eerst geprobeerd de lijst van de Top 2000 zelf te mergen. Die verschilt echter met vorig jaar soms. Zo staat er in de oude lijst bijvoorbeeld wel eens: “Prince” en in de nieuwe “Prince and the Revolution”. En mijn Excel snapt dan niet dat dat hetzelfde is. Uiteindelijk heb ik deze lijst gebruikt. De analyse gaat over de data van 2016 behalve als dat niet zo is. Dan wordt dat aangegeven. Voel je vrij om ook aan de slag te gaan!

Afijn. Hieronder staat een lijst met zaken die ik tot nu heb uitgezocht. Klik erop en je wordt verder geleid. Als je iets wil weten wat ik kan uitzoeken, hoor ik het wel. Let op: ik gebruik slechts de artiest, de titel en het jaar van uitbrengen.

Welke woorden komen het vaakst voor?

Meest voorkomende woorden Top 2000

Zeker in 2016, toch op wereldschaal een beetje een annus horribilis, vind ik het fijn te zien dat LOVE weer wint.

De meest voorkomend woorden top 20:

Top 20 woordenLinks zie je een overzicht van alle woorden, rechts van de woorden die interessant zijn. Het totaal aantal woorden in de titels van de Top 2000 2016 is 5979.

Zoals gezegd is “love” de winnaar. Musici zijn enorme romantici. Als je zoekt op de website wordfrequency.info zie dat “love” pas op de 391e plek komt in het Engels Corpus. Slechts 0,031% van de woorden is “love” (één op 3200 woorden). In de Top 2000 is dat 1,56%, dus één op de 64 woorden is “love”!

De Nederlandstalige top 20 samenstellen is lastig. Veel woorden in het Engels betekenen ook iets in het Engels. “Lover” bijvoorbeeld. Die haal je er natuurlijk uit: die zal veel vaker in het Engels voorkomen. Maar “me”? en “is”?

Afijn. Ik heb een poging gewaagd met alleen maar woorden die duidelijk Nederlands zijn (hoewel, “van” is natuurlijk ook een personenbusje,…). In het begin natuurlijk veel algemene woorden. Zoals gezegd missen er een paar, zoals “me”. In mijn eenvoudige Excel-database is niet te vinden of een liedje Nederlandstalig is of niet. Dat zou ik wel kunnen doen maar is wel heel veel werk, denk ik. Later wellicht.

Het eerste “interessante” woord dat je tegenkomt is “hart”. Wellicht logisch (“Bloedend hart”, “Houten Hart”) maar het is toch opvallend dat het woord “liefde” pas heel veel later komt (op plek 490, slechts in twee liedjes. Welke?) maar dat is natuurlijk niet helemaal eerlijk. In het Engels is “love” ook een woord voor “houden van”. Even gekeken: “hou” komt vier keer voor in de lijst. Maar goed, om een eerlijke vergelijking te maken moet ik weten hoeveel Engelstalige liedjes erin staan en hoeveel Nederlandse.

Kleuren in de Top 2000

Een andere telling die ik gedaan heb, is de telling van de kleuren, althans de Engelse. Ik gebruik een brede definitie van kleuren. “Golden” en “Silver” doen ook mee. “Ruby”, hoewel soms in gebruik als kleur, heb ik niet meegeteld. Als ik het goed zie, wordt deze naam (best vaak trouwens) gebruikt als naam.

Hierboven zie je het spectrum (ik weet, het is niet een echt fysisch spectrum) met de juiste lengtes. Zwart en blauw winnen. Kleuren worden, kennelijk vooral gebruikt in liedjes op een negatieve manier. Mijn lievelingskleur, “orange” komt, als enige kleur uit het spectrum, helemaal niet voor, evenals de niet in het echte spectrum voorkomende “pink”.

Je ziet hiernaast de precieze percentages van alle kleuren. Ik vond overigens maar 58 keer een kleurnaam.

Top 2000 lichaamsdelen

Ook heb ik de lichaamsdelen geteld. Ik heb hierbij het hart (bij elkaar 22x) overgeslagen. Vooral ogen, weinig benen en vier hoofden.

Lichaamsdelen in Top 2000

 

 

 

 

 

 

 

 

Positief/negatief

Positieve & negatieve woorden in de Top 2000Uit de Top 2000 valt natuurlijk niet echt het humeur van de samenleving te destilleren maar toch was ik benieuwd naar de balans tussen positieve en negatieve woorden in de teksten. En ja, ik snap dat “nothing” weliswaar negatief is maar in de zin “Nothing compares to you” juist weer positief is. Ik heb echter gewoon geteld omdat de positieve term “everything” in “there goes my everything” juist weer negatief is. Afijn.

De doden van 2016

Er zijn nogal wat popartiesten gestorven in 2016. Zoals iemand twitterde vanmorgen na het bericht van de dood van George Michael: “Welk festival wordt er in de hemel gehouden?”. Ik heb alle nummers gezongen/gespeeld dor de volgende doden zwart gemaakt:

  • David Bowie
  • Black
  • Glenn Frey (Eagles)
  • Keith Emerson (Emerson, Lake and Palmer)
  • Prince
  • Billy Paul
  • John Berry Beasty boys
  • Leonard Cohen
  • Rick Parfitt (Status Quo)
  • George Michael

Ik had ook wel Toots Thielemans mee willen nemen maar van hem (net zoals van Mieke Telkamp en Eddy Wally) staat geen nummer in de Top 2000. Klik vooral op het plaatje om hem te vergroten.Dode artiesten

Zelfde titels

Nummers met dezelfde titelTweeduizend liedjes. Dan kun je natuurlijk niet verwachten dat het allemaal andere titels zijn. En dat is ook niet zo. Er zijn vier titels die twee keer voorkomen en er zijn er zelfs twee die drie keer voorkomen: “Crazy” van Seal, Gnarls Barkley en Aersomith en “One” van Mettallica van U2 en van Mary J. Blige (&U2). Queen staat er in feite twee keer in met “Somebody to love”, de tweede keer met George Michael.

De letters van de titels

Vorig jaar had ik al eens opgemerkt dat er slechts één band een palindroomnaam heeft: ABBA. En wat geestig is, is dat uitgerekend deze band één van de twee titels heeft uitgebracht die een palindroom is: SOS! De andere is Mmm mmm mmm van de Crash Test Dummies.

De wedstrijd welke is het lied met de meeste leestekens kent wel drie winnaars: het mooie lied van Ramses Shaffy: “Zing, vecht, huil, bid, lach, werk en bewonder” (vijf komma’s), “Turn! Turn! Turn! (to everything there is a reason)” en “Gimme! Gimme! Gimme! (a man after midnight). Die laatste twee hebben beiden drie uitroeptekens en twee haakjes. “In-a-gadda-da-vida” van Iron Butterfly mag er ook zijn met vier koppeltekens.

Ik heb ook gezocht naar titels met getallen in de titel. Na wat opschoonwerk in Excel (alle gewoon karakters en leestekens weg), hield ik 26 nummers over met een of meer betalen in de titel. Daarbij het ik geschreven nummers (“One” bijvoorbeeld) genegeerd. Meerder getallen in een nummer heb ik achter elkaar geplakt. En dan wint Doe Maar met “32 jaar (Sinds 1 dag of 2)”. Wellicht had Bruno Mars moeten winnen: 24k is natuurlijk 24000. Oh nee, Katie Melua. Onbetwist. “Nine million bicycles”.

Langste en kortste titel

Sommige titels zijn enorm lang, anderen extreem kort. Ook daar heb ik naar gekeken. Hieronder zie je de twee ranglijsten. Grappig: U2 staat in beide lijstje. Een keer met “Still haven’t found what I’m looking for”  en een keer met “Bad”. De Manic Street Preachers hebben de eer met de allermeeste letters in de Top 2000 te staan: 59 bij elkaar met hun nummer: “If you tolerate this your children will be next”.

Alfabetische titels

Houd je vast. Het wordt nu wel erg nerdy (ga gerust gewoon weer luisteren naar de Top 2000 hoor). Ik heb wat alfabetische testen gedaan. Zoals altijd schatplichtig aan Battus.

Als eerste gekeken in welke nummers de letters van het alfabet maar een keer voorkomen. Dat zijn er nog best veel trouwens: 240 (12% dus). Bij titels die uit twee letters bestaan is dit niet zo raar natuurlijk. Langere zijn leuker. De langste staan hiernaast. Nummer 1, “Black or white” van Michael Jackson, heeft er 12, de nummers 2 hebben er 11 en de nummers 3 10.

“Lost” van Anouk (nummer 441) en “Biko” van Peter Gabriel (854) zijn de enige nummers met een lengte van vier letters die ook op alfabetische volgorde staan in het woord. Andersom kan ook: de letters staan in omgekeerde alfabetisch volgorde in de titel. Hier vinden we er twee met vijf letters: “Sonne” van Rammstein (nummer 187) en “Wrong” van Novastar. Een eervolle vermelding voor “YMCA” van De Village People natuurlijk.

Verdeling over de jaren

Een standaardding in de statistiek: verdelingen! Gewoon vergeten tijdens het nerden. Eerst maar eens per jaar. Best interessant:

Rare dingen zitten er in. De eerste in 1939 (Strange Fruit van Billy Holiday) maar daarna in één keer vier! En niet de minste: Johnny Cash, Frank Sinatra en twee keer Elvis Presley. Even tussendoor:

Dat daarna de aantallen stijgen is logisch: de opkomst van de Rock and Roll is daar verantwoordelijk voor natuurlijk. Wel bijzonder: 1979 is het topjaar met 65 liedjes. Dat is er meer dan één per week. Het gemiddelde is zo’n 32 per jaar waarin er minstens één in voorkomt. Verder is 2010 een merkwaardig beroerd jaar: slechts 12 nummers uit de Top 2000 komen uit dat jaar. De jaren 2013 en 2014 hebben evenveel nummers in de lijst en ook best veel: 52. Dat gaat alweer naar de aantallen uit de jaren 70 terug.

De verdeling als je kijkt naar de decennia is weer wat logischer:

Je vraagt je af of dat verandert is in de loop van de top 2000. We gaan het na (kost wel even wat Excel gedoe…).

Als eerste alle uitzendjaren in een grafiek. Een (best mooie) wirwar:

Echt veel informatie is er niet uit te halen. Wel zie je dat het maximum aantal nummers uit een jaar 97 was. Dat was het jaar 1969 in het uitzendjaar 2002. Verder zie je mooi de uitzendjaren aan het einde van de grafiek. Er is daar wel iets opvallend. Je moet wel goed kijken. In 2008 stond er geen enkel nummer uit 2008 in. Maar dat kan kloppen! In 2008 was de 10e aflevering. Je kon toen niet stemmen, de lijst werd gemaakt m.b.v. de voorgaande lijsten. Lees er hier meer over.

Ook leuk om te kijken naar het totaal. Ik heb hiervoor van elk jaar het aantal nummers uitgebracht in een jaar opgeteld over alle 18 edities. Deze verdeling ziet er al bijna “normaal” uit.

Beste jaar is duidelijk 1969 en slechtste van de “goeie tijd” is 1981.

Misschien wel de mooiste van allemaal is de verdeling per decennium over de verschillende edities. Je ziet de jaren “0” en de jaren “10” beginnen en jaren zestig langzaam uitdoven. De “hik”bij 2008 laat zich verklaren door het feit dat dit een optelling is van de voorgaande negen edities.

De onderstaande grafiek doet hetzelfde maar dan voor elk jaar in plaats van voor elk decennium. Minder goed leesbaar maar esthetisch best fijn. Zoals Per-Ivar (die heel vaak rake dingen zegt) net zegt: “Het langetermijngeheugen van de soort mens in kaart gebracht.” Klik er vooral even op, dan zie je het beter.

Heatmap jaar

En de laatste van dit jaar: een heatmap van het jaar van uitbrengen van de nummers van de Top 2000 van 2016. Hoe lichter hoe jonger (precies andersom als boven dus). Je ziet eigenlijk geen enkele patroon. En dat is mooi. Kennelijk zitten er oude en nieuwe nummers door elkaar heen in de Top 2000. Misschien alleen bij de eerste 100 wat meer oude (donkere nummers). Een mooi nieuw jaar gewenst!

Reacties (17)

#1 Bismarck

Bij “Zelfde titels” heb je “it’s my life” gemist, dat er tot mijn verbazing maar 2 keer in staat (ik had er 3-4 verwacht).

  • Volgende discussie
#2 Arduenn

Het doet me deugd om te zien dat ‘zwart’ nog steeds het meest frequente kleurwoord is in de lijst.

  • Volgende discussie
  • Vorige discussie
#3 Spam

Metal Molly – Orange
R.E.M. – Orange Crush
Hallo Venray – Orange

En in het jaar van The Donald: Rats On Rafts – Orangeorangutan

  • Volgende discussie
  • Vorige discussie
#4 HansR

Zeker in 2016, toch op wereldschaal een beetje een annus horribilis, vind ik het fijn te zien dat LOVE weer wint.

Wat maar weer aangeeft hoe ver de liedjes, de luisteraars en de werkelijkheid van elkaar verwijderd zijn.

Dreaming.

  • Volgende discussie
  • Vorige discussie
#5 Arduenn

fijn te zien dat LOVE weer wint.

Wat maar weer aangeeft hoe ver de liedjes, de luisteraars en de werkelijkheid van elkaar verwijderd zijn.

Ik weet het niet hoor. Ik denk dat de mensheid in anderhalve generatie met ongeveer 90% zou zijn gereduceerd zonder LOVE.

  • Volgende discussie
  • Vorige discussie
#6 Henk van S tot S

Met waardering voor het gepuzzel en uitpluizen van het een en ander, moet me toch van het hart, dat ik de top 2000 een totaal overbodig programma vind:
2000 nummers achter elkaar draaien met een hoop gezwets er tussendoor is toch een ramp.
Alleen de de nrs. 1 t/m 100 ervan draaien lijkt me wel genoeg.
Persoonlijk heb meer lol in mijn eigen “muziekverzameling” + zo nu en dan wat nieuws of voor mij onbekende nummers.
@4:
Love is wat slordig uitgesproken Loaf en ik moest derhalve aan Meat Loaf denken
Staan die er ook nog in?
Mijn kinderen hebben daar dacht ik hun eerste “spontane danspassen” op gezet
;-)

  • Volgende discussie
  • Vorige discussie
#7 HansR

@5: Driften @Arduenn, driften houden de mensheid overeind. Niet de LOVE, die genereert blijkbaar alleen maar verwarring en destructie.

  • Volgende discussie
  • Vorige discussie
#8 Geband van Joop

Ik heb me ook vaak afgevraagd waarom het een soort ijzeren regel is dat elk popliefde over de liefde (of seks) moet gaan (als ik popartiest was zou ik zeker met dat cliche afrekenen). Ongetwijfeld heeft het ermee te maken dat een poplied direct het hart wil raken en dat het spelen in een bandje voor veel jongens het middel was om meisjes in bed te krijgen (en gratis drugs te krijgen). En dat verklaart dan ook weer misschien waarom er na de jaren ’70 vrijwel geen goede pop meer is gemaakt: pop/rock is verbonden met de seksuele revolutie (en drugs), zodat toen die seksuele revolutie uitdoofde en ook drugs iets stoms werd gevonden gedurende de jaren ’70 ook het belang van pop/rock voor de jeugd verdween. Sinds de jaren ’80 heeft de jeugd gewoonweg wel iets beters te doen dan in een bandje spelen…

  • Volgende discussie
  • Vorige discussie
#9 børkbørkbørk

Even een methodologisch puntje: je kunt de woordfrequenties uit 2000 titels niet vergelijken met die uit 20 titels, en Nederlands niet echt met Engels. Bij 20 titels hebben we ongeveer 100 woorden. De woorden met een echte frequentie in de buurt van de 1:100, zoals liefde, nog maar weinig kans om nog in die lijst te komen. Verder zijn Engels en Nederlands weliswaar niet zo heel erg verschillende talen, maar woordgebruik is nogal anders. Naast het al genoemde verschil dat love ook een werkwoord is, neemt liefde twee lettergrepen in tegen love een. Een vergelijking tussen love en liefde zegt dus erg weinig. Anders kun je ook wel concluderen dat Queen het best te vergelijken valt met Wim Sonneveld.

  • Volgende discussie
  • Vorige discussie
#10 KJH

De Top 2000 is een namaaksel van de Top 1000 (Veronica) en Top 4000 (Radio 10). De Top 2000 is bij uitstek een voorbeeld van een publieke omroep die met belastingcenten de commercielen probeert na te doen qua popijopi en moet daarom worden afgeschaft.

  • Volgende discussie
  • Vorige discussie
#11 Henk van S tot S

@10:
Jouw “geschiedenis-verhaaltje” is verre van compleet:

En ver voor de top 1000 was er de top 100 en daarvoor in 1965, begon Joost den Draaijer met het draaien van de top 40.

  • Volgende discussie
  • Vorige discussie
#12 KJH

@11: En het jouwe ook niet. De top-100 was met Pasen, en er zitten geloof ik, wel decennia tussen de laatste top-100 en al die andere ’toppen’ van nu. De top-40 was van Veronica (die dus, IMHO, met enig recht de ’top 1000′ als enig alternatief mag claimen).

  • Volgende discussie
  • Vorige discussie
#13 Henk van S tot S

@12:
Het gaat(ging mij) over het fenomeen “top-zoveel”
Daar begon Joost den Draaier in Nederland mee in 1965; hij had een en ander opgepikt in Amerika.
Voor de rest: zie eerste stuk #6.
En nu ga ik eens sneupen bij Fibradio
;-)

  • Volgende discussie
  • Vorige discussie
#14 Janos

Somebody to love: niet ook van Jefferson Airplane?

  • Volgende discussie
  • Vorige discussie
#15 Geband van Joop

@14: Volgens mij heb je gelijk. Ik dacht even dat hij er niet in staat (er staan veel prachtige nummers niet in de Top 2000) maar hij staat er wel in. ‘White Rabbit’, dat fantastische psychedelische nummer van Jefferson Airplane, staat er vreemd genoeg niet in (maar heb ik daarom in mijn eigen Top2000 (=Top100) gezet: http://gebandvanjoop.blogspot.nl/2015/12/een-echt-alternatieve-top-2000-in-de.html).

  • Volgende discussie
  • Vorige discussie
#16 Janos

Ik zie ‘em in die wiki-lijst (link in artikel) op 301 staan, White Rabbit (en terecht dat die er in staat).

  • Volgende discussie
  • Vorige discussie
#17 Henk van S tot S

@16:
Deze dus.

  • Vorige discussie