Chatbots gebruiken meer naamwoorden

Kun je herkennen of een tekst geschreven is door een computer? Ja, zegt een groep onderzoekers in een recent online geplaatst artikel. Tenminste, als je een computer hebt die het herkennen voor je kan doen. De onderzoekers lieten mensen en chatbots een aantal taalopdrachten doen. Zo moesten ze teksten herschrijven in de stijl van een schoolopstel of een Wikipedia-artikel. Hoe succesvol waren ze erin? Chatbots bleken hun teksten wel licht aan te passen aan het genre, maar veel minder dan de mensen deden. Dat valt in ieder geval op een statistische manier vast te stellen: als je kijkt naar wat voor woorden er gebruikt worden, dan zit er bij de teksten van chatbots minder variatie. Een belangrijk verschil tussen mensen en chatbots was, los van het gekozen genre, dat chatbots een veel ‘naamwoordelijker stijl’ hadden. Ze gebruikten meer zelfstandig naamwoorden (‘huis, genre, chatbot’), meer zogeheten nominalisaties (‘werken is een genot’ in plaats van ‘ik werk graag’) en bijvoeglijk naamwoorden werden vaker bij een zelfstandig naamwoord gezet (‘het mooie huis’) dan in het gezegde (‘het huis is mooi’). Mensen deden veel meer met werkwoorden (‘het huis schittert in de zon’). Simuleren Wat verklaart nu dit verschil? Die chatbots hebben de taal immers van ons geleerd, wat verklaart dan dat ze dingen op zo’n specifieke manier anders doen? De onderzoekers wijzen erop dat het gebruik van veel zelfstandig naamwoorden een tekst erg rijk aan informatie maakt: ieder zelfstandig naamwoord benoemt een zaak of een idee, hoe meer je daarvan geeft, hoe meer informatie in de tekst. Werkwoorden geven je zin wat dat betreft meer lucht. Een probleem van chatbots is volgens de onderzoekers dat ze zich per definitie niet in de lezer kunnen verplaatsen. Ze maken teksten, ze proberen zich niet voor te stellen hoe het is om zo’n tekst te lezen. Dat maakt het ook lastiger om een tekst aan te passen aan de lezer. Die lezer is een mens en wat chatbots ook allemaal kunnen, zich in hun publiek verplaatsen zeker niet. Het is een mooie verklaring, al weet ik niet zo goed hoe je hem zou moeten bewijzen. Met name is me niet duidelijk hoezo chatbots dan niet kunnen simuleren dat ze zich in hun publiek verplaatsen, door hun naamwoordelijke stijl bij gelegenheid af en toe wat te variëren. Maar de bevindingen zijn zeker heel interessant, en kunnen ons denk ik vast iets leren over het verschil tussen mens en robot.

Foto: Claude Monet, Public domain, via Wikimedia Commons

Beïnvloedt taal het denken?

Deel 8 in de serie Wat iedereen moet weten over taal

Onlangs verschenen de resultaten van een onderzoek: wat vinden taalwetenschappers dat mensen moeten weten over taal? Dat resulteerde onder andere in een lijst van 25 vragen. Korte antwoorden op die vragen staan hier op een rijtje.

‘Beïnvloedt taal het denken?’ is een grote vraag, misschien wel te groot voor wetenschappelijk onderzoek. ‘Beïnvloedt je taal je denken’ is behapbaarder, en ondertussen het onderwerp van heel veel wetenschappelijke literatuur.

Zou de mens anders denken als ze in het geheel geen taal had? Het is waarschijnlijk. Een kenmerk van taal is dat je vorm kunt geven aan je gedachten, je kunt ze immers omzetten in woorden en zinnen. Dat betekent op zijn beurt dat we van onze gedachten een soort dingen kunnen maken, die min of meer los van ons staan. We gebruiken dat vermogen om die gedachten te uiten en zo met anderen te delen. Maar we kunnen ze ook gebruiken om zélf kritisch over een eigen gedachte na te denken. Je bewust zijn van het feit dat je een bepaald idee hebt, vereist waarschijnlijk taal.

Makkelijk aan te tonen is het niet, want je zou een vergelijking moeten maken tussen mensen mét en mensen zónder taal, en de tweede groep is bijzonder lastig te traceren. Vervolgens zou je het denkproces van al deze mensen moeten vaststellen, zonder taal. De technieken om iemands gedachten te lezen zijn daarvoor lang niet ver genoeg ontwikkeld. Wat we kunnen zeggen over de relatie tussen taal en denken blijft in die zin vooralsnog op het niveau van speculatie.

Steun ons!

De redactie van Sargasso bestaat uit een club vrijwilligers. Naast zelf artikelen schrijven struinen we het internet af om interessante artikelen en nieuwswaardige inhoud met lezers te delen. We onderhouden zelf de site en houden als moderator een oogje op de discussies. Je kunt op Sargasso terecht voor artikelen over privacy, klimaat, biodiversiteit, duurzaamheid, politiek, buitenland, religie, economie, wetenschap en het leven van alle dag.

Om Sargasso in stand te houden hebben we wel wat geld nodig. Zodat we de site in de lucht kunnen houden, we af en toe kunnen vergaderen (en borrelen) en om nieuwe dingen te kunnen proberen.

Lezen: Venus in het gras, door Christian Jongeneel

Op een vroege zomerochtend loopt de negentienjarige Simone naakt weg van haar vaders boerderij. Ze overtuigt een passerende automobiliste ervan om haar mee te nemen naar een afgelegen vakantiehuis in het zuiden van Frankrijk. Daar ontwikkelt zich een fragiele verstandhouding tussen de twee vrouwen.

Wat een fijne roman is Venus in het gras! Nog nooit kon ik zoveel scènes tijdens het lezen bijna ruiken: de Franse tuin vol kruiden, de schapen in de stal, het versgemaaide gras. – Ionica Smeets, voorzitter Libris Literatuurprijs 2020.

Foto: thierry ehrmann (cc)

De ontsnappingstaalkunstenaar

RECENSIE - Geert Wilders is van alles, maar hij is ook een intrigerend fenomeen. Zo iemand waarvan je je onder andere kunt afvragen: hoe doet hij dat toch? Hoe is het mogelijk dat hij politiek maar blijft overleven – dat hij regelmatig fouten maakt waarvoor anderen zouden worden afgestraft, terwijl hij maar blijft zitten en momenteel nog altijd de grootste partij van Nederland leidt is.

De neerlandicus Robbert Wigt, die eerder een boek schreef over Mark Rutte, komt nu met een boek over de ‘overtuigende taal’ van Wilders. Daarin speelt Rutte trouwens weer een rol, als de enige die het de afgelopen decennia is gelukt om Wilders van zich af te slaan, de enige die aan Wilders gewaagd was.

Is Wilders taal overtuigend? Opvallend is dat op de ene plaats in Wigts boek de theaterdocent Marijn Moerman zegt dat Wilders meer een debater is dan een speecher, terwijl verderop het Denk-Kamerlid Van Baarle zegt ‘Met Wilders heb je eigenlijk geen debat.’ Beide hebben gelijk: als Wilders alleen zou speechen, zou hij niet zo populair zijn, want zijn speeches hangen vaak naar het eentonige. Maar een echte debater is Wilders ook niet, want het is hem niet om de uitwisseling van argumenten te doen. Wilders heeft een manier gevonden om van het debat een monoloog te maken. Dat is wel zijn grootste troef.

Foto: Abhi Sharma (cc)

Ze sprak haar naam uit als Fleuj

RECENSIE - Zeg mij welke taal je spreekt, en ik zeg je wie je bent. Geen twee mensen op de wereld spreken precies hetzelfde, en die verschillen laten altijd iets zien over een verschillende geschiedenis, een verschillende identiteit, een verschillende plaats in de samenleving. Dat je in Rotterdam geboren bent, maar in Den Bosch opgegroeid, dat je een man bent, en theoretisch opgeleid, dat je getrouwd bent met een Italiaanse, dat je bovengemiddeld gefascineerd bent door hoe andere mensen praten: het heeft allemaal invloed op je taalgebruik.

Dat is een waarheid waarnaar al heel veel onderzoek is gedaan, een waarheid bovendien die door verschillende geleerden op een verschillende manieren is uitgewerkt, maar een waarheid waarover nog niet zo heel veel geschreven is. De sociolinguïstiek, de tak van de taalwetenschap die zich met deze waarheid bezighoudt, is altijd populair onder studenten, juist omdat ze zoveel te zeggen heeft over de onvermoede rol van taal in het eigen leven. Maar in heel veel publieksboeken heeft dat niet geresulteerd.

Milieu

De schrijver en taalkundige Khalid Mourigh brengt daar nu verandering in met zijn boek Denkend aan Hollands. De ondertitel van het boek luidt: Wat taal zegt over wie we zijn.

Doneer!

Sargasso is een laagdrempelig platform waarop mensen kunnen publiceren, reageren en discussiëren, vanuit de overtuiging dat bloggers en lezers elkaar aanvullen en versterken. Sargasso heeft een progressieve signatuur, maar is niet dogmatisch. We zijn onbeschaamd intellectueel en kosmopolitisch, maar tegelijkertijd hopeloos genuanceerd. Dat betekent dat we de wereld vanuit een bepaald perspectief bezien, maar openstaan voor andere zienswijzen.

In de rijke historie van Sargasso – een van de oudste blogs van Nederland – vind je onder meer de introductie van het liveblog in Nederland, het munten van de term reaguurder, het op de kaart zetten van datajournalistiek, de strijd voor meer transparantie in het openbaar bestuur (getuige de vele Wob-procedures die Sargasso gevoerd heeft) en de jaarlijkse uitreiking van de Gouden Hockeystick voor de klimaatontkenner van het jaar.

Foto: James grills, CC BY-SA 4.0 , via Wikimedia Commons.

Je weet niet wat de chatbot weet

COLUMN - Nooit zal het wonder van de taalmachine die mens heet bezongen zijn. Wat wij allemaal niet weten en kunnen! Een verschil maken tussen de volgende zinnen bijvoorbeeld:

  • Dit is de man die de vrouw die wilde aanvallen weggejaagd had.
  • Dit is de man die de vrouw die wilde aanvallen mij weggejaagd had.

Als jij ook een Nederlandsetaalmachine bent, en dat ben je, anders zou je dit niet lezen, dan voel je meteen aan dat de eerste zin grammaticaal juist is, maar de tweede niet. Waarom?

De tweede zin kan zelfs betekenis hebben. Zoals de eerste een andere vorm is van de zin:

  • De vrouw die wilde aanvallen had de man weggejaagd.

zo zou de tweede ongeveer kunnen betekenen:

  • De vrouw die de man wilde aanvallen had mij weggejaagd.

Materie

Zoals uit de eerste zin de man naar voren is gehaald als lijdend voorwerp van wegjagen, zo zou het in de tweede naar voren zijn gehaald als lijdend voorwerp van aanvallen. Waarom kan dat tweede niet? En vooral: hoe weten wij dat die tweede zin niet kan? Nooit heeft iemand ons de reden verklaard – tenzij we behalve taalmachines ook docenten syntaxis zijn. Ook heeft niemand ons ooit op zo’n zin gewezen en gezegd: dat kun je dus niet zeggen, je kunt een zinsdeel zoals man wel naar voren halen als het lijdend voorwerp is van de hoofdzin, maar niet als het lijdend voorwerp is van een bijzin van het onderwerp.

Foto: © Marc van Oostendorp joggende hersens cartoon (eigen werk)

Taal leren als mentaal joggen

Vreemde talen leren is gezond. Uit onderzoek weten we dat het cognitief voordelig is om tweetalig te zijn – het maakt je flexibeler, en hoewel er nog geen algemene consensus over is, zijn er aanwijzingen dat ziektes als Alzheimer hierdoor kunnen worden vertraagd.

Vanuit dit perspectief is de komst van de zogeheten grote taalmodellen op het eerste gezicht zorgwekkend. Het moment lijkt nabij dat je een oortje in kunt doen dat jou alles wat je gesprekspartner zegt laat horen, in diens eigen stem, maar dan vertaald in jouw eigen taal. Zet die ander ook een oortje in, dan kun je gesprekken voeren in alle mogelijke talen. Dan zal op zeker moment de vraag opkomen: waarom zou je als mens nog een taal leren? Wie wil er nog Duitse naamvallen stampen als ChatGPT de woorden moeiteloos verbuigt? Als iedereen permanent een automatische simultaantolk ter beschikking heeft, wie gaat dan nog naar het talenlab?

Contact

Daar zijn natuurlijk wel wat argumenten tegenin te brengen. Het is bijvoorbeeld duidelijk dat mensen, in ieder geval voorlopig, en in ieder geval bij intensief en intiem contact, niet altijd afhankelijk zullen willen zijn van een techniek. Dat die techniek bovendien geld kost en het milieu zodanig belast dat ‘iedereen een oortje’ nog ver weg lijkt.

Lezen: Bedrieglijk echt, door Jona Lendering

Bedrieglijk echt gaat over papyrologie en dan vooral over de wedloop tussen wetenschappers en vervalsers. De aanleiding tot het schrijven van het boekje is het Evangelie van de Vrouw van Jezus, dat opdook in het najaar van 2012 en waarvan al na drie weken vaststond dat het een vervalsing was. Ik heb toen aangegeven dat het vreemd was dat de onderzoekster, toen eenmaal duidelijk was dat deze tekst met geen mogelijkheid antiek kon zijn, beweerde dat het lab uitsluitsel kon geven.

Lezen: De BVD in de politiek, door Jos van Dijk

Tot het eind van de Koude Oorlog heeft de BVD de CPN in de gaten gehouden. Maar de dienst deed veel meer dan spioneren. Op basis van nieuw archiefmateriaal van de AIVD laat dit boek zien hoe de geheime dienst in de jaren vijftig en zestig het communisme in Nederland probeerde te ondermijnen. De BVD zette tot tweemaal toe personeel en financiële middelen in voor een concurrerende communistische partij. BVD-agenten hielpen actief mee met geld inzamelen voor de verkiezingscampagne. De regering liet deze operaties oogluikend toe. Het parlement wist van niets.

Foto: Rijksoverheid, foto Martijn Beekman

Dick ‘zeg maar’ Schoof

COLUMN - Een interessant kenmerk van de huidige Nederlandse premier, drs. Dick Schoof, is dat hij zo slecht spreekt. Nederlandse politici zijn zelden wonderen van retorisch talent, en we hebben eerder premiers gehad waarnaar het moeilijk luisteren was. Maar zelfs Jan-Peter Balkenende kon nog wel uit zijn woorden komen.

Het heeft er ongetwijfeld mee te maken dat we gewend zijn aan politici die over het algemeen aan verkiezingen hebben moeten meedoen en daar kiezers hebben moeten overtuigen. En kiezers raken nu eenmaal niet zo snel overtuigd van iemand die een beetje verlegen staat te stamelen. Wat dat betreft heeft het optreden van Schoof, die ongeschoold praat en daarbij allerlei tics laat zien die een beroepspoliticus allang had weggetraind, iets verfrissends – mits we even vergeten dat hij een kabinet leidt dat op dubieuze gronden het parlement buiten spel wil zetten en tussen neus en lippen door zonder enige vorm van argumentatie de botte bijl zet in de boekhandel, de journalistiek en de wetenschap.

Een van zijn verbale tics is zeg maar. Neem Schoofs persconferentie van afgelopen vrijdag.

Dat gebruik van zeg maar lijkt me hier voer voor een onderzoekje. Als ik goed tel, zegt Schoof hier 47 keer ‘zeg maar’ in minder dan 34 minuten. Dat is bijna drie keer per twee minuten en eigenlijk meer, want af en toe zijn er ook nog journalisten aan het woord (en geen van hen zegt ooit ‘zeg maar’).

Foto: The Lowry (cc)

Kreupeltaalkunde

Er is in de taalkunde, en in veel menswetenschappen, de laatste decennia betrekkelijk veel aandacht voor het feit dat mensen een lichaam hebben. Mensen verzetten zich tegen de gedachte dat ons denken zich in een platoonse abstracte wereld bevindt, ver weg van ons vlees en bloed. Toch heeft in ieder geval in wat ik allemaal gelezen heb, het idee van embodied cognition (denken in een lichaam) weinig interessante inzichten opgeleverd – het blijft vooral bij de stelling dat het naïef is om in navolging van Descartes lichaam en geest uit elkaar te trekken, zonder dat mensen zich vervolgens bekreunen om bewijzen voor de omgekeerde stelling.

Een hoofdstuk van de betreurde Amerikaanse taalkundige Jon Henner (1982-2023) in het onlangs verschenen boek Inclusion in linguistics (gratis raadpleegbaar) bespreekt de kwestie uit een interessant perspectief: wordt taal die uit lichamen komt die maatschappelijk op de een of andere manier als minderwaardig worden gezien in de taalwetenschap wel voldoende serieus genomen?

Henner had zelf te maken met twee ‘handicaps’: hij kon niet horen en hij was autistisch. Zowel gebarentaal als de taal van autisten werden al langer onderzocht, maar volgens Henner gebeurde dat nog altijd te zeer in termen van ‘achterstand’. Hij wilde dat we alle taal van iedereen (uit ieder lichaam) zouden zien als volwaardige taal. Hij stond een vorm van taalkunde voor die hij crip linguistics noemde. Crip is van oorsprong een scheldwoord voor gehandicapten (kreupele), dat inmiddels door sommigen als een geuzenterm wordt gebruikt. In een vorig jaar gepubliceerd ‘crip linguistics manifesto’ schreef Henner, samen met zijn collega Octavian Robinson:

Doe het veilig met NordVPN

Sargasso heeft privacy hoog in het vaandel staan. Nu we allemaal meer dingen online doen is een goede VPN-service belangrijk om je privacy te beschermen. Volgens techsite CNET is NordVPN de meest betrouwbare en veilige VPN-service. De app is makkelijk in gebruik en je kunt tot zes verbindingen tegelijk tot stand brengen. NordVPN kwam bij een speedtest als pijlsnel uit de bus en is dus ook geschikt als je wil gamen, Netflixen of downloaden.

Foto: DAL-·E A symbolic representation of the world where various people around a large globe speaking their language

Verkiezingsprogramma van de Partij voor Taal

COLUMN - Wie denkt dat taal een belangrijk politiek onderwerp is, krijgt niet veel hoop van de verkiezingsprogramma’s van de Nederlandse politieke partijen in 2023. Het is armoe troef: men slaakt wat kreten die al vaker geslaakt worden zonder dat ze ooit ergens toe hebben geleid, of dat het duidelijk is dat ze ooit ergens toe zouden leiden. Zo willen de christelijke partijen al decennia lang dat het Nederlands in de grondwet komt, en ik durf nu al te voorspellen dat dit ook in de komende periode niet gaat gebeuren. Als het wel gebeurt, betekent het overigens nog steeds nauwelijks iets.

Over de andere hete hangijzer, het Engels op de universiteiten, is iedereen het erover eens dat dit minder moet, maar niemand heeft een plan over hoe dat dan daadwerkelijk zou moeten gebeuren.

Als je zo’n analyse maakt, zijn er altijd mensen die vragen: maar hoe zou jij het dan doen? Welnu, hieronder staan een aantal punten. Ik bied ze open access aan, iedere partij die ze wil adopteren, is van harte welkom.

Uitgangspunt

Taal is belangrijk voor een samenleving. Dankzij taal kunnen kinderen zich ontwikkelen en volwassenen tot overeenstemming komen. Dankzij taal kunnen we ons allen scholen en elkaar beter leren kennen. Taal is een van de belangrijkste immateriële goederen die we hebben.

Foto: DALL·E-2023-10-27-21.59.12 Een groep diverse mensen van verschillende afkomsten en geslachten staan in een halve cirkel met boeken in hun handen

Verkiezingsprogramma’s over taal: NSC, BBB, Denk

ANALYSE - Marc van Oostendorp heeft de verkiezingsprogramma’s doorgeworsteld en zocht naar de standpunten over taal en literatuur. Het eerste artikel (met VVD, PVV, JA21 en FvD) verscheen ook bij Sargasso. Op zijn eigen webstek volgden analyses van de programma’s van CDA, CU, SGP (30 oktober), PvdA/GL, BIJ1, SP, PvdD (1 november), D66 en Volt (3 november) en gisteren sloot hij af met NSC, BBB en DENK, hieronder integraal overgenomen.

Tenzij er de komende tijd ineens nog een partij uit het niets als een komeet komt opklimmen. zijn we aan de laatste partijen in dit overzicht beland, die eerlijk gezegd weinig meer met elkaar gemeen hebben dan dat ze allemaal betrekkelijk laat waren met het formuleren van hun verkiezingsprogramma.

NSC

De partij van Pieter Omtzigt heeft de meest complete tekst over een regionaal taalbeleid – wat sowieso naast het Engels op de universiteit hét taalonderwerp is bij de huidige Tweede Kamerverkiezingen:

Regionale talen

Regionale identiteiten en culturen verdienen erkenning, waardering en bescherming. Hierover zijn concrete afspraken gemaakt in het Europees Handvest voor regionale talen of talen van minderheden en in het Kaderverdrag inzake de bescherming van nationale minderheden. Deze afspraken moeten serieus worden nageleefd. We zetten hierbij in op bewustwording, zichtbaarheid en een stevige wettelijke verankering en naleving van de verdragen.

  • We houden ons aan de verplichtingen uit het Europees Handvest en het Kaderverdrag om in het onderwijs goed aandacht te besteden aan regionale geschiedenis, cultuur en taal, zoals het Fries, Nedersaksisch, Limburgs, Jiddisch en Sinti-Romanes.
  • Wij erkennen het belang van andere Europese (taal)minderheden en bevorderen de samenwerking tussen de verschillende taalregio’s.
  • Het Fries is een officiële taal in Nederland en moet in de Grondwet worden erkend. Dat geldt ook voor de Nederlandse taal zelf en voor de Nederlandse Gebarentaal.
  • Wij werken vanwege de relatie met de eilanden Aruba, Bonaire en Curaçao actief mee aan het verbeteren van de taalpositie van het Papiaments.
Volgende