Begrijpt de chatbot dit of doorgrondt hij het slechts?

Soms worden filosofische vragen na vele jaren ineens praktisch. Zoiets beleven we nu met het woord begrip. Filosofen hebben baden met bloed gevuld tijdens hun discussies over de vraag wat het precies wil zeggen dat we een bepaalde tekst begrijpen, en nu wordt de mensheid ineens geconfronteerd met een apparaat waarvan je je concreet kunt afvragen wat het begrijpt. De chatbot. Neem dit artikel dat onlangs verscheen op de taalkunde-site LingBuzz. Een groep Amerikaanse taalkundigen laat er zien dat chatbots testjes zoals de volgende uitstekend kunnen doorstaan: Flavia en Jack ontweken Mary en Franck werd ontweken door Lucy en Flavia. Heeft Franck in deze context iemand ontweken? Het antwoord op deze vraag is natuurlijk nee. Een jaar geleden deden chatbots het niet altijd goed. Als ik het nu aan ChatGPT vraag, antwoordt deze: Nee. Er staat dat Franck werd ontweken door Lucy en Flavia — hij is dus het object van het ontwijken, niet degene die iemand anders ontweek. Zelfs de fouten die de bots maakten lijken op die van mensen. Zo zeiden ze vaker ten onrechte ja op de volgende variant van deze vraag: Cleo kuste Alice en Alice werd gekust door Mary. Cleo en Alice werden gekust door Mary. Werd Mary in deze context gekust? Anders dan ontwijken is kussen vaak wederkerig. Je kunt je dus voorstellen dat Mary tijdens haar kusactiviteiten zelf ook een zoentje kreeg van Cleo en Alice. Mensen trappen daar weleens in, maar chatbots dus ook. Reserveren De vraag is nu: betekent dit dat chatbots dit alles ook begrijpen? Je kunt nog steeds zeggen: nee, zo’n chatbot heeft geen idee hoe het voelt om te kussen of gekust te worden, kent de horreurs niet van het ontweken worden. Die apparaten doen niet meer dan voorspellen welk woord gegeven een bepaalde context gezegd wordt. Ze manipuleren symbolen, en het lijkt daardoor alsof ze iets begrijpen, maar dat laat uiteindelijk alleen maar zien dat deze tests geen echt begrip meten. De vraag is dan wat dan wél echt begrip is. Chatbots halen sinds een paar jaar ook sinds gemak allerlei examens, inclusief examens (voor Nederlands en de andere talen) die geacht worden ’tekstbegrip’ te toetsen. Hebben we ons daar dan al die jaren in vergist? En zo ja, zijn er dan toetsen te bedenken voor taalbegrip die mensen wel en chatbots niet kunnen doorstaan? Ook niet de mogelijk nog veel betere chatbots van over vijf jaar? De Amerikanen maken overigens gebruik van een semantisch verschil in het Engels dat het Nederlands niet zo duidelijk maakt: dat tussen understand en comprehend. Het eerste is vele malen gebruikelijker, maar in dit artikel hebben ze het over het tweede. Een belangrijk verschil is dat comprehension veel analytischer is dan understanding. Het tweede kan ook gebruikt worden voor gevoelsmatig of vaag begrip of onvolledig begrip. Comprehension kun je ongeveer vertalen met vatten of doorgronden, maar die termen zijn niet helemaal precies. Het Engels beschikt daardoor vooralsnog over de mogelijkheid om een bepaald type begrip te reserveren voor de mens. Maar het is niet duidelijk hoe lang dat nog blijft duren.

Door: Foto: XxXddddddddd, via Pixabay
Foto: Abhi Sharma (cc)

Ze sprak haar naam uit als Fleuj

RECENSIE - Zeg mij welke taal je spreekt, en ik zeg je wie je bent. Geen twee mensen op de wereld spreken precies hetzelfde, en die verschillen laten altijd iets zien over een verschillende geschiedenis, een verschillende identiteit, een verschillende plaats in de samenleving. Dat je in Rotterdam geboren bent, maar in Den Bosch opgegroeid, dat je een man bent, en theoretisch opgeleid, dat je getrouwd bent met een Italiaanse, dat je bovengemiddeld gefascineerd bent door hoe andere mensen praten: het heeft allemaal invloed op je taalgebruik.

Dat is een waarheid waarnaar al heel veel onderzoek is gedaan, een waarheid bovendien die door verschillende geleerden op een verschillende manieren is uitgewerkt, maar een waarheid waarover nog niet zo heel veel geschreven is. De sociolinguïstiek, de tak van de taalwetenschap die zich met deze waarheid bezighoudt, is altijd populair onder studenten, juist omdat ze zoveel te zeggen heeft over de onvermoede rol van taal in het eigen leven. Maar in heel veel publieksboeken heeft dat niet geresulteerd.

Milieu

De schrijver en taalkundige Khalid Mourigh brengt daar nu verandering in met zijn boek Denkend aan Hollands. De ondertitel van het boek luidt: Wat taal zegt over wie we zijn.

Doe het veilig met NordVPN

Sargasso heeft privacy hoog in het vaandel staan. Nu we allemaal meer dingen online doen is een goede VPN-service belangrijk om je privacy te beschermen. Volgens techsite CNET is NordVPN de meest betrouwbare en veilige VPN-service. De app is makkelijk in gebruik en je kunt tot zes verbindingen tegelijk tot stand brengen. NordVPN kwam bij een speedtest als pijlsnel uit de bus en is dus ook geschikt als je wil gamen, Netflixen of downloaden.

Lezen: De BVD in de politiek, door Jos van Dijk

Tot het eind van de Koude Oorlog heeft de BVD de CPN in de gaten gehouden. Maar de dienst deed veel meer dan spioneren. Op basis van nieuw archiefmateriaal van de AIVD laat dit boek zien hoe de geheime dienst in de jaren vijftig en zestig het communisme in Nederland probeerde te ondermijnen. De BVD zette tot tweemaal toe personeel en financiële middelen in voor een concurrerende communistische partij. BVD-agenten hielpen actief mee met geld inzamelen voor de verkiezingscampagne. De regering liet deze operaties oogluikend toe. Het parlement wist van niets.

Foto: Elvin (cc)

Doe eens wat voor het Nederlands

Mensen vragen me in deze duistere tijden weleens of ik, hoogleraar Nederlands, nu niet aan de goede kant zit. Nationalisme tiert welig en de regering bindt de strijd aan met het Engelstalige onderwijs.

Nu valt het leven aan de goede kant nogal tegen. Ik heb er 8 jaar geleden al op gewezen dat de leider van inmiddels de grootste partij in het Nederlandse parlement waarschijnlijk de parlementariër is die het vaakst Engels gebruikt in de socialemedia (‘Fantastic speech by US Vice-President @JDVance!’). Bovendien richt de regering zich momenteel wel tegen het Engels – maar het maakt er nauwelijks een geheim van dat het hier gaat om een bezuinigingsmaatregel – iets constructiefs wordt er niet mee beoogd, zeker ook niet voor het Nederlands.

Afgelopen donderdag was het ‘dag van de moedertaal’, en de acteur en bestuurder Boris van der Ham greep de gelegenheid aan om hier bij het tv-programma Goedemorgen Nederland ook op te wijzen. De Nederlandse regering steekt geen vinger uit voor onze taal. Dat betreft bijvoorbeeld Van der Hams eigen sector, de podiumkunsten:

Je ziet daar in het klein wat er met het Nederlands aan de hand is. Het is veel minder risicovol om bijvoorbeeld een Engelstalige musical naar Nederland te halen, te vertalen en uit te gaan voeren. Als je een nieuwe Nederlandse voorstelling wilt gaan maken voor een groot publiek, dan is het heel ingewikkeld om de financiering rond te krijgen. Als dit steeds meer onder druk komt te staan, wordt het minder gemaakt. Dan hebben we straks alleen maar Amerikaanse en Engelse voorstellingen en films. Dus daar moet iets aan gebeuren!

Foto: The Lowry (cc)

Kreupeltaalkunde

Er is in de taalkunde, en in veel menswetenschappen, de laatste decennia betrekkelijk veel aandacht voor het feit dat mensen een lichaam hebben. Mensen verzetten zich tegen de gedachte dat ons denken zich in een platoonse abstracte wereld bevindt, ver weg van ons vlees en bloed. Toch heeft in ieder geval in wat ik allemaal gelezen heb, het idee van embodied cognition (denken in een lichaam) weinig interessante inzichten opgeleverd – het blijft vooral bij de stelling dat het naïef is om in navolging van Descartes lichaam en geest uit elkaar te trekken, zonder dat mensen zich vervolgens bekreunen om bewijzen voor de omgekeerde stelling.

Een hoofdstuk van de betreurde Amerikaanse taalkundige Jon Henner (1982-2023) in het onlangs verschenen boek Inclusion in linguistics (gratis raadpleegbaar) bespreekt de kwestie uit een interessant perspectief: wordt taal die uit lichamen komt die maatschappelijk op de een of andere manier als minderwaardig worden gezien in de taalwetenschap wel voldoende serieus genomen?

Henner had zelf te maken met twee ‘handicaps’: hij kon niet horen en hij was autistisch. Zowel gebarentaal als de taal van autisten werden al langer onderzocht, maar volgens Henner gebeurde dat nog altijd te zeer in termen van ‘achterstand’. Hij wilde dat we alle taal van iedereen (uit ieder lichaam) zouden zien als volwaardige taal. Hij stond een vorm van taalkunde voor die hij crip linguistics noemde. Crip is van oorsprong een scheldwoord voor gehandicapten (kreupele), dat inmiddels door sommigen als een geuzenterm wordt gebruikt. In een vorig jaar gepubliceerd ‘crip linguistics manifesto’ schreef Henner, samen met zijn collega Octavian Robinson:

Lezen: Venus in het gras, door Christian Jongeneel

Op een vroege zomerochtend loopt de negentienjarige Simone naakt weg van haar vaders boerderij. Ze overtuigt een passerende automobiliste ervan om haar mee te nemen naar een afgelegen vakantiehuis in het zuiden van Frankrijk. Daar ontwikkelt zich een fragiele verstandhouding tussen de twee vrouwen.

Wat een fijne roman is Venus in het gras! Nog nooit kon ik zoveel scènes tijdens het lezen bijna ruiken: de Franse tuin vol kruiden, de schapen in de stal, het versgemaaide gras. – Ionica Smeets, voorzitter Libris Literatuurprijs 2020.

Steun ons!

De redactie van Sargasso bestaat uit een club vrijwilligers. Naast zelf artikelen schrijven struinen we het internet af om interessante artikelen en nieuwswaardige inhoud met lezers te delen. We onderhouden zelf de site en houden als moderator een oogje op de discussies. Je kunt op Sargasso terecht voor artikelen over privacy, klimaat, biodiversiteit, duurzaamheid, politiek, buitenland, religie, economie, wetenschap en het leven van alle dag.

Om Sargasso in stand te houden hebben we wel wat geld nodig. Zodat we de site in de lucht kunnen houden, we af en toe kunnen vergaderen (en borrelen) en om nieuwe dingen te kunnen proberen.

Foto: Sagaru9535, CC BY-SA 4.0 , via Wikimedia Commons.

Python en poëzie

Een van de interessantste Nederlanders op dit moment is ongetwijfeld Guido van Rossum, de ontwerper van de programmeertaal Python. Het is niet overdreven om te zeggen dat dit inmiddels wereldwijd de populairste programmeertaal is – een taal die vrijwel iedere programmeur wel een beetje kent. Hij is bovendien iemand die over heel veel onderwerpen goed heeft nagedacht en zijn mening daarover eloquent kan verwoorden, zoals bijvoorbeeld blijkt uit het onderstaandre interview met Lex Fridman.

Dat soort interviews kom je in het Nederlands niet tegen. Ik vraag me af of Van Rossum ooit serieus in de Nederlandse media aan het woord is gekomen. Dat geldt zelfs niet voor podcasts of YouTube-kanalen of andere alternatieve kanalen. Wat zijn we toch ook een armoedige cultuur. Voor 99% procent van de Nederlanders bestaat Van Rossum helemaal niet.

(Even een rant. Het is in sommige kringen nog altijd sjiek om af te geven op de verengelsing: in zo’n vreemde taal kun je toch nooit een diepe gedachte uitdrukken? Wat die mensen nooit in de beschouwing betrekken is dat je in het Nederlands maar zelden een diepe gedachte hoort uitdrukken. Wie interessante hedendaagse intellectuele discussies wil horen, moet wel Engels leren. De verarming van het Nederlands komt niet door het Engels, maar door het gebrek aan intellectuele cultuur. Einde rant.)

Foto: Vox España (cc)

Genderneutrale sjwa na het fascisme

Giorgia Meloni, een politica die wel ‘postfascistisch’ genoemd wordt, is de nieuwe premier van Italië, en een van haar eerste daden was dat ze aankondigde niet als ‘la presidente’ te willen worden benoemd, met een vrouwelijk lidwoord la, maar als ‘il presidente’. Het Italiaans telt traditioneel slechts twee grammaticale geslachten, en daarbij geldt de mannelijke vorm als neutraal, ongeveer zoals bakker in het Nederlands traditioneel als mannelijk en neutraal geldt.

Het leverde Meloni kritische commentaren op, bijvoorbeeld op Twitter:

(Meloni wil ‘il’ presidente genoemd worden. Nou, nee, mijn beste: alleen pronouns die corresponderen met wat je tussen je benen hebt, wij wijken niet voor gender-ideologie!)

De beslissing valt natuurlijk ook niet anders te zien dan als onderdeel van de discussie over genderneutrale taal die in grote delen van de wereld woedt, en zeker ook in Italië. Het is een eigenaardig kenmerk van al die discussies dat men nauwelijks over de taalgrenzen heen kijkt. Naar de discussie in Amerika wordt nog wel verwezen, maar dat overal in Europa over dit onderwerp gesproken wordt, daarvan lijkt vrijwel niemand zich bewust. Terwijl het, zou je zeggen, zowel voor voor- als tegenstanders interessant kan zijn kennis te nemen van wat er elders te berde wordt gebracht. (Voor de Italianen is het bijvoorbeeld potentieel interessant dat de Académie française enkele jaren geleden besloot dat naar vrouwelijke ministers verwezen moet worden met le ministre omdat ‘functie voor persoon gaat’; maar dat zelfs de Franse regering zich daar niet aan houdt.)

Lezen: Bedrieglijk echt, door Jona Lendering

Bedrieglijk echt gaat over papyrologie en dan vooral over de wedloop tussen wetenschappers en vervalsers. De aanleiding tot het schrijven van het boekje is het Evangelie van de Vrouw van Jezus, dat opdook in het najaar van 2012 en waarvan al na drie weken vaststond dat het een vervalsing was. Ik heb toen aangegeven dat het vreemd was dat de onderzoekster, toen eenmaal duidelijk was dat deze tekst met geen mogelijkheid antiek kon zijn, beweerde dat het lab uitsluitsel kon geven.

Foto: Elizabeth Hahn (cc)

Hoe uit taalcontact nieuwe taal ontstaat

COLUMN - Er is de laatste jaren in de taalkundige literatuur veel aandacht voor de gevolgen van taalcontact: wat gebeurt er als groepen sprekers van verschillende talen bij elkaar komen, bijvoorbeeld door migratie? Of wanneer sprekers meer dan één taal beheersen? Die talen beïnvloeden dan elkaar, en dit soort contact is waarschijnlijk een drijvende kracht achter veel taalveranderingen. Vooral als we in beschouwing nemen dat zulk contact zich ook kan afspelen tussen sprekers van sterk op elkaar lijkende taalsystemen, zoals dialecten. In dat geval spreken we wel van koinè-vorming, maar het is feitelijk hetzelfde verschijnsel op een kleinere schaal.

In een net verschenen artikel in de Language and Linguistic Compass geeft de Puertoricaanse auteur Cristopher Font-Santiago samen met twee Amerikaanse collega’s een overzicht over een verschijnsel in koinè-vorming dat pas de laatste jaren is opgemerkt. Zij noemen dat reallocatie: variatie die eerst puur regionaal was (in het ene dorp zei men iks in het andere eks) verdwijnt niet altijd per se als de sprekers uit die dorpen naar elkaar toe groeien en gaandeweg één taal of dialect spreken. Zowel iks als eks blijven bestaan, maar ze krijgen een verschillende functie: iks is bijvoorbeeld voortaan de deftige, geleerde vorm en eks de platte, boerse. De variatie is dus sociaal gemotiveerd geworden.

Boers Nederlands

Foto: Foto Giammarco op Unsplash.

Zijn denken en communiceren hetzelfde?

Een van de vele discussies die de taalwetenschap al eeuwen splijt is die van de functie van taal. Dat de mens taal heeft, kost op zijn minst moeite – moeite om de taal te leren, moeite om de hersenen te pijnigen bij het zoeken van woorden, het plaatsen van die woorden in zinnen enzovoort. Waarom doen we dat?

Er zijn twee belangrijke kampen: taal is om in te denken, en taal is om te communiceren. De eerste school heeft evident het probleem dat we veel taal niet binnen in ons hoofd laten omgaan, maar dat we ook onze tong en lippen bewegen (of onze handen, in het geval van gebarentaal). De tweede school heeft het probleem dat er is aangetoond dat de structuur van taal minstens voor een deel lijkt te bepalen hoe we denken (zie bijvoorbeeld hier).

De Oostenrijkse taalkundige Martina Wiltschko komt nu in het tijdschrift Glossa met een mogelijke oplossing: taal is er zowel voor taal als voor denken.

Dat klinkt op het eerste oor wat flauw: de ene groep zegt A, de andere zegt B, en jij komt en zegt ‘het is allebei een beetje waar’. Maar Wiltschko biedt interessante argumenten. Ze laat bijvoorbeeld zien dat er in een zin vaak twee elementen zitten: elementen die een gedachte uitdrukken en elementen die gaan over de interactie met de gesprekspartner:

Doneer!

Sargasso is een laagdrempelig platform waarop mensen kunnen publiceren, reageren en discussiëren, vanuit de overtuiging dat bloggers en lezers elkaar aanvullen en versterken. Sargasso heeft een progressieve signatuur, maar is niet dogmatisch. We zijn onbeschaamd intellectueel en kosmopolitisch, maar tegelijkertijd hopeloos genuanceerd. Dat betekent dat we de wereld vanuit een bepaald perspectief bezien, maar openstaan voor andere zienswijzen.

In de rijke historie van Sargasso – een van de oudste blogs van Nederland – vind je onder meer de introductie van het liveblog in Nederland, het munten van de term reaguurder, het op de kaart zetten van datajournalistiek, de strijd voor meer transparantie in het openbaar bestuur (getuige de vele Wob-procedures die Sargasso gevoerd heeft) en de jaarlijkse uitreiking van de Gouden Hockeystick voor de klimaatontkenner van het jaar.

Lezen: Venus in het gras, door Christian Jongeneel

Op een vroege zomerochtend loopt de negentienjarige Simone naakt weg van haar vaders boerderij. Ze overtuigt een passerende automobiliste ervan om haar mee te nemen naar een afgelegen vakantiehuis in het zuiden van Frankrijk. Daar ontwikkelt zich een fragiele verstandhouding tussen de twee vrouwen.

Wat een fijne roman is Venus in het gras! Nog nooit kon ik zoveel scènes tijdens het lezen bijna ruiken: de Franse tuin vol kruiden, de schapen in de stal, het versgemaaide gras. – Ionica Smeets, voorzitter Libris Literatuurprijs 2020.

Foto: Sargasso achtergrond wereldbol

Ras, gender en het centrale dogma van de taalkunde

Boekomslag Dat mag je ook al niet meer zeggen © Onze Taal

Er woedt een belangrijke maatschappelijke discussie over taal waarover je maar weinig taalkundigen hoort in het publieke domein: de discussie over hoe we allerlei identiteiten benoemen – discussie over wit tegenover blank, over slaafgemaakte, over non-binair taalgebruik, enzovoort: over de vraag in hoeverre de taal moet worden aangepast aan een veranderende sociale werkelijkheid.

Een reden waarom je er zo weinig taalkundigen over hoort, heeft volgens mij te maken met wat ik beschouw als het centrale dogma van de taalwetenschap, iets waarover vrijwel alle taalkundigen het, ondanks enorme verschillen op allerlei gebied, eens zijn:

Het centrale dogma van de taalwetenschap. Taal is een natuurlijk fenomeen. Ze verandert voortdurend, maar het is niet mogelijk om haar te veranderen.

Het centrale dogma gaat in tegen de manier waarop de meeste niet-taalkundigen taal zien: als een cultuurproduct, een instrument dat we hebben gemaakt, en dat je als liefhebber van de traditie liever niet maar als pragmaticus liever wel verandert. Volgens het centrale dogma zijn huidige pogingen om bijvoorbeeld genderneutrale taal in te voeren, vrijwel zeker tot discussie gedoemd. En veel meer dan dat valt er volgens dat dogma dan ook niet over te zeggen.

De taalwetenschap heeft overigens ook veel te danken aan het centrale dogma. Het is de grondslag van het relatieve succes van het vak in de afgelopen twee eeuwen – de visie dat je taal kunt zien als iets dat op de een of andere manier onderhevig is aan natuurwetten heeft tot veel resultaten geleid. De menselijke wil met al zijn grilligheid heeft er niet zoveel mee te maken. Het is trouwens ook echt lastig om voorbeelden aan te wijzen waar de taal veranderd is omdat de taalgebruikers dat beter vonden, vooral als je meeneemt dat soms autoriteiten natuurlijk invloed kunnen hebben op hoe mensen in het openbare leven spreken, maar dat de meeste taal in kleine kring of de beslotenheid van het eigen huis wordt gebruikt.

Foto: Sargasso achtergrond wereldbol

Hoe meer mensen een taal leren, hoe makkelijker die taal wordt

Wordt een taal gemakkelijker wanneer veel mensen haar leren? Daarover woedt al enige tijd discussie in taalkundige kringen. Aan de ene kant hebben mensen een bijna instinctieve afkeer van de gedachte dat je talen überhaupt op een schaal zou kunnen plaatsen van eenvoudig naar complex. Dat idee is in het verleden ook wel misbruikt om racistische gedachten te ondersteunen: simpele talen worden gesproken door simpele mensen. Bovendien is het idee van relatieve eenvoud in tegenspraak met wat we vinden: kinderen over de hele wereld doen er in grote lijnen even snel over om hun moedertaal te leren.

Aan de andere kant is het ook weer niet zo’n gekke gedachte dat een taal op een bepaalde schaal eenvoudiger wordt als buitenstaanders haar leren. Het is óók een ervaringsfeit dat veel naamvallen of ingewikkelde werkwoordvervoeging een taal moeilijker maakt als vreemdeling. Hier zit dus misschien een verschil tussen een taal leren als je moedertaal (L1 heet dat dan) of als vreemde taal (L2). Misschien zijn volwassenen minder goed in het leren van die eigenaardige kronkels die kinderen moeiteloos oppikken. Als er nu in een gemeenschap veel L2-sprekers komen, dan groeien nieuwe generaties L1-sprekers op terwijl ze veel ‘fouten’ horen. Die fouten maken het lastiger om dan het goede systeem alsnog op te pikken – je krijgt teveel tegenstrijdige informatie als kind. Op die manier zouden talen dus in ieder geval in sommige opzichten (zoals vervoeging en verbuiging) wel degelijk eenvoudiger kunnen worden. Verschillen tussen talen liggen dan niet aan de aangeboren intelligentie van de sprekers, maar aan de openheid van de samenleving.

Volgende