Je weet niet wat de chatbot weet

Nooit zal het wonder van de taalmachine die mens heet bezongen zijn. Wat wij allemaal niet weten en kunnen! Een verschil maken tussen de volgende zinnen bijvoorbeeld: Dit is de man die de vrouw die wilde aanvallen weggejaagd had. Dit is de man die de vrouw die wilde aanvallen mij weggejaagd had. Als jij ook een Nederlandsetaalmachine bent, en dat ben je, anders zou je dit niet lezen, dan voel je meteen aan dat de eerste zin grammaticaal juist is, maar de tweede niet. Waarom? De tweede zin kan zelfs betekenis hebben. Zoals de eerste een andere vorm is van de zin: De vrouw die wilde aanvallen had de man weggejaagd. zo zou de tweede ongeveer kunnen betekenen: De vrouw die de man wilde aanvallen had mij weggejaagd. Materie Zoals uit de eerste zin de man naar voren is gehaald als lijdend voorwerp van wegjagen, zo zou het in de tweede naar voren zijn gehaald als lijdend voorwerp van aanvallen. Waarom kan dat tweede niet? En vooral: hoe weten wij dat die tweede zin niet kan? Nooit heeft iemand ons de reden verklaard – tenzij we behalve taalmachines ook docenten syntaxis zijn. Ook heeft niemand ons ooit op zo’n zin gewezen en gezegd: dat kun je dus niet zeggen, je kunt een zinsdeel zoals man wel naar voren halen als het lijdend voorwerp is van de hoofdzin, maar niet als het lijdend voorwerp is van een bijzin van het onderwerp. Als je niet diep in de materie zit, moet je de vorige zin misschien wel twee keer overlezen. Maar je voelt wat daar is uitgedrukt wel aan – je weet immers dat die zin niet goed is, ook al kun je niet uitdrukken hoe dat zit. Verbouwd Er is een oud, leuk boek over taalkunde dat Je weet niet wat je weet heet: we weten kennelijk dingen over de grammatica waarvan we niet eens weten dat we ze weten. Weet de chatbot die dingen ook? Daarover gaat een interessant artikel van de Utrechtse taalkundigen Iris Mulders en Eddy Ruys in het nieuwe Nederlandse taalkundige tijdschrift Nota Bene. Chatbots leren taal alleen maar op basis van voorbeelden. Heel veel voorbeelden, weliswaar, maar ook chatbots wordt er vermoedelijk nooit op gewezen dat de tweede hierboven genoemde zin weliswaar een logische structuur heeft, maar toch ongrammaticaal is. In hun artikel laten Mulders en Ruys zien dat ChatGPT desalniettemin, als je het op de juiste manier vraagt, verschil weet te maken tussen de genoemde zinnen. Dat wil zeggen: hij wijst de juiste zinnen als ongrammaticaal aan. Ik heb het geprobeerd met een andere truc, en daarin blijkt ook wel iets van datzelfde taalgevoel: de zin moet behoorlijk verbouwd worden om er iets van te maken: Het opwindende van de komst van chatbots is dat er voor het eerst in de geschiedenis van de mensheid andere objecten zijn die menselijke taal voortbrengen. Daar zullen we hopelijk veel van leren – zoals hoe dat nu kan, dat we dat zo abstracte verschil tussen zinnen kunnen vatten

Door: Foto: James grills, CC BY-SA 4.0 , via Wikimedia Commons.
Foto: Sargasso achtergrond wereldbol

WW: Vliegende vinkengrammatica

De woensdagmiddag is op GeenCommentaar Wondere Woensdagmiddag. Met extra aandacht voor de nieuwste ontwikkelingen in Wetenschap- en Techniekland

Vink (foto Flickr/mondays child)Hoe meer dierenonderzoek er uitgevoerd wordt, hoe meer de Mens van haar voetstuk valt. Ze bedienen snoepmachines, lezen de Playgirl en maken zelfs rationele beslissingen. Maar taal, dat was toch ons ding? Natuurlijk zijn er allerlei dieren die in meer of mindere mate taalachtige communicatie bezigen, maar echt ingewikkelde taal, met een heuse grammatica was altijd aan ons mensen voorbehouden.

Helaas lijkt ook die vlieger niet meer op te gaan want naar nu blijkt lijken Bengaalse vinken in hun fluitgedrag wel degelijk een grammatica te gebruiken. Al eerder werden vogels ervan verdacht om hun getwitter volgens grammaticale regels de wereld in te sturen, en ook over het walvissengetoeter werden dergelijke claims gemaakt. Maar die beweringen bleven altijd tamelijk ongetest. Tot nu dus.

Om dit te testen splitsten de Japanse onderzoekers van de Universiteit van Kyoto onder leiding van Kentaro Abe opgenomen vogelzang in afzonderlijke ‘woorden’. Deze werden vervolgens in ‘grammaticaal juiste’ en ‘grammaticaal onjuiste’ varianten aan elkaar geknoopt en teruggespeeld voor de vogels. De vogels reageerden op de grammaticale versies en lieten de ongrammaticale onbeantwoord. Volgens Abe toont dit duidelijk aan dat de vinken bepaalde specifieke volgordes (zinsconstructies) wel als een zangroep herkennen en andere niet.

Steun ons!

De redactie van Sargasso bestaat uit een club vrijwilligers. Naast zelf artikelen schrijven struinen we het internet af om interessante artikelen en nieuwswaardige inhoud met lezers te delen. We onderhouden zelf de site en houden als moderator een oogje op de discussies. Je kunt op Sargasso terecht voor artikelen over privacy, klimaat, biodiversiteit, duurzaamheid, politiek, buitenland, religie, economie, wetenschap en het leven van alle dag.

Om Sargasso in stand te houden hebben we wel wat geld nodig. Zodat we de site in de lucht kunnen houden, we af en toe kunnen vergaderen (en borrelen) en om nieuwe dingen te kunnen proberen.

Doe het veilig met NordVPN

Sargasso heeft privacy hoog in het vaandel staan. Nu we allemaal meer dingen online doen is een goede VPN-service belangrijk om je privacy te beschermen. Volgens techsite CNET is NordVPN de meest betrouwbare en veilige VPN-service. De app is makkelijk in gebruik en je kunt tot zes verbindingen tegelijk tot stand brengen. NordVPN kwam bij een speedtest als pijlsnel uit de bus en is dus ook geschikt als je wil gamen, Netflixen of downloaden.

Lezen: Bedrieglijk echt, door Jona Lendering

Bedrieglijk echt gaat over papyrologie en dan vooral over de wedloop tussen wetenschappers en vervalsers. De aanleiding tot het schrijven van het boekje is het Evangelie van de Vrouw van Jezus, dat opdook in het najaar van 2012 en waarvan al na drie weken vaststond dat het een vervalsing was. Ik heb toen aangegeven dat het vreemd was dat de onderzoekster, toen eenmaal duidelijk was dat deze tekst met geen mogelijkheid antiek kon zijn, beweerde dat het lab uitsluitsel kon geven.