The neural basis of structure in language Gideon Borensztajn Samenvatting: In dit proefschrift onderzoek ik de neurale mechanismen, die ten grondslag liggen aan het menselijk vermogen tot het leren, onthouden en gebruiken van grammaticale structuur in taal, de syntax. Daarbij gebruik ik inzichten uit de taalkunde, de cognitieve psychologie en de neurobiologie. Uit taalkundig onderzoek blijkt dat men de structuur van vrijwel alle talen, kort samengevat, als volgt kan karakteriseren: taal is produktief -- met een beperkt aantal woorden en taalregels kunnen wij een onbeperkt aantal nieuwe zinnen maken en begrijpen. Daarnaast is taal hiërarchisch -- zinnen zijn opgebouwd uit zinsdelen, welke laatste weer kunnen zijn opgebouwd uit andere zinsdelen, etc. Deze twee kenmerken leveren meteen de minimum voorwaarden waaraan een systeem voor taalverwerking, zoals het menselijk brein, moet voldoen. Een eerste bijdrage van dit proefschrift is om deze voorwaarden zo precies mogelijk te formuleren, zodat verschillende theorieën over informatieverwerking in het brein (zogenaamde neurale netwerken) hieraan kunnen worden getoetst. Hieruit blijkt dat bestaande klassen van neurale netwerken (in het bijzonder de zogenaamde gedistribueerde recurrente netwerken) ongeschikt zijn voor het modelleren van taal, vanwege bepaalde oversimplificerende aannames. In de rest van het proefschrift ontwikkel ik daarom een nieuwe neurale theorie van syntax, die wel rekening houdt met de hiërarchische structuur en productiviteit van taal. Daarbij heb ik mij laten inspireren door Jeff Hawkins' ``Memory Prediction Framework'' (MPF). Dit is een theorie over het brein die stelt dat de belangrijkste functie van de neocortex (een deel van de hersenschors) het voorspellen van nieuwe situaties en het anticiperen op toekomstige acties is. Volgens Hawkins slaat de neocortex daartoe alle informatie en kennis op als temporele sequenties, met een hiërarchische structuur. Knopen, die hoger liggen in de hiërarchie, representeren abstractere begrippen en langere tijdspannes (temporele compressie). Terwijl Hawkins zijn theorie vooral heeft uitgewerkt voor visuele waarneming, benadruk ik de analogieën met taal: ook syntactische categorieën vertegenwoordigen temporele sequenties (namelijk van woorden); wanneer deze in een vroeg stadium van een zin herkend worden helpen ze het verdere verloop van de zin te voorspellen. Ik stel voor dat syntactische categorieën, net als visuele categorieën, lokaal in het brein zijn geëncodeerd in corticale kolommen, en bovendien dat de hiërarchische en topologische organisatie van al deze `syntactische' kolommen samen een grammatica vormt. Een tweede inspiratiebron voor mijn onderzoek is de rol van het geheugen in taal. Een belangrijke vraag in de taalkunde is hoe zinsfragmenten (bestaande uit meerdere woorden) zijn opgeslagen in het geheugen, zodat ze als geheel kunnen worden hergebruikt in nieuwe zinnen. Voorbeelden hiervan zijn `Hoe gaat het ermee?', of `in aanmerking genomen, dat…’. Volgens sommige taalkundigen is in feite elke zin samengesteld uit kleinere of grotere brokstukken van andere zinnen. Om bovenstaande vraag te kunnen beantwoorden stel ik voor dat we in de taalkunde, net als in de cognitieve psychologie, onderscheid moeten maken tussen twee soorten geheugens: een geheugen voor abstracte, relationele kennis, het zogeheten `semantische' geheugen, en een geheugen voor individuele gebeurtenissen, geplaatst in een persoonlijke context, het zogeheten `episodische geheugen' (bijvoorbeeld de herinnering van een verjaardagsfeestje). In dit proefschrift verdedig ik de stelling dat, terwijl abstracte taalregels en syntactische categorieën onderdeel uitmaken van het semantische geheugen, het episodische geheugen verantwoordelijk is voor het onthouden van zinsfragmenten (zoals bovengenoemde), en zelfs complete zinnen. Het episodische geheugen speelt eveneens een belangrijke rol bij het leren van taal, aangenomen dat onze talenkennis niet is aangeboren, maar voortkomt uit individuele talige ervaringen. Hoe de dagelijkse episodische ervaringen in het brein worden omgezet in abstracte, semantische kennis is een belangrijke onderzoeksvraag in de cognitieve en de neuro-wetenschappen, die niet alleen specifiek is voor taal. In mijn onderzoek probeer ik inzicht te verkrijgen in de mechanismen van het leren en produceren van taal door te kijken naar de parallellen tussen taalprocessen en geheugenprocessen in het brein. Hiertoe formuleer ik een expliciete theorie over de wisselwerking tussen een episodisch en semantisch geheugen voor taal, het ``Hierarchical Prediction Network'' (HPN) genaamd, waarin tevens de ideeën van Hawkins zijn opgenomen (met enkele belangrijke wijzigingen). Het semantische geheugen voor taal wordt in HPN voorgesteld als een neuraal netwerk, waarvan de knopen (overeenkomend met syntactische en lexicale corticale kolommen) zijn geordend in een topologische ruimte. Dit wil zeggen dat knopen die een vergelijkbare functie vervullen in de syntactische analyse van zinnen bij elkaar in de buurt liggen. (Dit is geïnspireerd op de visuele cortex, waar bijvoorbeeld kolommen voor het herkennen van de oriëntatie van een lijn segment topologisch zijn georganiseerd.) Een syntactische analyse van een zin bestaat in HPN uit een pad langs een aantal knopen in het netwerk, die `dynamisch' (flexibel) met elkaar zijn gebonden via het centraal uitwisselen van gegevens. (Ook dit is geïnspireerd op hoe het brein primitieve visuele categorieën bindt tot complexe vormen.) Doordat de bindingen tussen knopen flexibel zijn (in tegenstelling tot de vaste links tussen knopen in conventionele neurale netwerken) kan HPN de productiviteit van taal verklaren. Het episodische geheugen voor taal is in HPN ingebed in het semantische geheugen, in de vorm van permanente geheugensporen, die worden achtergelaten in de knopen van het netwerk als gevolg van het verwerken van een zin. Op die manier kan de netwerk-analyse van een verwerkte zin via de geheugensporen altijd later gereconstrueerd worden. Bovendien kunnen nieuwe zinnen worden gevormd door sporen van (fragmenten van) oude zinnen te combineren. Dit proefschrift is als volgt georganiseerd: in hoofdstuk 1 bespreek ik de doeleinden van mijn onderzoek en de motivatie voor de gekozen aanpak. In hoofdstuk 2 introduceer ik het Memory Prediction Framework, en geef ik de neurobiologische achtergrond voor de neurale theorie van syntax. In hoofdstuk 3 behandel ik enkele basisbegrippen uit de formele taalkunde en de computationele linguistiek, met speciale aandacht voor parseertechnieken, die worden gebruikt in het HPN model. Hoofdstuk 4 bevat een (kritisch) overzicht van de literatuur over neurale netwerken van taal, in de context van de discussie over de basiskenmerken van taal: productiviteit en hiërarchie. In hoofdstuk 5 tot en met 8 ontwikkel ik, in een aantal stappen, het HPN model. Om de voorspellingen van de neurale theorie van syntax kwantitatief te kunnen toetsen, heb ik het HPN model geïmplementeerd op de computer, zodat ik simulaties kon draaien op basis van vele duizenden zinnen. In hoofdstuk 5 beschrijf ik allereerst een computer-implementatie van het basismodel zonder episodisch geheugen, en hiermee laat ik zien dat een syntactische topologie geleerd kan worden uit simpele, kunstmatig geproduceerde zinnen. Dan, in hoofdstuk 6 en 7, bespreek ik een computermodel van het episodisch geheugen voor taal, waaruit ik voor het gemak de topologie weglaat, en ik test dit op een groot aantal originele zinnen aan de hand van een taak voor zinsontleding. In hoofdstuk 8 voeg ik tenslotte alle componenten van HPN samen in een enkele implementatie, die precies beschrijft hoe uit episodische taal-ervaringen een abstracte grammatica in de vorm van een netwerk topologie wordt geconstrueerd. In dit hoofdstuk benadruk ik de gelijkenis tussen het leren van taal en het proces van geheugenconsolidatie -- het omzetten in het brein van informatie bestaande uit concrete episodes naar een netwerk van abstracte, semantische kennis. In hoofdstuk 9 volgen een algemene discussie en een aantal ideeën voor toekomstig onderzoek. De belangrijkste conclusie van mijn proefschrift is dat het mogelijk en zinvol is om inzichten uit de (computationele) taalkunde te koppelen aan neuro-biologische en cognitieve inzichten, en vice versa. Enerzijds kunnen uit de strenge functionele eisen die de taal aan de hersenen stelt een aantal niet triviale conclusies worden afgeleid over de verwerking en opslag van informatie in het brein, en anderzijds leveren de fysiologische beperkingen van de hersenen onverwachte uitdagingen voor theorieën van syntax, zoals het gebruik van topologie.