The neural basis of structure in language
Gideon Borensztajn

Samenvatting:

In dit proefschrift onderzoek ik de neurale mechanismen, die ten
grondslag liggen aan het menselijk vermogen tot het leren, onthouden
en gebruiken van grammaticale structuur in taal, de syntax. Daarbij
gebruik ik inzichten uit de taalkunde, de cognitieve psychologie en de
neurobiologie.

Uit taalkundig onderzoek blijkt dat men de structuur van vrijwel alle
talen, kort samengevat, als volgt kan karakteriseren: taal is
produktief -- met een beperkt aantal woorden en taalregels kunnen wij
een onbeperkt aantal nieuwe zinnen maken en begrijpen. Daarnaast is
taal hiërarchisch -- zinnen zijn opgebouwd uit zinsdelen, welke
laatste weer kunnen zijn opgebouwd uit andere zinsdelen, etc. Deze
twee kenmerken leveren meteen de minimum voorwaarden waaraan een
systeem voor taalverwerking, zoals het menselijk brein, moet
voldoen. Een eerste bijdrage van dit proefschrift is om deze
voorwaarden zo precies mogelijk te formuleren, zodat verschillende
theorieën over informatieverwerking in het brein (zogenaamde neurale
netwerken) hieraan kunnen worden getoetst. Hieruit blijkt dat
bestaande klassen van neurale netwerken (in het bijzonder de
zogenaamde gedistribueerde recurrente netwerken) ongeschikt zijn voor
het modelleren van taal, vanwege bepaalde oversimplificerende
aannames.

In de rest van het proefschrift ontwikkel ik daarom een nieuwe neurale
theorie van syntax, die wel rekening houdt met de hiërarchische
structuur en productiviteit van taal. Daarbij heb ik mij laten
inspireren door Jeff Hawkins' ``Memory Prediction Framework''
(MPF). Dit is een theorie over het brein die stelt dat de
belangrijkste functie van de neocortex (een deel van de hersenschors)
het voorspellen van nieuwe situaties en het anticiperen op toekomstige
acties is. Volgens Hawkins slaat de neocortex daartoe alle informatie
en kennis op als temporele sequenties, met een hiërarchische
structuur.  Knopen, die hoger liggen in de hiërarchie, representeren
abstractere begrippen en langere tijdspannes (temporele compressie).

Terwijl Hawkins zijn theorie vooral heeft uitgewerkt voor visuele
waarneming, benadruk ik de analogieën met taal: ook syntactische
categorieën vertegenwoordigen temporele sequenties (namelijk van
woorden); wanneer deze in een vroeg stadium van een zin herkend worden
helpen ze het verdere verloop van de zin te voorspellen. Ik stel voor
dat syntactische categorieën, net als visuele categorieën, lokaal in
het brein zijn geëncodeerd in corticale kolommen, en bovendien dat de
hiërarchische en topologische organisatie van al deze `syntactische'
kolommen samen een grammatica vormt.

Een tweede inspiratiebron voor mijn onderzoek is de rol van het
geheugen in taal. Een belangrijke vraag in de taalkunde is hoe
zinsfragmenten (bestaande uit meerdere woorden) zijn opgeslagen in het
geheugen, zodat ze als geheel kunnen worden hergebruikt in nieuwe
zinnen. Voorbeelden hiervan zijn `Hoe gaat het ermee?', of `in
aanmerking genomen, dat…’. Volgens sommige taalkundigen is in feite
elke zin samengesteld uit kleinere of grotere brokstukken van andere
zinnen.

Om bovenstaande vraag te kunnen beantwoorden stel ik voor dat we in de
taalkunde, net als in de cognitieve psychologie, onderscheid moeten
maken tussen twee soorten geheugens: een geheugen voor abstracte,
relationele kennis, het zogeheten `semantische' geheugen, en een
geheugen voor individuele gebeurtenissen, geplaatst in een
persoonlijke context, het zogeheten `episodische geheugen'
(bijvoorbeeld de herinnering van een verjaardagsfeestje). In dit
proefschrift verdedig ik de stelling dat, terwijl abstracte taalregels
en syntactische categorieën onderdeel uitmaken van het semantische
geheugen, het episodische geheugen verantwoordelijk is voor het
onthouden van zinsfragmenten (zoals bovengenoemde), en zelfs complete
zinnen.  Het episodische geheugen speelt eveneens een belangrijke rol
bij het leren van taal, aangenomen dat onze talenkennis niet is
aangeboren, maar voortkomt uit individuele talige ervaringen. Hoe de
dagelijkse episodische ervaringen in het brein worden omgezet in
abstracte, semantische kennis is een belangrijke onderzoeksvraag in de
cognitieve en de neuro-wetenschappen, die niet alleen specifiek is
voor taal.

In mijn onderzoek probeer ik inzicht te verkrijgen in de mechanismen
van het leren en produceren van taal door te kijken naar de
parallellen tussen taalprocessen en geheugenprocessen in het
brein. Hiertoe formuleer ik een expliciete theorie over de
wisselwerking tussen een episodisch en semantisch geheugen voor taal,
het ``Hierarchical Prediction Network'' (HPN) genaamd, waarin tevens
de ideeën van Hawkins zijn opgenomen (met enkele belangrijke
wijzigingen).  Het semantische geheugen voor taal wordt in HPN
voorgesteld als een neuraal netwerk, waarvan de knopen (overeenkomend
met syntactische en lexicale corticale kolommen) zijn geordend in een
topologische ruimte. Dit wil zeggen dat knopen die een vergelijkbare
functie vervullen in de syntactische analyse van zinnen bij elkaar in
de buurt liggen. (Dit is geïnspireerd op de visuele cortex, waar
bijvoorbeeld kolommen voor het herkennen van de oriëntatie van een
lijn segment topologisch zijn georganiseerd.) Een syntactische analyse
van een zin bestaat in HPN uit een pad langs een aantal knopen in het
netwerk, die `dynamisch' (flexibel) met elkaar zijn gebonden via het
centraal uitwisselen van gegevens. (Ook dit is geïnspireerd op hoe het
brein primitieve visuele categorieën bindt tot complexe vormen.) 
Doordat de bindingen tussen knopen flexibel zijn (in tegenstelling tot
de vaste links tussen knopen in conventionele neurale netwerken) kan
HPN de productiviteit van taal verklaren.

Het episodische geheugen voor taal is in HPN ingebed in het
semantische geheugen, in de vorm van permanente geheugensporen, die
worden achtergelaten in de knopen van het netwerk als gevolg van het
verwerken van een zin. Op die manier kan de netwerk-analyse van een
verwerkte zin via de geheugensporen altijd later gereconstrueerd
worden. Bovendien kunnen nieuwe zinnen worden gevormd door sporen van
(fragmenten van) oude zinnen te combineren.

Dit proefschrift is als volgt georganiseerd: in hoofdstuk 1 bespreek
ik de doeleinden van mijn onderzoek en de motivatie voor de gekozen
aanpak. In hoofdstuk 2 introduceer ik het Memory Prediction Framework,
en geef ik de neurobiologische achtergrond voor de neurale theorie van
syntax. In hoofdstuk 3 behandel ik enkele basisbegrippen uit de
formele taalkunde en de computationele linguistiek, met speciale
aandacht voor parseertechnieken, die worden gebruikt in het HPN
model. Hoofdstuk 4 bevat een (kritisch) overzicht van de literatuur
over neurale netwerken van taal, in de context van de discussie over
de basiskenmerken van taal: productiviteit en hiërarchie. In hoofdstuk
5 tot en met 8 ontwikkel ik, in een aantal stappen, het HPN model. Om
de voorspellingen van de neurale theorie van syntax kwantitatief te
kunnen toetsen, heb ik het HPN model geïmplementeerd op de computer,
zodat ik simulaties kon draaien op basis van vele duizenden zinnen. In
hoofdstuk 5 beschrijf ik allereerst een computer-implementatie van het
basismodel zonder episodisch geheugen, en hiermee laat ik zien dat een
syntactische topologie geleerd kan worden uit simpele, kunstmatig
geproduceerde zinnen.  Dan, in hoofdstuk 6 en 7, bespreek ik een
computermodel van het episodisch geheugen voor taal, waaruit ik voor
het gemak de topologie weglaat, en ik test dit op een groot aantal
originele zinnen aan de hand van een taak voor zinsontleding.  In
hoofdstuk 8 voeg ik tenslotte alle componenten van HPN samen in een
enkele implementatie, die precies beschrijft hoe uit episodische
taal-ervaringen een abstracte grammatica in de vorm van een netwerk
topologie wordt geconstrueerd.  In dit hoofdstuk benadruk ik de
gelijkenis tussen het leren van taal en het proces van
geheugenconsolidatie -- het omzetten in het brein van informatie
bestaande uit concrete episodes naar een netwerk van abstracte,
semantische kennis. In hoofdstuk 9 volgen een algemene discussie en
een aantal ideeën voor toekomstig onderzoek.

De belangrijkste conclusie van mijn proefschrift is dat het mogelijk
en zinvol is om inzichten uit de (computationele) taalkunde te
koppelen aan neuro-biologische en cognitieve inzichten, en vice
versa. Enerzijds kunnen uit de strenge functionele eisen die de taal
aan de hersenen stelt een aantal niet triviale conclusies worden
afgeleid over de verwerking en opslag van informatie in het brein, en
anderzijds leveren de fysiologische beperkingen van de hersenen
onverwachte uitdagingen voor theorieën van syntax, zoals het gebruik
van topologie.