Lindenmayer Systems: Structure, Languages, and Growth Functions. Paul Vitányi Samenvatting: De gemeenschappelijke interessesfeer van de informatica en de biologie is niet leeg. In het bijzonder bevat zij problemen verbonden met de ontwikkelingsbiologie. De ontwikkeling van een organisme kan worden opgevat als de uitvoering van een ontwikkelingsprogramma dat aanwezig is in de bevruchte eicel. Door de cellulariteit van hogere organismen worden wij in staat gesteld de organismen in ontwikkeling te beschouwen als dynamische collectieven van passend geprogrammeerde automaten. Tot de taak van de ontwikkelingsbiologie behoort dan onder meer de fundamentele algoritme af te leiden uit het verloop van de groei en ontwikkeling van het organisme. Onderzoek aan algoritmische processen vormt weer een van de centrale onderwerpen uit de informatica. Het is dan ook niet vreemd dat de theoretische informatica, en de automaten- en formele talentheorie in het bijzonder, waardevolle inzichten verschaft in problemen betreffende biologische ontwikkeling. Omgekeerd hebben biologische motivaties en voorbeelden nieuwe ideeën bijgedragen tot de theoretische informatica. De voorlopers van de automaten­theorie, zoals de zenuwnetten van McCulloch en Pitts en de reproducerende automaten van Von Neumann, waren biologisch gemotiveerd. Omstreeks 1968 stelde A. Lindenmayer de L systemen voor als modellen voor eendimensionale groei en ontwikkeling. Deze modellen sluiten nauw aan bij de theorie der formele talen. Dientengevolge werd het onderzoek naar de mathematische aspecten hiervan ter hand genomen door een allengs groeiende groep wiskundigen en beoefenaren van de theoretische informatica. De in aanvang biologische motivatie raakte in veel gevallen Op de achtergrond. L systemen vormen een parallelle variant op de, eerder door N. Chomsky in de mathematische linguïstiek ingevoerde, generatieve grammatica's. De (mathematische) theorie van L systemen heeft dan ook veel problemen (met of zonder biologische motivatie) en bewijstechnieken gemeen met de formele talentheorie en vormt daarbinnen tegenwoordig een hoofdstroming. Door het parallel toepassen van de herschrijfregels lenen L systemen zich beter tot een wiskundige aanpak dan de oudere generatieve grammatica's. Verder leidt de studie van L systemen tot tal van nieuwe problemen en toepassingen. In deze monografie komen drie aspecten van L systemen uitgebreid aan de orde: de structuur van deterministische contextvrije L systemen, de taalklassificatie van families van talen voortgebracht door contextgevoelige L systemen, en de groeifuncties van deterministische L systemen. Bij al deze aspecten speelt de door het L systeem gegenereerde woordrij een centrale rol; - De structuur van een deterministisch contextvrij L systeem (DOL) bestaat_uit de, door het gebruikte homomorfisme bepaalde, voortbrengingsrelaties tussen de letters van het alfabet van de DOL. Deze relaties worden uitgedrukt door een klassificatie van de letters in typen en door met het homomorfisme geassocieerde eindige gerichte grafen. De samenhang tussen eigenschappen van de structuur van een DOL systeem en de globale eigenschappen van de door het systeem voortgebrachte woordrij, taal, en groeifunctie, worden onderzocht. Noodzakelijke en voldoende voorwaarden onder welke een DOL systeem een eindige taal voortbrengt worden gegeven en leiden tot het vaststellen van de maximale cardinaliteit van een eindige DOL taal over een alfabet van n letters. De orde van grootte hiervan is e^{\sqrt{n log n}}. Het probleem van het vaststellen of een woord v door een (P)DOL systeem G wordt voortgebracht heet het lidmaatschapsprobleem voor (P)DOL talen. De benodigde tijd/geheugen ruimte voor een algoritme dat dit probleem oplost, wordt uitgedrukt in de lengte van v voor het gewone lidmaatschapsprobleem, en in de lengte van v en de beschrijving van G voor het algemene lidmaatschapsprobleem. Uit de resultaten volgt dat het algemene lidmaatschapsprobleem voor (E)PDOL systemen en de eindigheid van DOL talen beslist kunnen worden door een deterministische algoritme die in polynomiale tijd werkt. Indien een DOL taal oneindig is, kan de kwestie of een woord v door een DOL systeem G over een alfabet van n letters voortgebracht wordt opgelost worden door n * lengte(v) woorden van de met G geassocieerde woordrij te genereren en met v te vergelijken. Met inachtneming van speciale voorzieningen voor de letters die het lege woord voortbrengen, leidt dit tot een polynomiale deterministische algoritme. in het geval dat de taal die door G voortgebracht wordt eindig is, kan deze taal echter uit e^{\sqrt{n log n}} woorden van gelijke lengte bestaan. Door gebruik te maken van de gevonden eigenschappen van DOL systemen die een eindige taal voortbrengen en door, onder meer, het toepassen van de Chinese reststelling blijkt ook voor dit geval een uitvoerbare polynomiale deterministische algoritme mogelijk. Enige getallen­theoretische functies , voortspruitende uit het verband tussen de grootte van het alfabet en de grootte Vaneen eindige DOL taal , worden gedefinieerd en onderzocht. Deze functies zijn varianten op de reeds door E. Landau onderzochte maximale orde van een permutatie van de n-de graad. DOL systemen zijn lokaal-katenatief indien de voortgebrachte woordrij een zekere fibonacci-achtige eigenschap bezit. De structuur van zulke lokaal-katenatieve DOL systemen wordt bepaald. Een structureel verband, tussen lokaal-katenatieve DOL systemen en DOL systemen met eindige taal, leidt tot de conclusie dat de lokaal-katenatieve eigenschap pas zeer laat in de gegenereerde woordrij hoeft op te treden. Een en ander heeft zijn consequenties voor het zoeken naar een algoritme die uitmaakt of een gegeven DOL systeem de lokaal-katenatieve eigenschap heeft. Voorts wordt aangetoond dat het bezit van de lokaal-katenatieve eigenschap equivalent is met het eindig voortgebracht zijn van de door de DOL taal voortgebrachte monoïde. De groeifunctie van een deterministisch L systeem beeldt het argument i af op de lengte van het i-de woord in de geassocieerde woordrij. Onder meer wordt de structuur bepaald van DOL systemen waarvan de groeifunctie van de orde van grootte van een polynoom van een gegeven graad is. Voorts worden structurele condities aangegeven voor het al dan niet regulier of contextvrij zijn van DOL talen. Een en ander vormt het onderwerp van Sectie 3.1. - Het onderzoek naar talen van L systemen houdt ons bezig in Secties 3.2­3.4. In Sectie 3.2 worden voor deterministische contextgevoelige L systemen de pure taalfamilies, de taalfamilies verkregen met gebruikmaking van hulpsymbolen, en de afsluitingen van de voorgaande taalfamilies onder diverse typen homomorfismen onderzocht en volledig geklassificeerd in de Chomsky hierarchie. Hierdoor wordt de kracht van parallelle (deterministische) taalvoortbrenging (al dan niet geholpen door hulpsymbolen en/of homomorfe afbeeldingen) vergeleken met de kracht van de traditionele sequentiële taalvoortbrenging door generatieve grammatica's. De belangrijkste resultaten zijn bevat in Tafel 3.1 en Figuur 3.1. Sectie 3.3 behandelt soortgelijke kwesties voor al dan niet deterministische tafel L systemen. Dit zijn L systemen voorzien van meerdere stellen herschrijfregels, waarbij op een en hetzelfde woord slechts regels uit één stel toegepast mogen worden. Onder meer blijkt, dat het klassieke LBA probleem uit de formele talentheorie equivalent is met de kwestie of het gebruik van één tafel en twéézijdige context evenveel kracht biedt met betrekking tot taalgeneratie als het gebruik van twéé tafels en éénzijdige context, voor een bepaalde klasse L systemen. De belangrijkste resultaten van deze sectie zijn bevat in Figuur 3.2. In Sectie 3.4 bekijken we een alternatieve vorm van taalvoortbrenging die eigen is aan de L systemen. De woorden in een pure L taal die invariant zijn onder de herschrijfregels vormende met het L systeem geassocieerde taal van stabiele woorden. Aangetoond wordt dat de op deze wijze uit een klasse van L systemen verkregen taalfamilie in het algemeen gelijk is aan de taalfamilie welke uit die klasse verkregen wordt door gebruik te maken van hulpsymbolen. Een uitzondering wordt gevormd door de klassen van deterministische L systemen met één tafel en door de klasse van contextvrije L systemen met één tafel. In het laatste geval is de familie van talen die bestaan uit stabiele woorden gelijk aan de familie van contextvrije talen, en dus strikt bevat in de taalfamilie door deze klasse van L systemen voortgebracht met gebruik van hulpsymbolen. De belangrijkste resultaten in deze sectie zijn bevat in de Figuren 3.3 en 3.4. In Sectie 3.5 wordt een L systeem variant geïntroduceerd in verband met een regeneratieprobleem. - In het voorafgaande werd reeds gesproken over groeifuncties geassocieerd met L systemen. Sectie 4.1 behandelt de reeds eerder bekende analytische theorie van DOL groeifuncties. In Sectie 4.2 wordt het verband bestudeerd tussen de structuur van een DOL systeem en zijn groeifunctie. Voor de klassificatie van een DOL groeifunctie bijvoorbeeld, zal het beschouwen van de structuur van het DOL systeem vaak meer, snellere, maar soms vagere, informatie geven dan de analytische methode. Groeifuncties van contextgevoelige L systemen vormen het onderwerp van Sectie 4.3. Zulke groeifuncties zijn voorheen weinig onderzocht. In de onderhavige sectie wordt een aanzet gegeven tot een theorie hierover. Onder andere worden de analyse, synthese, hiërarchieën en klassificatie van deze groeifuncties bestudeerd. Het blijkt dat vrijwel alle kwesties die Voorde contextvrije variant beslisbaar zijn, voor de contextgevoelige variant niet beslisbaar zijn. Een der grote tekorten van de hierboven geschetste theorie wordt gevormd door het onvermogen om hierbinnen de, in de biologie veel voorkomende, sigmoïdale groeifuncties te genereren. In Hoofdstuk 5 worden de oorzaken hiervan aangegeven en wordt de conventie van het eenheidstijdsinterval tussen opeenvolgende woorden in de woordrij vervangen door het toelaten van tijdsintervallen van variabele lengte. De rangorde van een woord in de woordrij wordt geassocieerd met de physiologische tijd van het gemodelleerde organisme, en de som van de voorafgaande tijdsintervallen wordt geassocieerd met de physische tijd die verstreken is tot het verschijnen van bovengenoemd woord. We verkrijgen dan een hybride L systeem met discrete herschrijving, dat opereert in continue tijd. Hierbij is de lengte van de verschillende tijdsintervallen afhankelijk van, bijvoorbeeld, physische geqevenheden. Dit beantwoordt meer aan de eisen die qua adequaatheid van modellering van de biologische ontwikkeling van een organisme aan L systemen gesteld mogen worden. Het blijkt dat, onder redelijke aannamen,de bekende logistische en monomoleculaire (sigmoïdale) groeifuncties uit de biologie verkregen worden. —Hoofdstuk 1 geeft een inleiding tot de theorie der L systemen, en behandelt het verband met de biologie enerzijds en met de wiskunde en_de theoretische informatica anderzijds. Hoofdstuk2 geeft, in Sectie 2.1, enige begrippen en stellingen uit de theorie der formele talen en, in Sectie 2.2, definities uit de theorie der L systemen. In Hoofdstuk 6 worden de in het voorafgaande verkregen resultaten geëvalueerd.