Maskinöversättning och datoriserade textrepresentationer
Institutionen för Språkvetenskap Maskinöversättning och Datoriserade textrepresentationer 10 p VT –98 Lotta Pettersson, Marie-Louise Lund, DLP2.
Innehållsförteckning
Målsättning
*Texten
*Historik
*Maskinöversättningens historia
*Maskinöversättnings strategier
*Olika metoder inom maskinöversättning
*Problemreflektion
*Syntax
*Adjektiv
*Substantiv
*Presens particip (-ing)
*Prepositioner
*Ordföljd
*Morfologi
*Lexikal listing
*Total expansion
*Partiell expansion
*Direkt böjnings identifiering
*Projektet
*Vår arbetsmetod
*Syntax
*Mål-kontra källspråk
*Ordföljd
*Morfologi
*Summering
*Litteraturhänvisning
*Bilaga
Källtext
Programkod
Målet med arbetet var att kunna åstadkomma en bra och naturlig översättning från det definierade källspråket till målspråket. Detta innebar bl.a. att ordföljden skulle bli så naturlig som möjligt i målspråket som här är svenska. Metoden vi tillämpar faller sig nog ganska specifik på just denna text. Om man utgår från de metoder som vi kommer att presentera så passar vår metod in under Machine Translation transfer-oriented, då vårt program ej innehåller någon semantisk beskrivning.
Textbeskrivning
Texten som ingår i detta projekt är en populärvetenskaplig text om delfiner. En text som lämpar sig väl för maskinöversättning då den är standardiserad, den har ett begränsat domänområde. En sådan text är inte svårbegriplig, utan använder sig utav en enkel engelska. Meningarna är "fakta baserade". Texten innehåller flera sk uppräkningar, där de använder sig av flera adjektiv och substantiv på varandra . Detta troligtvis för att det är en förklarande text.
Arbetar man med en sådan text innebär det att det inte blir några större svårigheter med tolkningen av texten, vilket det kan bli med exempelvis skönlitteratur och poesi.
Maskinöversättningens historia
Översättning mellan språk är ekonomiskt, sociologiskt och politiskt väsentligt i den moderna världen.
Förutsatt det obestridda behovet av en massiv, läglig (i rätt tid) och billig översättningsmetod, är drömmen hos många datalingvister och dataforskare att få utveckla en fullt ut automatiserad maskinöversättningsmetod.
Den potentiella marknaden för översättningar mellan språk är mycket större än vad som utförs idag. Eftersom kostnaderna är så höga och de förseningar som blir när översättningarna utförs genom mänsklig manuell översättning så betyder det att flera dokument och meddelande vars översättning skulle vara av stor vikt förblir oöversatta.
För över trettio år sedan publicerade Yehoshua Bar-Hillel en analys av MT forskningens situation just då, (Bar-Hill 1960) han menade att översättning kräver textjämförelse och att de då gällande MT prestationerna var dömda att misslyckas med respekt för deras situation när det gäller att utveckla fullt ut automatiserade hög - kvalitets översättningssystem, eftersom de inte behandlade det semantiska skiktet av språket.
Bar-Hillel hade alldeles rätt i sin bedömning av de dåvarande MT försöken. Olyckligtvis så var varken lingvistik, artificiell intelligens, datorhårdvara och mjukvara, datalingvistik som "område" så utvecklat vid denna tidpunkt att jämförelse av text med hjälp av datorer kunde genomföras. Maskinöversättningen fortskred därför i ett "semantiskt vakuum" och stötte på svåra problem.
I slutet av 1940-talet verkade MT vara en attraktiv och genomförbar tillämpning av datateknologi. Denna opinions underlag var, för det första; i eran av "informationsexplosionen" blev översättning en mycket viktig bransch. Som i de flesta andra branscher, skulle automatisering i princip innebära effektivitet. För det andra; översättning är vanligtvis utförd av människor, alltså, specificeringen av uppgiften är relativt okomplicerad, den konceptuella designen av en potentiell MT kan utformas efter organisationen hur översättningsprocessen utförs av människor. För det tredje; letandet i ordböcker, som upptar en stor del av tiden vid mänsklig översättning kan reduceras till en obetydlig nivå om man använder sig av "on-line" ordböcker. Och till sist, den spektakulära framgången som kryptografin hade under andra världskriget påkallade dess metod till att användas inom andra användningsområden. Översättning kunde på sätt och vis förstås som ett kodbrytaruppdrag.
Det är vanlig att det så kallade Weaver-meddelandet ses som startpunkten för undersökningar inom MT.
1949, delade Weaver och en vicepresident hos den s.k. Rockefeller-stiftelsen ut 200 kopior av ett brev där han lade fram begreppen hos MT för några människor som verkade ha lite intresse i dess utveckling. Även om meddelandet till övervägande del var ett strategiskt dokument så diskuterades flera viktiga teoretiska och planmässiga frågor, inklusive problemet om flera betydelser hos en lingvistisk enhet, den logiska grunden av ANGUAGE??? samt influenserna av kryptografin och behovet av att analysera språkens mångsidighet.
De huvudsakliga begreppen, ämnena och processerna hos MT, som t.ex. morfologisk och syntaktisk analys, för och efterredigering , interlinguarepresentation av betydelsen, arbete med begränsade ordlistor, automatisk sökning av ord i ordbok o.s.v. blev först nu fastställt och debatterat.
Kraven på MT satte fart på den betydelsefulla teoretiska utvecklingen inom lingvistik och det som senare skulle bli känt som en vetenskapsgren inom datalingvistik, nämligen, artificiell intelligens.
De tidiga MT-projekten misslyckades förvisso att nå dess mål, d.v.s. att bygga maskinöversättningssystem som var fullt automatiska högkvalitets system. De huvudsakliga misstagen som gjordes på de tidiga MT arbetena var att; bedömningen av begrepp- problemens komplexitet hos de naturliga språkens förståelse var underskattade. Variationen och saknaden av kunskap som behövdes för alla lösningar till detta problem visade sig vara enorma, så framgången för MT som en tillämpning blev beroende av lösningen till problemet av kunskapförvärv och införlivande.
Den nya optimismen hos MT forskare och sponsorer är baserade på de spektakulära framsteg inom datateknologin och datalingvistiken som gjorts. Framgångar inom automatiska meningsförlopp och teknik hos människa-maskin interaktion är också viktiga delar av den allmänna MT paradigmer.
Med kunskaper om de tidigare svårigheterna och därför med en realistisk uppskattning av möjligheterna hos MT teknologitillämpning, är allmänna MT projekt mycket väl förberedda att producera en ny våg av vetenskapliga förkunnande och praktiskt användbara maskinöversättningssystem. Dessa system är designade både att kunna tävla mot och att kunna arbeta tillsammans med människor vid översättning av en bred variation av vetenskapliga, industriella, officiella, journalistiska och andra texter.
Maskinöversättnings strategier
Det finns tre huvudsakliga MT strategier. Den tidigaste historiskt sett är det "direkta" tillvägagångssättet, antaget av de flesta MT system och ses som den "första generationen" av MT system.
Det "direkta" tillvägagångssättet" är en MT strategi som saknar något som helst övergångsstadium i översättnings processen, processen hos källspråkets text leder "direkt" till det önskade målspråkets text. Vid vissa omständigheter är detta tillvägagångssättet meningsfullt även idag. Spår av det "direkta" sättet finns hos de "indirekta" systemen som t.ex. Météo, men det ursprungliga direkta MT systemet har en mer primitiv mjukvarudesign.
Misslyckandet av den första generationens system ledde till utvecklingen av mer sofistikerade lingvistiska modeller för översättning. T.ex. det fanns ett ökat stöd för analysen av källspråkstexten till en slags mellanliggande representation – en representation av dess "mening". Detta är det väsentliga hos den "indirekta" metoden och den har två huvudsakliga varianter:
Den första varianten är "interlingua metoden" – den första historiska"- där källtexten är analyserad i en framställning från vilken måltexten genereras direkt. Den mellanliggande representationen inkluderar all information som är nödvändig för genereringen av måltexten utan att " se tillbaka" på originaltexten. Representationen är dock framträdande från källtexten och på samma gång agerar den som en grund för genereringen av måltexten, det är en abstrakt representation av måltexten på samma gång som den är en representation av källtexten.
Metoden är "interlingua" på det viset att representationen är naturlig mellan två eller flera språk.
Tidigare har intentionen eller hoppet varit att utveckla en interlingua representation som skulle vara ’universal’ och som också skulle fungera som en slags förmedlare mellan vilka naturliga språk som helst. Men för tillfället är interlingua system mindre ambitiösa.
Den andra varianten av de indirekta systemen kallas för en transfer metod, och om man ska vara noga så innehåller alla översättningssystem en transfer av något slag, omställningen av en källtext eller representation, till en måltext eller representation.
Uttrycket "transfermetod" har tillämpats till system som skjuter in bilinguala enheter mellan övergångsrepresentationerna. I motsats till de interlingua system där representationerna är språkberoende och där resultatet av analyserna är en abstrakt representation av måltexten. Funktionen hos de bilinguala transferenheterna är att omvandla källspråkets representationer till målspråksrepresentationer.
Olika metoder inom maskinöversättning
Det finns flera olika metoder inom maskinöversättning, nedan följer en kort beskrivning utav de huvudsakliga metoderna.
Machine Translation (MT) = Den process som översätter en naturlig språk text (källspråk) till en annan naturlig språk text (målspråk) med hjälp av en dator.
Machine Translation Generations = De som arbetar med maskin översättning brukar referera till tre generationer inom maskinöversättnings forskning och utveckling. Den första generationen handhade med "direkt ersättnings" system, vilka ej involverade någon vetenskaplig systematisk syntax eller semantisk analys av
verall machine translation system designs. The major paradigms are knowledge-based machine translation and transfer. There is also some work on statistic-based machine translation and on machine translation in a "direct peplacement" mode.
Interlingua (IL) = Ett kunskaps representerat språk som används för att representera en samling betydelser av en naturlig språktext. Interlingua uttryck som representerar betydelser av en naturlig språktext kallas en interlingua text. Termer inom interlingua är instanser av entiteter i begrepps lexikonet.
Interlingua - Baserad Maskin översättning = En slags maskinöversättning som inkluderar en analys av källspråkets text och att representera resultaten av analysen i en speciellt designad kunskaps representations språk, interlingua språk. Det andra steget i processen inkluderar text generering i en eller flera mål språk från interlingua texten. Interlingua paradigmen (se Machine Translations paradigms) associeras ofta med kunskaps - baserad översättning.
Kunskap = en allmän term för någon slags information som används i ett artificiell -intelligens - relaterat dator system. I kunskaps – baserad maskinöversättning inkluderar kunskap kunskapen om världen, som finns i begrepps lexikonet och kunskap om språk, som finns i de respektive lexikonen och grammatik.
Kunskaps – Baserad Maskin översättning (KBMT) = Analysprocessen av ett källspråks text, utökas vid behov, och generering till en målspråks text, genom att använda alla kunskaps källor för att finna och representera betydelsen av källspråks texten, för att producera en exakt översättning. KBMT meaning of source language texts, to disambiguate this input and produce an accurate translation. KBMT systems typically use an interlingua approach,though a deep transfer approach is possible.
Machine-assisted Human Translation = En mänsklig översättning som involverar användningen av mer eller mindre sofistikerade dataverktyg.
Skild från human-assisted machine translation.
Machine Translation, human assisted = En maskinöversättning som involverar någon form av mänskliga översättare, antingen under eller efter översättningen. Skild från Machine-assisted Human Translation.
Machine Translation transfer-oriented = En slags maskinöversättning som är baserad på att hitta motsvarigheter i källspråket och målspråkets lexikon och syntaktiska struktur. Denna maskinöversättnings system utför inte semantik och pragmatik analyser av input texten.
Multilingual Machine Translation = Maskinöversättning bland multipla käll och/eller mål språk. Interlingua paradigmer passar ofta för multilingua applikationer.
Speech-to-Speech Translation = Maskinöversättning av talat språk. Taligenkänning producerar en text, texten översätts av en maskin, och texten blir syntetiskt tal i mål språket.
Nedan följer en teoretisk beskrivning av några syntaktiska problemfaktorer i översättningsprocessen, samt morfologiska överväganden.
Syntax omfattar de regler eller principer om hur ord (lexikala enheter) kan kombineras för att forma en mening. Reglerna tillämpas på de grammatiska kategorierna. Det är vanligt att man skiljer på grammatiska kategorier och individuella lexikala enheter som substantiv, artikel, adjektiv, verb, adverb, prepositioner etc, och konstituenterna som indikerar gruppering av enheterna, som nominalfras, subordnade klausuler och meningar.
Lingvister finner det ofta användbart att arbeta med två olika klasser. Den ena klassen innehållande de öppna ordklasserna, substantiv, verb och adjektiv (adverb). Dessa kallas för öppna klasser då de kontinuerligt fylls på med nya ord eller kombinationer av gamla ord till nya.
Den andra gruppen innehåller de slutna klasserna, som prepositioner, konjunktioner, subjunktioner, artiklar, infinitivmärke etc. Dessa grupper är ofta små och får mycket sällan eller aldrig nya ord. Distinktionen öppna – slutna ordklasser svarar ganska bra mot distinktionen innehållsord – formord, som skiljer ut ord med egen, självständig betydelse från ord med huvudsakligen grammatisk funktion.
I svenskan och många andra språk rättar sig adjektivet till sin form efter det substantiv eller pronomen det hör ihop med. Engelska adjektiv har inte någon motsvarande sk kongruensböjning. Samma form används om personer och saker i både singular och plural, såväl som attribut som predikatsutfyllnad, …bear live young ( föder levande ungar). Young står i singular men i svenskan blir det plural.
En del räknebara substantiv som har samma form i singular och plural brukar kallas för nollplural. Nollplural används i regel i fiske och jaktsammanhang
Vissa djurnamn (här fish) finns endast i nollplural..
Fish är oftast oförändrat i plural, särskilt när ordet har kollektiv betydelse.
Några engelska substantiv saknar pluraländelser, men fungerar på samma sätt som pluralformer. De hör ihop med pronomen som they, these och those.
I texten som vi använt oss av var syntaxen relativt lika i käll- och målspråket.
Alla engelska tempus kan ha både en enkel och en pågående (progressiv) form. Den pågående formen består av en form av be och en följande –ing form (presens particip) och förekommer normalt bara vid händelsepredikat som betecknar händelser och förlopp (oceangoing, keeping).
Det förekommer även vid tillståndspredikat som ofta betecknar känslor, åsikter och tankar.
Ex He is always being late (ogillande),
He is late every morning (konstaterande).
Man skulle med detta vetande kunna konstruera en generell regel som genererar –ing-former vid händelser.
Användningen av prepositioner skiljer sig i många enskilda fall mellan engelskan och svenskan. Det finns också mer allmänna skillnader.
Ett problem som är mycket viktigt att tänka på är ordföljden. Källspråket och målspråket har oftast olika regler för hur orden skall kombineras. I detta projekt är källspråket engelska och målspråket svenska. Ordföljden i dessa språk är dock ganska lika. Men använder man sig utav andra språk så gäller det att vara mycket uppmärksam på detta så att det blir en naturlig översättning.
Om alla ordformer i ett språk kunde inkluderas i ett lexikon skulle inga morfologiska regler behövas.
Studiet av form- meningsrelationer mellan orden skulle då komma i andra hand. Den morfologiska processen för översättning behöver alltid ett lexikon för bakgrundsinformation.
Output kan antingen skrivas direkt i den representerade texten som skall översättas, eller sparas i speciella tillfälliga lexikon som senare kan användas i översättningsprocessen.
Med denna metod måste alla relevanta ordformer finnas i ett lexikon i ett sk föranalytiskt steg, så att de finns tillgängliga för den syntaktiska analysen. Lexikonet expanderas sedan så att det innehåller alla de ordformer som finns i källtexten.
Det finns olika sätt att expandera lexikonet på. En preliminär analys av ordformerna i källtexten utförs för att grundformerna skall kunna expanderas. Det är ett utbyte mellan djupet av denna preliminära analys och antalet ordformer som genereras. Om den preliminära analysen utelämnas, måste kärnlexikonet expanderas så att det innehåller alla de ordformer som finns källtexten (total expansion).
Ett annat sätt är att bara expandera den del som behövs för analysen av det aktuella källtexten (partiell expansion).
Den tredje metoden innebär att man gör en komplett preliminär analys så att bara de ordformer som finns i källtexten läggs till i lexikonet (direkt ordforms identifiering).
Denna metod genererar alla ordformer och bygger upp ett utökat lexikon. Den förutsätter att morfologiska genererings regler har definierats för att kunna generera alla moduleringar av grundformen i lexikonet. Då en total expansion är en mycket tidskrävande process så bör den göras en gång för alla.
En nackdel är att det färdiga lexikonet tar mycket stor plats, vilket gör att programmet kan bli långsamt då sökningen i lexikonet tar lång tid. Man kan dock göra separata versioner av lexikonet som kan användas för generering och analys.
För att visa med ett förenklat exempel på hur ett lexikon kan bli morfologiskt expanderat
Det är naturligt att få en genitiv form i svenskan från nominativ formen genom att lägga till morfemet "s". Pojke blir i genitiv pojkes, pojken blir pojkens . Detta kan uppnås genom följande Prolog regel;
Genexpand :- slex(X,B,n,C,D,E,F,nom,H,I),suff(X,"s",Y),
Assert(slex(Y,B,n,C,D,E,F,gen,H,I)).
Om vi inför denna regel i programmet och sedan skriver genexpand kommer programmet att leta efter en lexikal (X) som tillhör ordklassen "n" och som är "nom", lägger på genitiv ändringen "s" och skapar en ny form (Y), och lägger till denna nya form i lexikonet men med markeringen "gen", grundformen "läggs" sedan tillbaka i oförändrat i lexikonet.
Denna regel kommer att generera alla möjliga genitivformer och lägga till dem i lexikonet.
Kom dock ihåg att detta är ett förenklat exempel. Denna regel kan givetvis omformuleras så att den även kan tillämpas för att ändra singular till plural, t.ex. delfin à delfiner.
Denna metod expanderar bara delar av lexikonet. Målet är att bara generera de ordformer som förekommer i den källtext som skall översättas. Detta görs en gång för varje input enhet innan den syntaktiska analysen.
Output lagras i ett litet temporärt lexikon som är åtkomligt för den syntaktiska analysen. Sökandet i ett sådant lexikon går fortare än i ett komplett lexikon, och man behöver inte ha hela lexikonet tillgängligt under hela tiden i översättningsprocessen.
En annan fördel är att lexikala fel kan upptäckas på ett tidigt stadium i översättningsprocessen, så att det slipper bli fel i analysprocessen.
Denna metod identifierar ordformerna med hjälp av regler som resulterar i ett temporärt lexikon. Metoden arbetar bara med ett ord i taget oberoende av den syntaktiska kontexten. I den här analysen matchas slutet av ordformen mot en samling slutändelser, samtidigt som den identifierar stammen i lexikonet.
Ordformerna kan även identifieras genom att använda de matchningsregler som utarbetats av Eeg-Olofsson, 1988. Dessa regler kan användas både inom analys och generering .
Grundtanken är att morfologin kan ses som analogier mellan konkreta ordformer och att analogierna är växlande.
En böjning förutsätter en annan.
Vi har fokuserat vårt arbeta på att programmet skulle översätta källtexten till en så naturlig översättning som möjligt. Vi har alltså ej tagit så stor hänsyn till vad programmet genererar för meningar. Vi har inte inkluderat de semantiska betydelserna, utan programmet är helt syntaxbaserad.
Metoden vi använt oss utav är syntaktisk, regelbaserad. Vi valde denna metod bl.a. för att vi tidigare använt oss utav denna och det föll sig naturligt att välja denna metod.
Då vi ej inkluderat den semantiska betydelsen i vårt program så blev översättningen lite svårare än vad vi hade trott från början. De grammatiska reglerna blev därför så att säga specialdesignade för just detta arbetsmaterial.
För att översättningen skulle fungera ordentligt beslöt vi oss för att binda huvudorden till meningsdeklarationen. Se nedanstående exempel.
/* for centuries, dolphins have enchanted men with their playful nature and stunning displays of intelligence*/
esent(d,[advlp(P,Q),agent(X),pred(Y),obj(m(Part,past,O)),prep(C,D),advlp(E,F),advlp(H,I,J)])-->
{elex(Form,Y,v,Nb,Person)},
eadvlp(P,Nb,Person,Q),
enp(X,Nb,Person,obj),
evp(Y,Nb,Person),
evp(m(Part,past),Nb,Person,O),
eprep(C,_,_,D),
eadjp(E,Nb,Person,F),
ekonj(G,_,_),
eadjp(H,Nb,Person,I,J).
eadvlp(X,_,_,Z)-->[Y],{elex([Y],X,prep,_,_)},enp(Z,_,_,nom).
enp(X,Nb,Person,Case)-->[Y],{elex([Y],X,n,Nb,Person,Case)}.
evp(X,Nb,Person)-->[Y],{elex([Y],X,v,Nb,Person)}.
evp(X,Nb,Person,Z)-->[Y],{elex([Y],X,v,Nb,Person)},enp(Z,_,_,_).
eadvlp(X,_,_,Z)-->[Y],{elex([Y],X,prep,_,_)},epron(Z,_,_,_).
eadjp(X,_,_,Z,W)-->[Y],{elex([Y],X,a,_,_)},evp(Z,Nb,Person),[of],eadj(W,_,_).
Vi har alltså med denna regel bestämt att meningen skall börja med en advlp (for centuries) för att sedan följas av en agent (dolphins), ett predikat (have), objekt (enchanted men), preposition fras (with their), adverbialfras (playful nature), och ännu en adverbialfras (stunning displays (of) intelligence).
De andra bearbetade meningarna är uppbyggda på ett liknande sätt. Anledningen till att vi arbetade på detta sätt var att lexikonen innehöll ganska lite information. Hade tid funnits så hade det varit bättre att utöka lexikonet med mer information för att underlätta reglerna i programmet.
Det är detta som gör att översättningen tyvärr blir bunden till den bearbetade texten.
Prepositionen for översätts här till i. Den förekommer i sammanhanget For centuries vilket här översätts till i århundraden. Detta sammanhang är tidsrelaterat, det används och översätts likadant i flera tidssammanhang, ex for hours, for days, etc. Man skulle därför kunna göra en generell regel som används vid tidsrelaterade fraser som de föreslagna.
Det finns dock ingen regel utan undantag, ett undantag blir frasen för years vilket i svenskan blir under år. Skulle denna fras översättas till i år skulle det bli fel tolkning av frasen. Den innebär att man hänvisar till innevarande år.
Användningen av bestämd artikel i engelskan faller bort i översättningen till svenskan, the family à familjen. I svenskan får grundformen, familj, den morfologiska ändelsen –en, vilket visar att den står i bestämd form.
Substantivet cetaceans som förekommer i källtexten verkade det tyvärr inte finnas en svenska motsvarighet till, detta vållade oss problem då vi ej kunde översätta detta i det svenska lexikonet. Det skall dock vara en slags valsort.
I denna artikel förekom det sig så att ordföljden blev relativt lika i käll- och målspråk. Den stora skillnaden ligger i predikatet och att dess nominal byter plats i målspråket, ex For centuries, dolphins have enchanted…à I århundraden, har delfiner förtrollat…. Här byter alltså delfiner plats med har. Detta förekommer även i flera andra meningar. Se bilaga.
Ett annat problem som vi tyvärr ej hann göra en lösning på var frasen oceangoing mammals. För att få en naturlig översättning borde denna fras översättas till havsdäggdjur. Vi har dock översatt frasen till havsgående däggdjur, vilket inte är till belåtenhet för oss.
En annan fras som vi ej ansåg att vi fick en naturlig översättning på är …are often seen….
Den slutgiltiga översättningen blev …är ofta sedda…. Vilket vi ej tycker är en riktigt naturlig översättning. Alternativ som vi arbetade med var ses ofta, är ofta synliga, och ofta sedd. Då vi ej kunde bestämma oss för vilket alternativ som ansågs naturligast så bestämde vi oss för den översättning som var en mer direkt översättning.
Ett annat alternativ, troligtvis ett mer grammatiskt korrekt alternativ, är att man arbetar med frasen seen keeping istället. Men för att få en mer korrekt och naturlig översättning så bör man försöka se det i sin helhet, …are often seen keeping….
Vi har valt att använda oss utav en egen utvecklad metod, vilket innebär att vi ej utökat vårt lexikon med morfologiska ändelser. Vi har istället använt oss utav de ordformer som förekom i källtexten. Detta då de endast förekom på detta sätt, ex dolphins förekom aldrig som dolphin etc.Vi ansåg det var onödigt (tidsbrist) att utöka lexikonet med ordformer som ej användes.
Men vi har i tidigare avsnitt visat vilka metoder som kan tillämpas för att lösa detta problem. Programmet kan givetvis utökas med sådana regler, vilket även innebär vissa ändringar i både lexikon och programkod.
Programmet som vi designat är naturligtvis inte komplett. Det bör utökas med morfologiska regler, bl.a. för genitiv, plural former, ing-ändelser etc. Reglerna bör även bearbetas så att de får en mer generell status.
Prepositions reglerna är inte till belåtenhet för undertecknad programmerare, så även dessa kan bearbetas och utvecklas.
Lexikonet bör utvecklas då det i sin nuvarande form är relativt "grovt" och förenklat, bl.a. genom att t.ex. lägga till semantisk betydelse. Listan kan tyvärr göras lång på de förbättringar som kan och bör göras vilket vi tyvärr är medvetna om.
Morphology in Referent Grammar and int the Automatic Translation System SWETRA, Bengt Sigurd, Barbara Gawronska-Werngren, Mats Eeg-Olofsson, Working Papers 35 (1989).
Eget spekulerande av Marie-Louise Lund och Lotta Pettersson, Skövde 1998.
1.Artikel 2. Programutskrift