Magnus Cedergren (ceder@nada.kth.se)
Interaktions- och presentationslaboratoriet
Inst. för Numerisk analys och datalogi
Kungl. Tekniska högskolan
100 44 Stockholm
En del av denna forskning rör den datorstödda skrivprocessen och behandlar vitt skilda delar av skrivprocessen, alltifrån datorstöd för samarbete till datorstödd sättning vid s.k. Desktop Publishing. Gamma-projektet, i vilken denna rapport ingår, försöker ta reda på hur språkliga datorstöd på ett praktiskt sätt kan användas vid datorbaserad ordbehandling.
Denna rapport kan ses som en bakgrund för det kommande arbetet inom Gamma-projektet. Det är meningen att arbetet inom projektet kommer att beröra flera skilda områden inom området språkliga datorstöd vid skrivande. På kortare sikt görs en översikt över området automatiskt korrekturläsning, bl a genom implementeradet av en prototyp, se Appendix A. På lite längre sikt kommer arbetet även att omfatta flera andra områden. En kort sammanfattning över tänkta områden ges i avsnitt 5.
Ämnesområdet är tvärvetenskapligt i den bemärkelsen att området kan studeras utifrån flera perspektiv, både ett tekniskt,, ett beteendevetenskapligt och en språkvetenskapligt. Det är givetvis viktigt att det språkvetenskapliga och tekniska materialet håller en god höjd. En annan mycket viktig del i forskningen är att studera hur dessa språkliga hjälpmedel på ett riktigt sätt kan integreras i ett ordbehandlingsprogram utifrån skribentens perspektiv.
Det sista är kanske den starkaste orsaken för tillkomsten av denna rapport. Den ger en bakgrund till skrivprocessen som en helhet, samt en kort genomgång hur datorstöd för skrivande kan vara anpassad till denna.
Språkliga datorstöd för skrivande utgör en integrerad del av datorstöd för skrivande i allmänhet. Detta gör att denna rapport i första hand i generella ordalag försöker utreda hur ett allmänt datorstöd för skrivande bör vara utformat, eftersom detta även gäller för ett språklig datorstöd för skrivande.
Ett datorstöd för skrivprocessen bör vara utformat som ett enhetligt och iterativt stöd, inte som ett sekventiellt stöd och inte heller som en mängd mindre, separata stöd. Dessa ståndpunkter, som framförs i avsnitt 3, tar avstamp i resonemang om skrivande i avsnitt 2.
Skrivande är både en enhetlig och iterativ process. Siv Strömquist (1989) för i avsnitt 2 samman ett kognitionspsykologiskt perspektiv på skrivprocessen med ett äldre, skrivpedagogiskt perspektiv.
Slutligen görs i avsnitt 4 några utblickar mot andra modeller för skrivprocessen. Dessa modeller har många likheter med Siv Strömquists modell, men det finns också skillnader. Dessa modeller, Prima Vista och Sharples&Pemberton, har sina direkta motsvarigheter i datorstöd för skrivprocessen, vilket ytterligare motiverar deras närvaro i denna rapport. Dessa datorstöd beskrivs också kortfattat i avsnitt 4.
I avsnitt 4 jämförs skrivprocessen med systemutvecklingsprocessen, dvs hur man tillfredställande skapar stora datorsystem/datorprogram. Denna process redovisar stora principiella likheter med skrivprocessen. Även här anses det att ett datorstöd vara utformat som ett enhetligt och iterativt program.
Den anglo-amerikanska skrivpedagogiska traditionen delar in skrivande i ett antal, på varandra följande steg. Detta tankesätt har sin grund i den klassiska retoriken, dvs instruktioner för god talekonst från klassisk tid.
Den moderna kognitionsvetenskapliga forskningen representeras här, som i många andra sammanhang, av Flower&Hayes (1980) mentala modell över skrivprocessen. Siv Strömquist menar att det inte finns särskilt stora motsättningar mellan de två traditionerna, utan sammanför alltså dessa utan vidare.
Figur 1. Den klassiska retorikens delar
Den inledande analys-fasen innebar att talaren gör klart för sig vilket syfte han har med talet och vilka åhörare som finns. Nästa steg var innehållet, den första av de fem partes. Här skall talaren på olika sätt skaffa stoff till sin text. Den därpå strukturerar han sitt material på ett funktionellt sätt, följt av formuleringen, där stoffet får en språklig dräkt.
Därefter följer memoreringen av texten och framförandet där talaren verkligen framför sin text och drar direkt slutsatser om talets effekt genom publikens reaktioner. Bearbetningen, som Strömquist nämner finns i vissa handböcker i retorik, kommer sist, utanför de fem partes. Här finputsas talet, trots att det kanske inte skall framföras igen, som en allmän träning inför andra framföranden.
Den vanligaste uppdelningen är, enligt Siv Strömquist (1989), prewriting, writing och postwriting. Förstadiet prewriting innefattar bl.a. stoffsamling och strukturering, writing själva formuleringen av texten samt efterstadiet postwriting sådana saker som utskrift, korrekturläsning och eventuell sättning och tryckning.
Liksom var fallet med retorikhandböckerna är den traditionella skrivpedagogiken sekventiell, dvs. de skilda faserna och delarna är avsedda att utföras i tur och ordning och fullständigt. Modellerna innebär i princip alltså ingen möjlighet att återvända till en tidigare fas i processen.
Den mest accepterade av dessa är en modell utarbetad av Linda S Flower och John R Hayes (1980) vid Carnegie-Mellon University. I deras modell, består skrivprocessen av tre underprocesser, planering, översättning och granskning, alla styrda av en funktion för övervakning, en monitor. De olika underprocesserna är rekursiva genom att de via monitorn ideligen anropar varandra. Omgivningen och skribentens långtidsminne är de två yttre huvudfaktorer som enligt Flower & Hayes påverkar skrivandet.
Figur 2. Flower-Hayes mentala modell
Två element i skribentens omgivning påverkar skrivsituationen, enligt modellen. Det ena är skrivuppgiften, t ex ämnet och de tänkta läsarna, och det andra är den hittills färdigställda texten. I skribentens långtidsminne lagras kunskap om ämnet och läsarna, men också en plan över den tänkta texten.
Underprocessen planering består i sin tur av tre del processer generering, organisering och formulering av mål. Genereringen hämtar ideligen information av såväl omgivningen som långtidsminnet medan organiseringsprocessen och målformuleringen i sin tur hämtar information från genereringsprocessen.
Under planeringen har endast informationen lagrats mentalt hos skribenten. I översättningsfasen formulerar den skrivande sin tankar till ord och fraser. I denna process påverkas omgivningen i form av den redan skrivna texten, som hela tiden växer.
Granskningen, slutligen, består i att skribenten dels läser och utvärderar vad han skrivit, dels aktivt utför önskvärda ändringar.
Siv Strömquist (1989) menar att tankarna från Flower & Hayes modell inte nödvändigtvis omkullkastar den tidigare beskrivna skrivpedagogiska traditionen. Hennes modell för skrivprocessen liknar i mycket den anglo-amerikanska skrivpedagogiska processmodellerna, men tar även hänsyn till kognitionspsykologiska forskningsresultat, såsom t ex Flower & Hayes modell.
Figur 3. Siv Strömquists modell för skrivprocessen
Strömquists modell består liksom den anglo-amerikanska skrivpedagogiken av förstadium, skrivstadium och efterstadium. I sina resonemang jämför hon dock dessa tre stadier också med de respektive rekursiva underprocesserna i Flower & Hayes modell, planering, översättning och granskning.
En populär metod att använda under detta skede i skrivprocessen är brainstorming (svenska översättning t ex idéstorm). Detta innebär att man på ett papper okritiskt skriver ned allt man kommer på. Man kan göra dessa nedteckningar antingen i form av enstaka ord eller fraser, eller också som hela meningar eller stycken.
En annan populär metod för att samla stoff är s.k. mind map-teknik, där man med ett ritat nätverk av associationer anger relationer mellan begrepp. Ett sådant nätverk kan vara allt ifrån helt oordnat till strikt hierarkiskt strukturerat, i det senare fallet med t.ex. nivåer för olika generaliseringsgrad.
Figur 4. Ett exempel på användning av Mind Map - tekniken
Givetvis är det vanligaste att texter är skrivna med kombinationer av dessa strategier. Det är sällan en och samma text renodlat följer endast en strategi.
Texttypscheman med färdiga dispositioner är användbara vid återkommande, likartade texter, t ex författande av brev. Strömquist menar att den vane skribenten mentalt underlagrat har en rad sådana texttypscheman att ta fram och välja mellan vid en skrivuppgift.
Strömquist påpekar fördelarna med att dessa kontroller sker top-down, dvs. uppifrån och ned i nivåorganisationen. Det är enklare att stryka ett överflödigt stycke direkt än att först korrigera dess språkliga innehåll och sedan stryka det.
När Strömquist sedan presenterar en checklista för granskning är den trots allt organiserad bottom-up, med kontroller på teckennivå först och helhetskontroller av texten sist. Hon menar att det mentalt är lättast att angripa enkla fel på textytan först, för att sedan så småningom ge sig i kast med textens struktur.
Strömquists modell räcker för att beskriva de flesta typer av skribenter. Somliga människor itererar fram och åter i modellen oräkneligt antal gånger under sitt skrivande, medan andra följer det pedagogiska schemat på ett nära nog sekventiellt sätt.
Strömquist påpekar vidare att nedtecknandet på papper påbörjas vid olika steg i processen, beroende på individ. Någon skribent samlar stoff enbart i huvudet, medan andra kanske använder en anteckningsbok för allt de kommer på. Struktureringen kanske sker i form av en skriven disposition eller också endast i form av en idé över vilken ordning materialet skall skrivas.
Ordbehandlingsprogram som en ersättare för skrivmaskinen och som ett praktiskt verktyg under formulerandet är naturligtvis det klassiska datorstödet under skrivprocessen. Vidare har moderna verktyg som s.k. idébehandlingsprogram och automatiska korrekturläsare breddat möjligheterna till datorstöd. För sättningen har givetvis Desktop publishing-tekniken inneburit en revolution för skribentens möjligheter att själv göra en snygg layout.
I avsnitt 3.1 diskuteras hur de traditionella datorstöden för skrivande placeras in i skrivprocessen. Det klassiska ordbehandlingsprogrammet faller naturligast in under skrivstadiet medan idébehandlaren hamnar under förstadiet och layoutprogramet samt den automatiska korrekturläsaren under efterstadiet.
De olika typerna av verktyg är ofta separerade från varandra som skilda program. För att kunna använda två olika program måste textmassan på något vis föras över mellan dessa. Denna överföring kan många gånger vara både vara krånglig och ta oacceptabelt lång tid, p g a att olika program använder olika sätt att lagra textmassan.
I vissa fall kan man dessutom bara för över dokument i ena riktningen mellan två program. T ex går det sällan att flytta tillbaka en text till ordbehandlaren när den monterats in i layouten i med hjälp av ett Desktop publishing-program.
Att använda en rad separata program under skrivprocessens gång fungerar bra med den sekventiella modellen över skrivprocessen. Varje steg i skrivprocessen, och varje separat program i kedjan av program, avslutas innan nästa påbörjas. Detta innebär en begränsad mängd överföringar efter som varje program bara används en gång. Modellen fungerar också med program där överföring till ursprungskällan inte går, som nämnts om Desktop publishing-programmen ovan.
Att använda dessa program som en del i den iterativa processen fungerar dock sämre, eftersom överföringar i sådana fall måste göras ideligen, allt efter som skribenten går in i ett nytt steg i modellen i skrivprocessen.
För att bringa ett gott resultat krävs alltså ett enhetligt skrivverktyg för hela skrivprocessen (avsnitt 3.2). Ett alternativ till denna idealbild vore kanske flera program som fungerar mycket väl tillsammans. De dokument som används i programmen skall ha samma format, eller det skall åtminstone finnas en god möjlighet att snabbt konvertera mellan olika format.
Figur 5. En serie av skrivverktyg stödjer sekventiellt hela skrivprocessen.
I det här avsnittet görs en kortare genomgång av vanliga verktyg och hur dessa kan placeras in den sekventiella, skrivpedagogiska modellen. Klassiska ordbehandlare som WordStar för IBM PC eller MacWrite för Macintosh placeras alltså in under skrivstadiet. Idébehandlare som t ex More eller ThinkTank används vanligen för att strukturera och organisera texter och hamnar alltså i de sista skedena av förstadiet. Automatiska korrekturläsare som hjälper skribenten att hitta fel i texten placeras givetvis in under bearbetningen i efterstadiet. Slutligen sätts texten med ett Desktop Publishing-program som t ex PageMaker.
I figur 5 illustreras hur en serie av program ihoplänkade sekventiellt skulle kunna stödja skribenten med hennes skrivande.
En idébehandlare presenterar en text hierarkiskt efter dess struktur av rubriker och textstycken. På grund av sin hierarkiska uppläggning "följer" den underliggande textmassan "med" rubriken när denna flyttas. Det finns även möjlighet för skribenten att gömma texter eller hierarkier av rubriker under en överordnad rubrik, för att på detta sätt lättare kunna hålla överblicken över texten.
Eklundh påvisar att en idébehandlare som More inte endast kan användas för att strukturera en text, utan kan för en erfaren datorskribent bli ett utmärkt verktyg för planering och revision av texten. Dock bör framhållas att idébehandlarens strikt hierarkiska struktur ibland kan utgöra ett hinder under de tidiga skedena i förstadiet av skrivprocessen.
Det är givetvis i första hand under skrivstadiet av skrivprocessen som ordbehandlare används. Många forskare har studerat hur människor använder dessa program även i andra lägen. På grund av sin stora spridning har det visat sig att klassiska ordbehandlingsprogram/editorer många gånger används inom fler stadier av skrivprocessen än bara skrivstadiet. Wikborg (1990) påpekar t.ex. att de ofta goda möjligheterna att flytta textavsnitt gör att dispositionsarbetet integreras i formulerandet i högre grad än vid traditionellt, datorlöst skrivande.
Enklare korrekturläsningsfunktioner som rättstavningskontroll och i vissa fall även kontroll av ortografisk korrekthet (t ex rätt placerade skiljetecken) finns idag som en integrerad del i de flesta ordbehandlingsprogram.
Program för automatisk korrekturläsning av engelska språket innehåller ofta även funktioner för kvanititativ analys av texten. En svenska motsvarighet till dessa funktioner finns i det separata programmet KIX (karaktärsindex) för IBM PC, som försöker värdera texten med så enkla kvanititativa mått som meningslängder och ordlängder.
Forskning ([[Omega]]) har dock visat att dessa möjligheter gör att språkliga och innehållsmässiga kvalitén ofta försämras. De lättillgängliga, avancerade typografiska funktionerna drar till skribentens uppmärksamhet, en god layout kan lätt dölja brister i själva textmassan.
Om man använder Strömquists modell som utgångspunkt för att beskriva datorstött skrivande, fungerar det inte att som ovan kombinera flera skrivverktyg, eftersom obegränsade överföringar mellan programmen inte är möjliga.
Bättre fungerar det när funktionerna från de olika verktygen integrerats till ett och samma skrivverktyg. Detta kan vara implementerat antingen som ett enda program eller som en mängd programmoduler som arbetar med samma datamängd, dvs använder samma format för texten. Sharples&Pemberton (1990), se vidare avsnitt 4.1, redogör lite mer i detalj olika krav som man kan ställa på ett sådant skrivstöd.
Det har visat sig att, förutom teoretiska studier, har även de kommersiella programvarorna för ord- eller textbehandling utvecklas till att inom ett och samma program inrymma allt fler av faserna i skrivprocessen.
De flesta ordbehandlingsprogram, t ex MacWrite, WordPerfect och Microsoft Word, har länge haft funktioner för att välja teckensnitt, teckengrad och stil. Dessa funktioner har på senare tid byggts ut med möjligheter att programmera layoutfunktioner, olika s k "typografier", vilket har gjort att dessa program nu täcker in större delar av efterstadiet än tidigare. Detta gäller i synnerhet Microsoft Word, som i sina "typografier" även inkluderar radavstånd, knipning, marginaler, tabulatorer osv.
På motsvarande sätt har Desktop Publishing-programmen i ökad utsträckning fått bättre stöd för ordbehandling, med t ex funktioner av typen sök/ersätt. Längst på det här området ligger f n programmet Aldus PageMaker, där det går att redigera en enskild text i en särskild ordbehandlingsfunktion.
Även stöd för språklig kontroll av texten finns inkluderat i större utsträckning än tidigare i de olika programmen. Rättstavningskontroller finns inbyggt i de allra flesta ord- och textbehandlingsprogram och on-line synonymordbok utgör en av de senaste expansionerna av WordPerfect.
Strikt hierarkisk disposition eller idébehandling, som programmet More, finns som en integrerad del av Microsoft Word, vilket gör att detta program även inkluderar stöd för de senare faserna av förstadiet i Strömquists modell över skrivprocessen.
Figur 6. Hur några skrivverktyg täcker in olika steg av skrivprocessen.
Det ideala datorstödda skrivverktyget är alltså ett verktyg, med stöd för så stor del av skrivprocessen som möjligt. Microsoft Word framstår i dagens läge som det mest helgjutna skrivverktyget, vilket även Sharples&Pemberton (1990) framhåller. Programmet inkluderar alltså stöd inom så vitt skilda delar av skrivprocessen som strukturering/planering i förstadiet, bearbetning och korrekturläsning i efterstadiet samt givetvis själva skrivstadiet. Skribenten har här alltså möjlighet att passera i godtycklig ordning mellan dessa moment i skrivprocessen.
I figur 6 görs ett försök att markera hur stor del av skrivprocessen några program kan sägas hantera.
Prima Vista delar in skrivprocessen i två delar, den skapande fasen och den granskande fasen. Metoden är praktiskt inriktad och det är främst arbetssättet som skiljer dem åt. I den skapande fasen arbetar skribenten kreativt, utan att på något sätt värdera det som skrivits. I den granskande fasen, däremot, är det primära syftet att granska det som tidigare skrivits och inte att skapa något ytterligare nytt.
Mellan de två faserna, menar man i Prima Vista, att utkastet skall "vila". Det krävs att skribenten sysselsätter sig med någonting annat mellan de två skilda arbetssätten för mentalt kunna "skilja" dem åt.
Figur 7. Prima Vistas skrivprocess
De mindre delarna i de två faserna framgår av tabellen. De inledande momenten har sina motsvarigheter i de olika stegen av Förstadiet i Siv Strömquists modell. Prima Vista, som saknar motsvarighet till Skrivstadiet, placerar det inledande skrivandet i slutet på Den skapande fasen, kallat Första utkastet. Det är efter detta moment som utkastet skall "vila".
I momentet Syftet och läsarna analyserar skribenten skrivsituationen (Vem skall läsa texten, vilket är syftet med texten?). Därefter används olika metoder för kläcka idéer följt av en färdig disposition, kallad de fyra rutorna. Det material från idékläckningen som inte passar in bland de fyra rutorna kan i flesta fall, enligt Prima Vista, tas bort. Innan det första utkastet planerar nu skribenten vilka visuella knep han vill använda, dvs hur typografiska finesser skall användas, hur styckesindelningen skall se ut etc.
Prima Vistas granskande fas består av en nivåindelad granskning, top-down. Granskningen motsvarar delvis stegen i den skapande fasen. Först granskar skribenten sålunda hur syftet framgår i texten. Därefter organisationen och de visuella knepen och sist korrekthet i språk och fakta.
Liksom Siv Strömquists modell är Prima Vista:s modell över skrivprocessen sekventiellt uppbyggd. Till skillnad från Strömquist betonar dock Prima Vista det sekventiella momentet och avråder i princip skribenten från att lämna ett moment oavslutat.
Programmet följer nära de olika stegen i den skapande fasen av Prima Vista. Varje steg i modellen motsvaras av ett eller flera skärmbilder. När en skärmbild är färdig, och därmed ett steg i modellen, fortsätter skribenten med nästa skärmbild och därmed också nästa steg. Programmet har vissa likheter med ett datorbaserat formulär, vilket, enligt Prima Vista, kan vara en hjälp för många skribenter att komma igång.
Deras modell ligger till grund för en idéskiss (se nedan) för hur ett integrerat, datorbaserat skrivstöd kan skapas med utgångspunkt från skribenten.
Den ena av de två dimensionerna i Sharles&Pembertons modell beskriver hur informationen i skrivprocessen är organiserad och den andra huruvida informationen är instansierad eller inte.
Figur 8. Sharpes&Pembertons modell över skrivprocessen
Organisationsdimensionen, den vertikala i figuren, delas in i oorganiserad, icke-linjär, linjär och planär organisation. Denna dimension kan delvis liknas vid Stömquists modell, där den oorganiserade organisationen motsvarar stoffsamling, den icke-linjära organisationen sortering, den linjära organisationen strukturering/planering och den planära efterstadiets konkreta utskrift.
Själva formulerandet i Strömquists modell har i Sharples&Pemberton sin motsvarighet i den andra dimensionen, huruvida texten är instatierad eller inte. En instatierad text rymmer mer eller mindre färdiga formuleringar, medan en icke-instatierad text endast innehåller enstaka, innehållsmässiga element.
Sharples&Pemberton beskriver inte bara de olika stegens innehåll, såsom t.ex. även Strömquist gör, utan försöker också formulera övergångar mellan de olika stegen i modellen. Så är t.ex. instansiering övergången från den högra spalten till den vänstra (1->2, 3->4, 5->6, 7->8), nätverksorganisering övergång från första till andra raden (1->3,2->4), linjär organisering från första till tredje (1->5, 2->6) osv.
Writer's Assistant består huvudsakligen av tre sätt att betrakta eller behandla en blivande text, representerade av tre s k vyer: en notes network view som betraktar texten som en mängd osorterade noter (motsvarar 1 och 2 i modellen), en structure view (3 och 4) som används för att strukturera texten hierarkiskt i en trädstruktur ungefär som More samt linear view (motsvarar 5 och 6 i modellen) som visar textens linjära struktur från början till slut.
Figur 9. Den traditionella modellen över systemutvecklingsprocessen
Den klassiska modellen för systemutvecklingprocessen illustreras i figur 9. En enklare förstudie av problemet åtföljs av en systemanalys i sin tur resulterande i en specifikation. Specifikationen ligger sedan till grund för implementationen, som sönderfaller i konkret programkodning. Därvid vidtar testning av programmet för att se om det fungerar som avsett.
Det finns många moment i systemutvecklingsprocessen som liknar de klassiska modellerna för skrivprocessen. I systemutvecklingsprocessens tre första steg analyseras problemställningen noga innan själva implementationen vidtager. Detta påminner starkt om förstadiet i den anglo-amerikanska skrivpedagogiken.
På motsvarande sätt kan implementation och kodning i systemutvecklingsprocessen motsvaras av skrivstadiet i skrivprocessen. Testningen, dels automatisk i form av kompilering, dels manuell i form av uttestning av programmets funktioner, motsvarar slutligen bearbetningen i efterstadiet i skrivpedagogiken.
Många försök görs för att utveckla datorverktyg även för de tidigare faserna i systemutvecklingsprocessen. Dessa s.k. CASE-verktyg (CASE = Computer Aided System Engineering) täcker skilda delar av modellen. Ett verktyg hjälper till under de två inledande faserna, medan ett annat ger stöd under de senare tre. Genom att koppla flera sådana CASE-verktyg till varandra kan systemutvecklaren få hjälp av datorn under större delen av processen. Även här är dock iterativa verktyg att föredra, varför försök görs att hitta ett och samma idealverktyg som kan hjälpa systemutvecklaren under så många av faserna om möjligt.
Vi försöker i detta avsnitt vidga begreppet språkliga datorstöd. Detta begrepp används ofta för program med funktioner för Automatiserad korrekturläsning, vilket innebär att datorn analyserar en färdig text och förelägger användaren sina bedömningar. Här vidgas dock begreppet språkligt datorstöd till att kunna användas under samtliga skeden av skrivprocessen, dvs hur datorn med språk- "kunskap" kan hjälpa skribenten under andra delar av skrivandet. Så kan datorn t ex stödja skribenten under redigering och strukturering av texten.
On-line information, datorstöd för manuell korrekturläsning, utvidgade sökfunktioner, automatisk språklig revision, fonologiska och frekvensanalytiska tillämpningar är de andra exempel på språkliga datorstöd som kortfattat behandlas i detta avsnitt.
I orbehandlingsprogrammet Word Perfect 3.0 för Macintosh finns möjlighet att markera ett enstaka ord i texten och på skärmen direkt få upp en rad synonymer till det aktuella ordet. För engelska vidare finns flera separata program med liknande funktioner innehållande både synonymer och ordets definition och böjningsmönster.
Samma enkla, direkta principer för sökning kan inte användas i en informationsbas med skriv- eller grammatikregler. I hypertexten Skriv Rätt för Macintosh sådana regler får skribenten själv söka sin information oberoende av den texten som han för närvarande formulerar.
En hypertext som Skriv Rätt skulle kunna betraktas som passiv genom att användaren själv får söka upp informationen, till skillnad från aktiva on-line lexikon som t.ex. synonymordlistan i Word Perfect.
Automatiserade korrekturläsare kan annars vara program som kontrollerar ortografisk korrekthet (t.ex. blanksteg efter skiljtecken), språklig stil och grammatik. Sådana program gör dessutom ofta enklare kvantitativa kontroller av en text. Med hjälp av ordens och meningarnas längd kan datorn göra en grov skattning av hur lättläst texten är.
De lexikonen till rättstavningsfunktioner för svenska kan ofta vara omfattande. Algoritmerna, som vanligen är skrivna för engelska språket, sänker vanligen programmens prestanda, så klarar t.ex. programmen sällan av att känna igen sammansatta ord utan signalerar dessa som felstavade.
Med algoritmer anpassade för svenska språket skulle prestanda kunna höjas betydligt hos en funktion för rättstavning. Programmet stava, utvecklat på KTH, är ett exempel på ett steg i denna riktning. I detta program finns t.ex. förslag på hur problemen med sammansatta ord kan lösas med relativt enkla medel.
De ortografiska kontrollerna inbegriper vanligen skiljetecknens placering samt korrekt användning av versaler/gemener. Dessa kontroller kan ofta vara värdefulla för skribenten och är vanligen okomplicerade tekniskt sett.
Kontrollerna för språklig stil innebär vanligen att programmet letar efter en rad kända, tveksamma uttryckssätt (t.ex. anstötliga formuleringar). Dessa kontroller kan lätt uppfattas som pekpinnar och det är här särskilt viktigt att användaren själv kan avgöra vilka funktioner som användas och inte användas.
Grammatikkontrollerna i dessa program bygger sällan på någon mer djupgående grammatisk parsning, utan försöker med några enkla ytsyntaktiska mönster hitta några vanliga typer av grammatiska fel i texten. Rätt artikel (a - an) och korrekt kongruensböjning mellan adjektiv/substantiv är två exempel på grammatiska funktioner i dessa program.
Med en mer omfattande grammatisk analys, främst morfologisk, men även syntaktisk analys, skulle en grammatisk kontroll troligen kunna bli betydligt mer omfattande än de är i de befintliga engelska programmen.
Genom att i ett vanligt ordbehandlingsprogram tillfälligt göra teckenstorleken större, öka radavståndet och minska radlängden kan skribenten göra en mer lättläst korrekturutskrift. Denna metod för att underlätta korrekturläsningen är dock omständig, eftersom de justerade parametrarna måste återställas igen inför den slutliga utskriften.
Bättre fungerar korrekturläsningsprogrammet MacProof, som har en speciell funktion för korrekturutskrifter. Med denna funktion ställs parametrarna enligt ovan, men bara tillfälligt vid själva utskriften. Variationerna på korrekturutskrifterna är också större. Det finns möjlighet att särskilt betona vissa strukturella enheter i texten, såsom första och sista mening i varje stycke eller första ordet i varje mening.
En sådan funktion för strukturell utskrift skulle kunna utvidgas till att omfatta en mindre notation, där användaren t ex anger vilka strukturella enheter som särskilt skall markeras eller undertryckas.
Programspråkseditorer, däremot, har ofta en utökad sökfunktion med någon form av utvidgad sökning med "wildcards". Med dessa reguljära uttryck kan skribenten söka efter de enheter han är intresserad av sin programkod.
På motsvarande sätt skulle ordbehandlingsprogrammens sökfunktioner kunna förbättras med funktioner för sökning efter begrepp i naturligt språk, t.ex. morfologiska begrepp. Funktionen "sök efter nästa verb i imperfekt" skulle kunna vara ett exempel på en sådan funktion.
Liksom var fallet för manuell korrekturläsning ovan skulle även detta resonemang kunna utvidgas till en egen notation. En notation i form av ett helt frågespråk för fritexter som kan användas vid skrivande likaväl som vid renodlad informationssökning.
Med kommandot "Gör aktiv", exempelvis, låter skribenten datorn göra en grammatiskt aktiv sats av en passiv sats. Med kommandot "imperfekt" ändras tempus genomgående i ett stycke eller ett avsnitt.
Grammatiska transformationer av dessa typer kräver i många fall genomgående analys för att bli någorlunda fullständiga. Man kan dock tänka sig enstaka, användbara specialfall som inte behöver vara särskilt tekniskt komplicerade.
Fonologiska likheter mellan olika ord kan användas vid såväl stavningskorrektion, i en utökad sökfunktion sökning som bland on-line information. Med sökfunktionen "Sök liknande" söker skribenten efter ord som liknar ett angivet ord, antingen i texten eller också i ett interaktivt datorlexikon. Fonologiska kriterier används redan idag för att föreslå korrekta stavningar till ett felstavat ord i många funktioner för rättstavning.
Syntetiserat tal skulle kunna användas som stöd vid manuell korrekturläsning. Datorn kan läsa upp ordagranna citat samtidigt som skribenten direkt kan jämföra med källan. Med en bokstaveringsmöjlighet kan han jämföra svårstavade ord, t.ex. utländska egennamn, med originalet.
Med en frekvensordlista med orden sorterade efter antal förekomster kan skribenten under korrekturläsningen upptäcka om han använt en viss formulering lite för ofta. Datorn kan också jämföra den aktuella textens frekvensordlista med äldre frekvensordlistor för några olika representativa texter och till användaren rapportera alltför stora avvikelser såsom onormalt väl förekommande användning av en viss formulering.
Fritextsökning är ett stort område inom informationssökning som också skulle kunna användas inom skrivprocessen. En utökad sökfunktion skulle även kunna inkludera fritextsökning med t.ex. närhet mellan två skilda ord i satser.
Genom att kombinera frekvensordlistor med en grammatisk analys kan datorn på rätt ingående sätt analysera innehållet i en text och presentera detta för användaren. Att utifrån detta helt automatiskt generera ett sakordregister är kanske det mest påtagliga exemplet inom skrivprocessen på detta.
Prototypen, kallad HyperGamma, omfattar ett rudimentärt försök att täcka en något större del av skrivprocessen än ordinära ordbehandlingsprogram. Detta är nödvändigt eftersom användning för språkliga funktioner kan återfinnas i skrivprocessens alla delsteg och ett datorstöd måste kunna täcka in dessa steg.
HyperGamma är utvecklad med hjälp av programutvecklingsverktyget HyperCard på Apple Macintosh. Plattformen ingår som en del av projektets förutsättningar. HyperCard har valts till uppgiften p g a sina korta utvecklingstider, vilket gör den ypperlig för att tillverka prototyper.
Fördelen i detta fall med HyperCard, gentemot många andra lätthanterliga programmeringsmiljöer, är möjligheten till spridning. HyperCard och därmed HyperGamma går bra att använda på vilken Apple Macintosh som helst, medan många andra system kräver stora hårdvaruresurser och i vissa fall även tillgång till en dyr programutvecklingsmiljö för att kunna köras. HyperCard är väl spritt och i dagsläget inte dyrt i inköp. Det finns alltså goda möjliheter att sprida HyperGamma för utprovning till en stor mängd användare.
Programmet HyperGamma, består liksom även är fallet för HyperCard, logiskt av en bunt s k kort, vilket ungefär motsvarar skärmbilder. Alla korten har i detta fall samma s k bakgrund, vilket innebär att endast det rena textmaterialet som skiljer de olika korten åt, i övrigt är alla kort utseendemässigt identiska.
Kortet i Hypergamma består av tre fält med text. Det nedre stora fältet rymmer den tilltänkta skribentens textmassa, det övre vänstra fältet kontexten i vilken just det här kortet ingår, samt det övre högra fältet anteckningar skribenten gör under skrivandets gång. Dessa anteckningar kan bl a utgöras av datorbaserade tvärreferenser till andra kort i bunten.
Figur 10. Ett kort i HyperGamma
Korten i bunten fungerar tillsammans som en text. Genom att i det stora textfältet göra referenser till andra kort skapar skribenten en hierarkisk struktur inom texten. Genom att förflytta sig med en sådan referens hamnar det tidigare kortets textfält i det nya kortets kontextfält. På detta sätt kan text och kortreferenser fritt blandas i textfältet, varvid HyperGamma fungerar ungefär som en idébehandlare.
Det finns dock en distinkt skillnad mellan HyperGamma och en idébehandlare av klassiskt snitt, typ More. Den strikt hierarkiska strukturen i idébehandlaren är tvingande, medan HyperGammas struktur inte nödvändigtvis är tvingande. Det går i HyperGamma utmärkt att bygga nätverksstrukturer, på ett sätt som liknar funktioner i ett hypertextsystem.
Den beskrivna strukturen hos HyperGamma gör att det så småningom finns möjlighet att på skilda vis prova hur språkliga metoder kan användas i de första stadierna i skrivprocessen. Att med språkliga medel göra en linjär text av en icke-linjär text, allt inom ramen för HyperGamma, är ett exempel på detta.
De primära avsikterna med HyperGamma är emellertid andra. Med hjälp av en enkel funktion för hantering av s k reguljära uttryck har i dag en mängd utökade sökfunktioner kunnat implementeras på försök. Så går det idag bra att t ex söka efter namngivna begrepp, som årtal eller parentesuttryck, eller ord som har en fonologisk likhet med ett annat ord.
Med de reguljära uttrycken går det vidare bra att implementera ett enkelt, och antagligen välfungerande, system för automatisk korrekturläsning. Om man använder samma princip som används i amerikanska system för automatisk korrekturläsning, skulle ett system för automatisk korrekturläsning snabbt kunna byggas upp som en separat modul i HyperGamma.
Den nämnda automatiska korrekturläsaren skulle i första hand vara inriktad på ortografisk korrekthet och framför allt språklig stil, samt i någon mån enklare grammatiska fel. Rena stavningskontroller kan utföras med programmet stava, som i så fall flyttas från sin normala UNIX-miljö till Macintosh-miljön.
De ofta populära kvantitativa måtten LIX och KIX, kan kan även dem enkelt implementeras i HyperCard. Programmet har lättillgängliga grafiska möjligheter och LIX- och KIX-värden skulle lätt kunna presenteras grafiskt i ett separat fönster.
Med hjälp av i första hand av programmet FreeText av Mark Zimmerman, till vilken källkod finns tillgänglig, skulle andra språkliga verktyg kunna infogas i HyperGamma. Detta gäller främst funktioner som stödjer sig på frekvensanalys, som automatisk indexering och frekvensbaserad sökning.
Systemet MorP (19xx), utvecklat vid Inst. för Lingvistik, Stockholms Universitet, kan analysera en text grammatiskt. Programmet i dag utvecklat i den interpreterande programmeringsmiljön Beta, varför en omkodning måste ske för att systemet skall bli användbart. För detta ändamål lämpar sig lex, det klassiska verktyget för lexikal analys, vilket genererar kompilerbar programkod i programmeringsspråket C. MorP använder heuristiska metoder för parsning och gör således inte någon fullständig grammatisk djupanalys av texten. Denna egenskap systemet snabbt, men medför också dålig precision som bieffekt. MorP implementerat med lex skulle på sikt kunna utgöra en mer fullständig grammatisk analys i HyperGamma.
I ett kortare tidsperspektiv kan texter flyttas till och från HyperGamma endast som oformaterade texter, dvs t ex utan markering av teckensnitt, teckengrad eller stilsort. På lite sikt skulle dock även detta kunna lösas. System för konvertering mellan HyperCard och Microsofts RTF-format skulle kunna inkorporeras i HyperGamma. SGML (Standard Generalized Markup Language) skulle kunna utgöra en annan tänkbar lösning. Ytterligare ett alternativ utgörs av Claris nya gemensamma filformat, kallat XTND, där information fritt kan överföras mellan programvaruhusets olika programvaror (MacWrite II, MacDraw, HyperCard etc).
FLOWER, L.S. & HAYES, J.R. 1980. Identifying the Organization of Writing Processes. Cognitive Processes in Writing, L. W. Gregg & E. W. Steinberg (utg.), 3 - 30. Hillsdale, New Jersey: Lawrence Erlbaum ass., Publishers.
HALVARSON, K., MEAD, D., WIKLANDER, C. & ZILLéN, T. 1990. Prima Vista: Skriv för att bli läst. Posten/Prima Vista, Stockholm.
HJERPPE, R. 1986. Eletronic Publishing: Writing Machines and Machine Writings. LIBLAB, Linköping University
KäLLGREN, G. 19XX. MorP - A Morphological Parser. PILUS, Dept. of Linguistics, Stockholm University, Stocholm.
SEVERINSON-EKLUNDH, K. 1989. Processeing ideas and text in an advanced outlining program: A case study. IPLab-12, NADA, KTH, Stockholm.
SHARPLES M. & PEMBERTON L. 1990. Starting from teh writer: Guidelines for the design of user-centered document processors. Cognitive Science Research Papers, CSRP 154, School of Cognitive and Computing Sciences,The University of Sussex, Brighton.
STRöMQUIST, S. 1989. Skrivboken. Liber, Stockholm.
SUNDBLAD
WIKBORG, E. 1990. Att författa text med ordbehandling: en studie av skrivstrategier på arbetsplatsen. IPLab-33, NADA, KTH, Stocholm.