Kvantitativa läsbarhetsanalyser som metod för datorstödd granskning

Magnus Cedergren (ceder@nada.kth.se)
Interaktions- och presentationslaboratoriet
Inst. för Numerisk analys och datalogi
Kungl. Tekniska högskolan
100 44 Stockholm

Sammanfattning

Läsbarhetsformler och andra kvantitiva metoder för läsbarhet har fått en ny vår i och med att datorer kan användas vid för beräkningarna. Tillämpningarna för läsbarhetformlerna ligger numera till en allt större del inom datorstödd textgranskning. Här sammanfattas de klassiska läsbarhetsformlerna samt även en del av den omfattande kritiken mot dem. Datorer som beräkningsverktyg har delvis förändrat förutsättningarna för användningen av formlerna och en lång rad nya, alternativa metoder för läsbarhetsberäkningar har presenterats på senare år.

Förord

Allt fler människor skriver dagligen längre texter med hjälp av datorer. Administrativ personal, handläggare, lärare och forskare är några exempel. Denna utveckling har pågått i cirka tio år, och de ordbehandlingsprogram och system som används blir allt mer avancerade.

Datorn som skrivhjälpmedel för de nämnda yrkesgrupperna har inneburit en förändrad arbetsuppdelning på kontoren. Det är inte längre en noggrann och språkkunnig sekreterare som lägger sista handen vid alla dokument. Texten ändras ofta av författaren själv ända fram till "deadline". Denna förändring har potentiellt både positiva och negativa konsekvenser. Den ökade användningen av ordbehandling har inneburit ett ökat behov av datorstöd för att kontrollera och hantera språkliga egenskaper hos texter.

Denna rapport föreligger som ett delresultat inom projektet "Språkliga datorstöd vid skrivande" vid NADA/IPLab, Interaktions- och Presentationslaboratoriet, Inst. för numerisk analys och datalogi vid KTH. Inom detta projekt försöker vi med skribenten som utgångspunkt undersöka möjligheterna för datorn att på olika vis stödja skribenten språkligt. Med språkkunskap kan datorn utföra en mängd olika uppgifter: Granska texter (genom t.ex. läsbarhetsanalyser eller rättstavning), avstava eller kanske stödja skribenten att formulera och redigera texten. Vidare utvecklas en programprototyp, Plita, i HyperCard på Apple Macintosh. Projektet har finansierats av Apple Computer Svenska AB och av NUTEK (Närings- och teknikutvecklingsverket).

Skrivforskningen vid NADA/IPLab knyts till ett skrivlaboratorium som håller på att byggas upp. Forskningen inom detta laboratorium rör vitt skilda aspekter av skrivandet. Projekten som f.n. bedrivs vid laboratoriet, förutom de språkliga datorstöden, rör bl.a. undersökningar av problemen kring överblick vid skrivande med dator, grundläggande metoder för att studera skrivprocessen med datorstöd samt datorstött kunskapssamarbete med hypertext-teknik som datorstöd. En del forskning ägnas också datorstödd typografisk formgivning.

Jag vill här tacka Apple Computer Svenska AB, Jorge de Sousa Pieres och NUTEK, Gunnel Tolby/Ulf Eklundh som finansierat projektet samt min projektledare Kerstin S. Eklundh för många värdefulla råd under skrivandets gång.

Magnus Cedergren

1. Introduktion

Läsbarhetsformler har använts allt sedan 1930-talet för att med rent matematiska metoder försöka förutsäga läsbarheten hos en text, vilket innebär att man vill undersäka hur väl språket i texten för fram budskapet till läsaren. Forskare skiljer ofta bergreppet läsbarhet från läslighet och läsvärde, se vidare avsnitt 2.

Metoder för att förutsäga läsbarheten kan antingen vara textbaserade, enbart mätningar av textens språkliga kvalitéer, t.ex. läsbarhetsformlerna, eller text/läsarbaserade, mätningar av läsarens relation till texten. Några text/läsarbaserade mätmetoder beskrivs i avsnitt 3.

I avsnitt 4 beskrivs sedan läsbarhetsformlerna, alltifrån de första amerikanska försöken före andra världskriget till de aktuella svenska formlerna Lix och KIX. Jag diskuterar också användningen av datorer för att beräkna läsbarheten samt återger en del av den omfångsrika kritik formlerna och deras tillämpningar utsatts för.

Med utgångspunkt från kritiken har somliga formelkonstruktörer försökt skapa nya och mer sofistikerade läsbarhetsformler. Många av dessa försöker kvantifiera grammatiska storheter i texten. Metoder för att mäta sammanhang och syntaktisk komplexitet är några av dessa alternativa metoder som diskuteras i avsnitt 5.

2. Läsbarhet -- Läslighet

Vad menas med läsbarhet? [Björnsson 1968] definierar läsbarhet på följande sätt:

"Läsbarheten är summan av sådana språkliga egenskaper hos en text, vilka gör den mer eller mindre svårtillgänglig för läsaren."

Björnsson skiljer läsbarheten ifrån läslighet och läsvärde hos en text. Läslighet definierar Björnsson som de typografiska egenskaperna hos texten, såsom t.ex. val av teckensnitt, radlängd, eller det fysiska avståndet mellan stycken. Läsvärde är, enligt Björnsson, hur komplexa eller intressanta de innehållsmässiga aspekterna av texten är.

Roland Larsson [Larsson 1987] redovisar de tre begreppen i en nivåskiktad struktur. Den typografiska nivån, läsligheten, och den språkliga nivån, läsbarheten, ligger som grund för att textens innebörd, läsvärdet, skall nå fram till läsaren, figur 1.

Figur 1. Olika kommunikationsnivåer

För en översikt över litteratur på området läsligheten hos text på datorskärmar hänvisas till [Frenckner 1990]. Den här framställningen behandlar alltså läsbarheten och dess tillämplighet för datorstöd.

3. Metoder för att mäta och förutsäga läsbarhet

Det förekommer i många sammanhang att man vill kunna beräkna läsbarheten för en text. Med ett begrepp om hur tillgänglig texten är ur läsbarhetssynpunkt kan man klassificera texter, t.ex. på ett bibliotek eller i undervisningssammanhang. En författare eller redigerare kan kontrollera att nivån på en text ur läsbarhetssynpunkt överensstämmer någorlunda med den tänkta målgruppen.

Det finns flera metoder för att förutsäga läsbarhet. [Rush 1985] delar in dessa metoder i rent textbaserade metoder och text/läsarbaserade metoder. De rent textbaserade metoderna innebär att texten studeras rent objektivt, t.ex. genom att räkna meningslänger och ordlänger. De text/läsarbaserade metoderna, däremot, innebär att någon form av referensgrupp engageras när man vill bestämma läsbarheten hos dokumentet.

I detta avsnitt följer en kortfattad genomgång av några av de text/läsarbaserade metoderna, som av naturliga skäl inte helt kan automatiseras och delvis ligger utanför ramen för denna framställning. Jag väljer dock att summera dem eftersom somliga av dessa metoder ibland har använts för att verifiera läsbarhetsformler eller andra rent textbaserade metoder. De rent textbaserade metoderna följer sedan alltså i avsnitt 4.

3.1 Högläsning

Högläsning som metod för att bestämma läsbarhet fungerar av naturliga skäl bäst i skolsammanhang på lägre nivåer. En eller flera representanter från den tänkta målgruppen läser högt ur den aktuella texten. Beroende på om orden uttalas på ett riktigt sätt är det meningen att man ska kunna dra slutsatser om förståelsen av texten hos läsaren. [Rush 1985] nämner Betts kriterier för tolkning av resultaten av denna högläsning:

  • 99% ordriktighet -- 90% förståelse
  • 95% ordriktighet -- 75% förståelse
  • 90% ordriktighet -- 50% förståelse
  • Denna skalas jämna värden har dock ifrågasatts och värdena bör naturligtvis inte betraktas som alltför exakta.

    3.2 Bedömningar

    En annan vanlig metod är att låta kvalificerade bedömare klassificera textens läsbarhet. Man låter t.ex. svensklärare bedöma nivån på texter som är avsedda för skolbruk. Här följer några exempel på frågor en sådan bedömare kan kan försöka ta ställning till [Rush 1985]:

  • Innehåller texten en svår vokabulär?

  • Är det svåra koncept i texten?

  • Är meningarna svåra eller lätta?

  • Orsak och verkan, finns det tillräckligt med bindeord i texten för att sammanhanget lätt skall uppfattas?
  • 3.2.1 Irwin-Davis checklista

    [Rush 1985] beskriver vidare en detaljerad checklista avsedd att användas av en lärare för bedömning av pedagogiska texter. Denna Irwin-Davis` "Readability Checklist" innehåller ett drygt 40-tal frågor inom områdena: Förståelighet, organisation, förstärkning, motivation och läsbarhetsanalys. Dessa frågor rör således både textens och den tänkta läsargruppens "möjligheter" till goda resultat vad beträffar förståelse.

    3.2.2 Bedöming av läsbarhet efter mall

    I [Duffelmeyer 1982] beskrivs två metoder för att manuellt bedöma svårighetsgraden hos en text med utgångspunkt från en fastslagen mall: "The Rauding Scale" och SEER-tekniken ("Singer Eyeball Estimate of Readability").

    Rauding-skalan består av sex mindre malltexter motsvarande sex olika årskursnivåer: 2, 5, 8, 11, 14 och 17. För att använda Rauding-skalan läser man först igenom texten som skall klassas. Därefter bestämmer man två av malltexterna som mest liknar denna text ur läsbarhetssynpunkt. Tre faktorer tas här under övervägande: Hur vanliga orden som används är, hur komplex idén som presenteras är samt hur invecklade meningarna är. Därefter fastställs årskursnivån.

    SEER-tekniken består av två stycken likvärdiga skalor: Standardskala I och standardskala II. Dessa består var och en av åtta malltexter mellan årskurs 1,5 och 6,5 resp. 6,8. Texten som skall årskursbestämmas jämförs med texterna i de två skalorna och två stycken värden fastställs. Det slutliga värdet räknas fram som ett medel av de två skalorna.

    Skalorna på SEER-teknikens texter baseras på beräkningar med hjälp av några traditionella läsbarhetsformler, varför den i första hand skall betraktas som ett praktiskt alternativ till läsbarhetsformler vid manuell beräkning (jfr. avsnitt 4.4).

    3.3 Lucktester

    Lucktester som metod för att beräkna läsbarhet hos en text presenterades första gången i [Taylor 1953]. Olika varianter och modifieringar av den ursprungliga metoden har presenterats flera gånger.

    Principen med lucktester är att välja en eller flera lagom långa utdrag ur den aktuella texten. Därefter ersätts ord av en lucka i ett regelbundet intervall. Det är t.ex. vanligt att låta var femte ord ersättas av en lucka.

    Slutligen får ett antal försökspersoner försöka fylla i luckorna med de ord som stod där ursprungligen. Som mätresultat av dessa försök erhålls den andel av luckorna som försökspersonerna lyckades fylla i korrekt. En vanlig acceptans, t.ex. i Dale-Calls formel (avsnitt 4.2), är att 50% av luckorna fyllts i korrekt. Då, menar man, kan den tänkta målgruppen tillgodogöra sig texten på ett bra sätt.

    4. Läsbarhetsformler

    I detta avsnitt följer en sammanfattning av de rent textbaserade metoderna för att förutsäga läsbarhet. Först redovisas hur en traditionell läsbarhetsformel är uppbyggd följt av en uppräkning av några de mest kända traditionella formlerna för engelska. Därefter följer en beskrivning av metoder för manuella beräkningar samt vad datorstödda beräkningar har inneburit. Jag har bl.a. gjort en mindre utvärdering av några aktuella program som beräkna läsbarhet. Därefter följer en beskrivning av den svenska läsbarhetsformeln Lix samt dess efterföljare, Rix och KIX. Slutligen sammanfattas något av den mycket omfattande kritik som framförts mot läsbarhetsformlerna och deras användning.

    4.1 Hur är en läsbarhetformel uppbyggd?

    Somliga forskare [Klare 1963] som Leary (1935) och Bormuth ([Bormuth 1969], se vidare nedan) har tämligen förutsättningslöst försökt pröva hur olika mätbara variabler i texten inverkar på läsbarheten. Leary hittade 82 st skilda variabler och Bormuth 42 st. Det har visat sig att de traditionella läsbarhetsformlerna består av komponenter från två grupper av sådana variabler. Den ena gruppen består av komponenter som mäter svårighetsgraden på ordnivå och den andra på meningsnivå. Den senare, som i allmänhet brukar representeras av meningslängden räknat i antal ord, kan sägas vara ett enkelt mått på syntaxens komplexitet. Ordkomponenten, t.ex. ordlängd eller andelen svåra ord i texten, kan i någon mån representera semantikens svårighetsgrad [Rush 1985].

    De allmänna principen för att konstruera en formel är vanligen sedan denna:

    Efter att ha valt ut ett begränsat antal variabler som skall ingå i formeln jämförs en beräkning av dessa variabler med resultaten från någon referensmetod. Som sådan används t.ex. någon av de text/läsarbaserade mätmetoderna (avsnitt 3) eller McCall-Crabbs standard testlektioner för läsning. Dessa har enligt [Klare 1974/75] använts för flera av de äldre kända formlerna (se nedan). Dessa testlektioner finns vidare i flera upplagor (t.ex. 1925, 1950 och 1961, Klare), men var ursprungligen inte avsedda för konstruktion av läsbarhetsformler. Att formelkonstruktörer har använt denna verifikationsmetod för många av formlerna kan därför tolkas som en svaghet [Olson 1984].

    Med hjälp av en multipel korrelationsanalys erhålls regressionskoeffecienter till de ingående variablerna samt vanligen en konstant. Vidare erhålls en korrelationkoeffecient som anger hur väl formelvärdena från beräkningarna stämmer överens med referensmetodens värden.

    Det har diskuterats om formlerna enbart kan användas på större texter -- eller åtminstone på urval ur större texter -- eller om det går bra att applicera dem på enstaka meningar eller ord. [Bormuth 1969] kom i sina omfattande studier fram till att det i många fall går bra att applicera formlerna just på så små enheter som enstaka meningar och ord, likaväl som på större textmängder.

    4.2 De traditionella formlerna

    Detta avsnitt består av en summarisk beskrivning av de traditionella läsbarhetsformlerna för amerikansk engelska.

    4.2.1 De första formlerna

    I [Klare 1963, 1974/75] ges de bästa sammanfattningarna över läsbarhetsformlernas utveckling. Fram till sen tid har enligt Klare all väsentlig forskning på området ägt rum i USA. I det här avsnittet följer en kort sammanfattning.

    Sherman på 1890-talet och Kitson på 1920-talet sammanfattade några väsentliga grunder för vad som gör en text lättläst, utan att själva konstruera några läsbarhetsformler. Deras respektive slutsatser har legat som grund för de formler som senare utvecklats.

    Sherman kom fram till att följande tre faktorer påverkar läsbarheten positivt:

  • "Skriv som du talar"
  • Kortare meningar
  • Den tänkta läsaren i fokus under skrivandet
  • Sherman menade vidare att det går bra att göra läsbarhetsberäkningar enbart på en del av texten i stället för att göra det på hela texten.

    Kitson banade väg för en hel mängd läsbarhetsformler under 1920-talet genom att dra följande två slutsatser: Kortare genomsnittlig meningslängd och kortare genomsnittlig ordlängd förenklar läsbarheten hos en text.

    Irving Lorges läsbarhetsformel från 1939 är den mest kända av de tidiga formlerna. Den bestod av tre komponenter: genomsnittlig meningslängd, andel prepositionsfraser och andelen svåra ord (som inte fanns med Dales lista över svåra ord [Klare 1974/1975]).

    4.2.2 Några av de mest välkända formlerna

    Efter Lorge har en lång rad formler presenterats. Resultaten av beräkningar med de flesta av dessa formler är årskursnivåer (dvs. antal skolår). Detta faktum kan tolkas som att formlerna enbart skulle vara avsedda för användning i skolmiljö. Så är dock ofta inte fallet, utan årskursnivåer skall istället vanligen tolkas som det antal skolår som läsaren skall ha avverkat för att väl kunna tillgodogöra sig texten. [Bormuth 1969] menar att många formler går att applicera i flera, skilda sammanhang med alltigenom goda resultat.

    1943 publicerade Rudolf Flesch sina första formler. Hans första formel innehåller tre komponenter: Antal ändelser, genomsnittlig meningslängd samt antal personliga referenser. Flesch konstruerade flera formler och det är hans två formler från 1948 som är mest välkända, "Reading Ease" (R.E.) och "Human interest" (H.I.). Det är särskilt R.E. som blivit mycket spridd.

    R.E. = 206,835 - 0,846 wl + 1,015 sl

    H.I. = 3,635 pw + 0,314 ps

    wl = antal stavelser per 100 ord

    sl = genomsnittligt antal ord per mening

    pw = antal personord per 100 ord

    ps = antal personliga meningar per 100 meningar

    R.E. korrelerade 0,70 med McCall-Crabbs testlektioner och H.I. 0,43. Fleschs formler har räknats om flera gånger, vilket har resulterat i delvis andra koefficienter.

    Dale och Calls formel från 1948 för texter skrivna av vuxna tillhör också de mera välkända:

    Xs = 0,1579 xa + 0,0496 xb + 3,6365

    Xs = antal årskurser hos en läsare som svarar hälften rätt på testfrågor på passagen

    xa = Dales värde, eller andel ord utanför Dales lista med de 3000 vanligaste orden

    xb = genomsnittlig meningslängd

    Dale-Calls formel utgår, liksom Fleschs formler, från McCall-Crabbs testlektioner. Liksom Fleschs R.E. korrelerade även Dale-Calls formel 0,70.

    Robert Gunnings Fog index från 1952 är en annan välkänd läsbarhetsformel. I stället för att räkna stavelser som i Fleschs R.E. räknar Gunning den procentuella andelen komplicerade ord, som han definierar som alla ord med minst tre stavelser:

    Reading grade level = 0,4 x (genomsnittlig meningslängd +

    procentuell andel av ord med 3 eller fler stavelser)

    En nyare formel som fått stor spridning, särskilt för datorberäkningar, är J. Peter Kincaids formel [McClure 1987]. Den skrevs ursprungligen för att mäta läsbarheten hos den amerikanska flottans tekniska instruktionsböcker:

    Reading grade level = 0,39 x (ord/mening) + 11,8 (stavelser/ord) - 15,59

    Kincaids formel har dock visat måttligt goda resultat vid verifieringar utförda på elever inom den amerikanska flottan (korrelation 0,49) [Losa et.al 1983], men visat mycket goda resultat vid implementationen i programsystemet WWB (avsnitt 4.5.1).

    4.2.3 Några udda formler

    För att illustrera bredden hos den rika floran av textbaserade läsbarhetsmetoder för engelska som utvecklats under åren redovisas här två något udda metoder.

    Kvantitativa riktlinjer för god läsbarhet

    Morris [Klare 1974/75] föreslog 1972 en förenklad test av läsbarhet för offentliga och kommersiella texter med fastslagna övre värden för några variabler:

    Ord per mening: 25

    Ord per interpunkterad paus: 12

    Ord per stycke: 75

    Stavelser per 100 ord: 150

    Morris redovisar inte, enligt Klare, någon form av verifikation för sina värden.

    "Hörbarhetsformel"

    [Klare 1974/75] redovisar Fangs "Easy Listening Formula" (ELF) från 1966. Fang menade att det skulle finnas skillnader mellan "Hörbarhet" och läsbarhet.

    ELF = antal stavelser per ord i en mening fler än en

    Fang verifierade ELF i första hand med manuskript från nyhetsuppläsningar i TV. Han hittade en korrelation på 0,96 mellan ELF och Fleschs R.E.

    4.3 Användningen av formlerna

    Hur och i vilka sammanhang är det lämpligt att använda läsbarhetsformlerna? Det finns alltså många områden där man är intresserad av att förutsäga läsbarheten hos texter. Bibliotek vill kunna dela in sin litteratur för olika målgrupper. För undervisningsbruk vill läraren veta om texten är lagom avpassad till elevernas nivå. Militärt har läsbarhetsformler i flera sammanhang använts för att klassificera tekniska instruktionsböcker efter svårighetsgrad. Vidare används formlerna ofta som ett komplement till språklig granskning (det är så de används i mitt datorprogram Plita inom projektet "Språkliga datorstöd vid skrivande").

    4.4 Manuella hjälpmedel för beräkningar enligt formlerna

    Tidigare var man uteslutande hänvisad till manuella beräkningar av läsbarhetsvärden. Dessa beräkningar kunde många gånger bli både arbetsamma och tidsödande. Baserat på Shermans idéer (avsnitt 4.2.1) kom redan tidigt rekommendationer att endast utföra läsbarhetsberäkningarna på t.ex. slumpmässigt utvalda delar av den aktuella texten. Vid beräkning av läsbarheten för en bok beräknas läsbarheten t.ex. endast för var tionde sida.

    Tillsammans med presentationen en ny formel följde ofta detaljerade beskrivningar över hur formeln i praktiken skall tillämpas. Redan Flesch publicerade t.ex. 1951 [Klare 1974/75] ett diagram för fastställning av läsbarhet enligt hans R.E. och H.I.-formler.

    Det har även förekommit rekommendationer om andra hjälpmedel för manuella läsbarhetsberäkningar. Kincaid och McDaniel [Klare 1974/75] presenterade en metod för att använda en elektronisk metronom med räknare som stöd för manuell beräkning.

    4.4.1 Formler anpassade för manuellt bruk

    Många läsbarhetsformler/metoder är i sig själva från början utvecklade för att vara praktiskt användbara. Nya formler, t.ex. Rix-formeln (se nedan, avsnitt 4.6.2), har konstruerats för att vara så lätta att beräkna som möjligt. Somliga formler [Klare 1974/75] består t.o.m. av endast en variabel, vanligen någon som motsvarar ordkomplexitet.

    Edvard Frys läsbarhetsgraf [Fry 1968, 1977] är ett annat exempel på en praktiskt användbar metod för beräkning av läsbarhet. Frys graf består, liksom de flesta övriga formlerna av två komponenter: Genomsnittligt antal meningar per 100 ord och genomsnittligt antal stavelser per 100 ord. Till skillnad från de vanliga formlerna försöker inte Fry linjarisera förhållandet mellan årskurser och de två ingående komponenterna, utan ritar upp en graf med resultaten från sina mätningar. Grafen har de två ingående komponenterna på var sin axel. Med hjälp av sina mätvärden konstruerade Fry sedan en genomsnittskurva i grafen kring vilken de flesta värdena i praktiken ligger. Vad som skiljer Frys graf från de övriga formlerna är att denna kurva alltså inte kan liknas vid en linjär kurva, utan snarare vid en avtagande exponentiell kurva. En vidareutveckling av Frys graf skulle alltså kanske kunna leda till en läsbarhetsformel innehållande ett exponentiellt uttryck.

    I [Fry 1989] redovisas en annan enkel metod, avsedd särskilt för mycket korta urval av texter. I denna metod väljs ett antal nyckelord ut som skall representera texten. Av dessa väljs tre ut ytterligare en gång och deras genomsnittliga längd utgör ordfaktorn. Meningsfaktorn i denna metod är enbart relaterad till den genomsnittliga meningslängden och avläses i en tabell. För att slutligen erhålla årskursnivån på texten tas snittet av ordfaktorn och meningsfaktorn.

    4.5 Datorstöd

    I detta avsnitt sammanfattas några aspekter på datorstödda läsbarhetsberäkningar. Det är ofta lätt att automatisera beräkningarna av läsbarhetsformlerna så länge formlerna innehåller så pass tekniskt väldefinierade termer som t.ex. meningslängd och ordfrekvens. I kommersiella datorprogram av typen "Grammar&Style-checkers" förekommer i allmänhet läsbarhetsberäkningar som en delfunktion.

    Datorer för beräkning av läsbarhet har öppnat flera nya möjligheter. Datorerna kan hantera stora beräkningar, t.ex. av en hel bok i stället för väl valda delar av den (jfr. avsnitt 4.4). Det har vidare börjat dyka upp formler som manuellt kräver stora beräkningar (t.ex. med många variabler) men som lämpar sig väl för datorberäkningar. Med datorerna öppnar sig slutligen nya möjligheter vad gäller presentationen av beräkningsresultaten.

    4.5.1 Datorstöd för beräkning av läsbarhet

    Datorstöd för beräkning av läsbarhetsformler har funnits allt sedan 1960-talet. I [Klare 1974/75] görs en genomgång av några tidiga program för beräkning av läsbarhet enligt olika formler, t.ex. Fleschs R.E. och Dale-Calls formler.

    I de flesta program av typen "Grammar&Style-checkers" görs läsbarhetsberäkningar. Dessa program redovisar i allmänhet två kategorier av resultat. Dels anger programmen resultaten av läsbarhetsberäkningar enligt några kända formler, dels redovisas en mängd andra kvantitativa mått på texten, t.ex. meningslängd, ordlängder, antal pronomen, antal passiva fraser etc. I bilaga A redovisas några olika datorprogram som vi utvärderat vid IPLab och de kvantitativa mått och läsbarhetsformler som dessa program presenterar. Somliga av programmen är kommersiella program, medan andra är s.k. Freeware/Shareware. En enkel utvärdering av några av programmen redovisas i avsnitt 4.5.2.

    Trots att läsbarhetsformlerna generellt passar bra för datorberäkningar är det inte alltid självklart hur dessa beräkningar skall utföras. Något om dessa problem finns i [Spiegel&Campbell 1985]: Vad är en mening och hur definieras meningslängd? Man kan inte ens helt entydigt definiera vad som är ett ords "riktiga" längd. Hur gör man t.ex. med förkortningar och sifferuttryck?

    Spiegel&Campbells största problem var dock att definiera antalet stavelser för en engelsk text. De hittade inget enkelt och tillfredställande svar på detta problem, utan lät datorn i stället räkna antalet bokstäver i orden och via det approximera antalet stavelser vid beräkning av Fleschs R.E. För svenska är dock just detta problem mindre: Varje stavelse motsvarar exakt en vokal i de allra flesta fall. För svenska räcker det alltså att räkna antalet vokaler.

    Programmet STYLE [Cherry 1981] -- vilket är en del av programsystemet Writer`s Workbench (WWB) -- beräknar läsbarhetsvärden samt en rad andra kvantitativa mått, se vidare bilaga A. Cherry redogör i sin rapport något om sina slutsatser angående datorbaserade beräkningar av läsbarhetsformler. Hon påpekar bl.a. att Kincaids formel tenderar vara den mest användbara för teknisk dokumentation av de formler som ingår i STYLE.

    4.5.2 En enkel utvärdering av några program

    Jag har gjort en enkel utvärdering av några av de engelska program som redovisas i bilaga A. Med utdrag ur tre lärobokstexter på högskolenivå som utgångspunkt lät jag programmen göra sina läsbarhetsberäkningar. De siffermässiga resutaten redovisas i bilaga B.

    Resultaten verkar överenstämma bra i de fall där samma formel använts på samma text, men beräknade i olika program. Flesch R.E. som beräknas av Correct Grammar, Gram*ma*tik Mac, Maxi Read och Word Count (WC) skiljer sig endast några procent mellan de olika programmen. Motsvarande gäller även för Flesch-Kincaid som beräknas av Correct Grammar och Gram*ma*tik Mac. Dessutom överensstämmer årskursnivån från Gunnings Fog Index väl med årskursnivån från Flesch-Kincaid i Correct Grammar.

    Gunnings Fog Index överenstämmer dock mindre väl mellan programmen Gram*ma*tik Mac och Word Count (Macintosh). Detta visar att beräkningsgrunderna inte alltid är helt självklara och programmet Word Count förefaller inte använda riktigt samma beräkningsgrunder som de övriga programmen (jfr. föregående avsnitt).

    4.5.3 Några läsbarhetsformler särskilt anpassade för datoranvändning

    I och med att datorerna börjat användas för läsbarhetsberäkningar har somliga formler utvecklats särskilt anpassade för datorer. [Klare 1974/75] redovisar t.ex. "The Automated Readability Index" som var mycket väl lämpat för datorstödd beräkning eftersom man med denna formel räknar blanksteg och skiljetecken.

    I motsats till att många formler förenklats för att underlätta manuell användning, har somliga gjorts mer sofistikerade enbart avsedda för automatiserat bruk. Allt eftersom datorerna blev snabbare och kraftfullare kunde också formlernas komplexitet öka. I [Klare 1974/75] nämns ett försök till en mer komplicerad formel avsedd för en dator att beräkna. Programmet READSCORE består fem skilda variabler, alla viktade med en regressionskoeffecient:

  • 0,61 (genomsnittlig meningslängd)
  • 0,442 (genomsnittlig standardavvikelse hos ordlängder)
  • 0,060 (genomsnittligt antal propositioner)
  • 1,02 (ordlängd)
  • 0,03 (genomsnittligt antal bindningar)
  • 0,69 (konstant)
  • Denna utveckling representeras också av Bormuths studier [Bormuth 1969]. Dessa är de mest omfattande studier av läsbarhetsformler som gjorts. Bormuth testade en lång rad lingvistiska variabler, såsom t.ex. orddjup (t.ex. i ett parseträd), men också variabler som traditonellt använts i läsbarhetsformlerna: ordlängd, meningslängd, ord som förekommer i listor över vanliga ord etc. Bormuth erhöll hög korrelation för somliga variabler och lägre för andra. Han menade att ännu bättre formler än de existerande kan konstrueras, genom en kombination av rätt variabler. Precis som Fry implicit konstaterat ovan (avsnitt 4.4.1) kunde Bormuth konstatera att icke-linjära formler kanske skulle kunna ge bättre resultat än de linjära formlerna.

    4.5.4 Datorns påverkan på användningen av formlerna

    Datorprogram som beräknar läsbarhet har drastiskt förenklat ett arbete som tidigare i många fall var mycket tidsödande. Nu går det bra att med bara några enkla tangentnedtryckningar få ett till synes exakt siffervärde t.ex. för vilken årskursnivå texten är lämpad.

    [Duffelmeyer 1985] påpekar att användaren trots detta, precis som tidigare, måste ta exaktheten i dessa värden med en nypa salt. De flesta årskursgraderade formlerna kan enligt konstruktörerna slå fel med en hel årskurs upp eller ned. För Lix-formeln (avsnitt 4.6.1) skulle det uppskattningsvis motsvara i storleksordningen 5 enheter upp eller ned.

    4.5.5 Grafisk presentation

    Datorn ger inte bara möjlighet att snabbt och enkelt beräkna läsbarhet med hjälp läsbarhetsformler, med datorgrafik kan resultaten kopplas till modern presentationsgrafik.

    Figur 2. Lix-värden presenteras med cirkeldiagram i programprotypen Plita

    De två programmen Grammatik Mac och Sensible grammar (se Bilaga A) presenterar resultaten från sina läsbarhetsberäkningar med hjälp av ett liggande stapeldiagram resp. en linjalskala.

    I min egen programprototyp Plita presenteras en rad kvantitativa mått, däribland Lix-beräkningar (Lix, se nedan) med hjälp av presentationsgrafik. Med hjälp av cirkeldiagram, stapeldiagram och punktdiagram kan användaren förhoppningsvis lättare och snabbare tillgodogöra sig den sifferbaserade informationen.

    4.6 Lix med efterföljare

    Det har konstruerats en stor mängd läsbarhetsformler för andra språk än engelska. För svenska finns den inom Sverige väl spridda Lix-formeln. I detta avsnitt redovisas huvudsakligen denna formel och dess efterföljare.

    Lix formeln är dock inte ensam representant utanför det engelska språkområdet. [Klare 1974/75] redovisar en lång rad läsbarhetsformler för andra språk än engelska, däribland för franska, holländska, spanska, hebreiska, tyska, hindi, ryska och kinesiska. Dessa formler är dels lokala anpassningar av amerikanska formler, t.ex. Fleschs R.E., men också i flera fall helt egna formler. Språk med egna teckensystem, som hebreiska och kinesiska dialekter, kräver naturligtvis andra utgångspunkter än de formler som är utvecklade för det latinska alfabetet.

    4.6.1 Lix

    Lix eller läsbarhetsindex [Björnsson 1968] är i princip den enda svenska läsbarhetsformeln. Till skillnad från de flesta av de tidigare nämna formlerna är denna formel inte en regressionsformel. Värdena från Lix-beräkningar ger inte något konkret, direkt tillämpligt värde, t.ex. en årskurs, som är vanligt i de amerikanska formlerna. Ett Lix-värde måste istället på något sätt tolkas.

    Liksom de amerikanska formlerna består Lix av en komponent för meningslängd, som på något vis skall motsvara syntaktisk svårighetsgrad, och en komponent för ordlängd, som beskriver semantisk svårighetsgrad:

    Lix = Antalet ord / Antalet meningar + 100 * Antalet svåra ord / Antalet ord

    Svåra ord definierar Björnsson som alla ord som består av mer än sex bokstäver.

    Lix saknar alltså regressionskoeffecienter och i stället behövs tolkningstabeller, särskilda "Lix-tolkar". Genom omfattande studier för olika typer av text har Björnsson erhållit flera olika typer av Lix-tolkar beroende på användningsområde. Den sådan, generell Lix-tolk ser ut på följande sätt [Larsson 1987]:

  • 20 - 25 Mycket lättläst
  • 31 - 35 Lättläst, skönlitteratur, populärtidningar
  • 40 - 45 Medelsvår, normal tidningstext
  • 50 - 55 Svår, normalt värde för officiella texter
  • 60 - Mycket svår, byråkratsvenska
  • Genom att Lix kan tolkas på olika sätt i olika sammanhang kan den också användas för texter både från vuxna skribenter och skolelever. På motsvarande sätt kan den också för andra språk än svenska. I [Björnsson 1983] jämförs Lix-värden på tidningstexter på elva olika språk. [Bamberger&Rabin 1984] beskriver årskursgraderade Lix-tolkar för tyska, en särskild för skönlitteratur och en annan för facklitteratur.

    Jonathan Anderson, Flinders University of South Australia, har använt Lix för läsbarhetsvärdering av texter [Anderson 1981] på bl.a. franska och engelska och erhöll ungefär samma goda korrelation som vid användning av Fleschs R.E.

    4.6.2 Rix

    Anderson har dessutom vidareutvecklat och förenklat Lix-formeln [Anderson 1983a, 1983b]. Resultatet, hans formel Rix (Readability index), lyder:

    Rix = 100 x Antalet svåra ord / Antalet meningar

    Ordfaktorn, antalet svåra ord, och meningsfaktorn, antalet meningar, bildar i Rix-formeln en kvot, till skillnad mot Lix-formeln där de bildar en summa. Ett svårt ord definieras, precis som är fallet för Lix-formeln, som alla ord med fler än sex bokstäver.

    Rix-formeln är avsedd att vara manuellt lättberäknad. För att beräkna ett Rix-värde för en text räcker det med att räkna dels antalet brytpunkter för nya meningar, dels antalet svåra ord. Storheten antalet ord som förekommer i Lix-formeln kräver mest arbete vid manuell beräkning. Denna storhet har av praktiska skäl alltså eliminerats i Rix-formeln.

    Rix-formeln är i första hand avsedd för bruk i pedagogiska sammanhang. I en tabell tolkar Anderson Rix-värdena som årskurser. Denna tabell är inte strikt linjär, utan 10 motsvarar t.ex. årskurs 1, 210 årskurs 6 och 670 årskurs 12.

    De rent praktiska motiven att använda Rix-formeln faller dock vid datorstödd beräkning av läsbarhetsvärden. De rena ortografiska storheterna, som både Rix-formeln och Lix-formeln består av, är alla lätta för en dator att beräkna.

    4.6.3 KIX

    Roland Larsson, Kalmar, har utvecklat KIX-metoden (Karaktärsindex, beskrivs i [Larsson 1987]). Han har utgått ifrån Lix och försöker liksom Fry att beskriva olika värden grafiskt med ordkomponenten på den ena axeln och meningskomponenten på den andra. Till skillnad från Fry försöker Larsson dra långtgående slutsatser om textens kvaliteter enbart med hjälp av värdenas placering i grafen. KIX-metoden har inte verifierats vetenskapligt och har fått utstå mycket kritik.

    KIX-metoden kan inte beskrivas genom ett enda formeluttryck. Nedan följer därför en kortare matematisk beskrivning av KIX-metoden hämtad ur [Larsson 1987], tillsammans med de antaganden som Larsson gör implicit.

    En matematisk beskrivning av KIX

    Med utgångspunkt i en omformulerad Lix-formel (avsnitt 4.6.1)

    L = x + 100 * y/x (1)

    L = Lixvärde

    x = genomsnittligt antal ord per mening

    y = genomsnittligt antal långa ord per mening i texten

    görs följande härledning:

    Om (1) betraktas som en funktion där y beror av x och L, erhålls följande "Lix-parabel":

    y = x (L - x) / 100 (2)

    Här gör Larsson antagandet att ett maximum av denna funktion är eftersträvansvärt, dvs. att det genomsnittliga antalet långa ord per mening skall vara så stort som möjligt vid ett fixt Lixvärde. Larsson menar att skribenten får betala ett "pris" om han vill förmedla ett långt, innehållsbärande ord till läsaren. y-variabeln i (2) är maximal då

    x = L/2 (3)

    och

    y = L2 / 400 (4)

    Larsson räknar utifrån (3) fram "idealkurvan", utmed vilken texter med ett bestämt lixvärde "bör" ligga:

    y = x2 / 100 (5)

    Nästa antagande baserar sig, delvis, på kognitiva fakta: Hjärnan klarar inte av att hantera fler än nio begrepp samtidigt, därför klarar den heller inte fler än nio långa ord i en mening samtidigt, enligt Larsson. Genom detta antagande erhålls en "varningskurva" ur (2) om man fixerar y=9 och därmed x=60 (erhålls ur (4)):

    y = x (60 - x) / 100 (6)

    Varningskurvan är en övre gräns över vilken lixvärdena, enligt antagandet, inte bör hamna för en text med god läsbarhet. Larsson "balanserar" det nu uppkomna området ovanför idealkurvan genom att konstruera ett lika stort område nedanför idealkurvan. Lixvärdena för de enstaka meningarna bör i möjligaste mån hamna inom dessa områden enligt antagandena.

    Nu följer en hel mängd antaganden. Dessa de "tredje antagandena" samt de hittills beskrivna kurvorna illustreras i figur 3. De tredje antagandena består i att Larsson döper de områden som kurvorna indelar. Han delar dessutom in områdena ovanför och nedanför idealkurvan i ytterligare vardera tre områden, utan av tala om hur detta är härlett. De nio termerna Larsson på detta sätt introducerar är:

  • normal
  • enkel
  • svår
  • berättande
  • avancerad
  • elegant
  • komplicerad
  • pompös
  • pratig
  • Vid användning av KIX-metoden motsvaras varje mening i texten av en punkt på KIX-diagrammet. Vilken av de nio verbala omdömena om texten som skall väljas beror på var "tyngdpunkten" för alla punkterna hamnar, dvs. var ansamlingen av punkterna hamnar i diagrammet.

    Figur 3. KIX-diagrammet

    Att tolka KIX

    Förutom de verbala tolkningarna av värden i KIX-diagrammet (figur 3), räknar Larsson också upp ett antal av "språkhavets fula fiskar" och menar att KIX skulle kunna vara till hjälp för kunna att upptäcka dessa:

  • Nominalisering
  • Passivformer
  • Småord saknas
  • Fel precisionsdjup
  • Abstraktioner
  • Inskott
  • Med KIX-diagrammet som utgångspunkt, menar Larsson, att vi kan hitta "symptom" på var och en av dessa typer av vanliga fel. Exempelvis visar alltför många punkter uppe till vänster i diagrammet (korta meningar, stor andel långa ord) symptom på att texten innehåller nominaliseringar eller "substantivsjuka".

    Larsson påstår alltså att KIX dels kan ge en stilmässig bedömning av texten, dels hitta symptom på grammatiska svagheter hos texten.

    KIX som datorprogram

    Scandinavian PC Systems i Växjö säljer ett datorprogram [Larsson 1987] som beräknar KIX-värden och presenterar dessa som en graf i olika färger på datorns textskärm (MS-DOS). Programmet presenterar dessutom en rad andra aspekter på texten såsom frekvenstabeller, innehållsord/funktionsord, ordlängder, meningslängder, ordval etc.

    Programmet finns även i en amerikansk version under namnet "Corporate Voice" [Larsson&Frankel 1990] (tidigare "Readability" [Hensinger 1988]) där KIX-metoden baseras på Gunnings fog index i stället för som i det svenska programmet där Lix-formeln ligger som grund. Detta program är en vidareutveckling av det ursprungliga, svenska programmet. Användaren har i detta program större möjligheter att själv lägga till mallar i KIX-diagrammet etc. Programmet har gjort succé på de amerikanska marknaden, recension se [Rash 1991].

    4.7 Kritik mot läsbarhetsformlerna

    [Anderson&Davison 1986] sammanfattar kritiken mot läsbarhetsformlerna med att de dåligt förutsäger läsbarheten. En stor mängd faktorer förutom de som mäts av formlerna påverkar läsbarheten hos en text, säger Anderson&Davison. De redogör vidare för en mängd sådana faktorer, t.ex. läsarens bakgrundskunskaper och inställning till texten.

    [Svensson 1989], som skriver om läsbarhetsformlernas användning på barnlitteratur, delar in kritiken mot läsbarhetsformlerna i tre grupper:

  • Lingvistisk
  • Estetisk-litterär
  • Pedagogisk
  • Svensson framhåller dessutom vikten av att i de här sammanhangen skilja tillämpningarna av formlerna från själva formlerna.

    4.7.1 Kritik mot formlerna

    Det är bl.a. från textlingvistik och sociolingvistik som den lingvistiska kritiken mot formlerna hämtas. Formlerna analyserar texten enbart på ord- och meningsnivå och tar ingen som helst hänsyn till textens helhet, textens diskurs. Syfte och övriga omständigheter i själva lässituationen tar de inte heller hänsyn till. Bakgrundskunskapen hos läsaren är det tredje aspekten i den lingvistiska kritiken av formlerna.

    Den estetisk-litterära kritiken rör bl.a. författarens konstnärliga frihet. vilket inte några formler "bör" lägga band på. Lässituation är dessutom mer än bara en avkodning av ord och meningar, påpekar Svensson. För att ha full behållning måste läsaren kunna hantera ironier, metaforer, olika tonlägen hos berättaren etc. Detta går inte alls att mäta med de traditionella läsbarhetsformlerna. Svensson refererar dessutom till senare tiders forskning om skönlitterär läsning. Även läsaren, inte bara författaren, skapar på ett mycket personligt vis under läsningen.

    Den pedagogiska kritiken rör motivation, dels motivation för ämnet i texten, dels motivation för läsandet som sådant. En enligt läsbarhetsformlerna svår text kan bli en "munsbit" för en läsare, bara vederbörande är tillräckligt motiverad.

    4.7.2 Kritik mot formlernas tillämpning

    Den mest grundläggande kritiken mot läsbarhetsformlernas tillämpningar berör deras, enligt Svensson, missbrukade användning i samband med nyproduktion eller förändringar av befintliga texter. Ett av grundantagandena hos läsbarhetsformlerna är nämligen att de förutsäger läsbarheten hos en text. Det går alltså inte, enligt Svensson, att förbättra läsbarheten genom förändra texten för att "förbättra" ett formelvärde.

    Detta att förbättra en befintlig text, är en av grundvalarna för definitionen av KIX-metoden (avsnitt 4.6.3), varför denna metod t.ex. inte kan stå emot denna kritik.

    [Backman 1976] menar Björnsson talar emot sig själv vad gäller användningen av Lix-formeln i detta avseende. Dels säger Björnsson att formeln enbart skall användas på "naturliga" texter och inte på "manipulerade texter", dels säger han att man skall "variera meningslängden när man skriver om texten".

    Backman kritiserar vidare själv formlerna och påstår de enbart mäter trycksvärta. Han ger även underbetyg åt formelkonstruktörernas verifikationsmetoder, t.ex. lucktester och kunskapsprov. Backman efterlyser i stället metoder att subjektivt förutsäga texters påverkan på kognitiva processer.

    5. Alternativa metoder att mäta läsbarhet/läsförståelse

    Mot bakgrund av den kritik läsbarhetsformlerna fått utstå (avsnitt 4.7) har det gjorts många försök att konstruera mer språkligt sofistikerade metoder. [Bormuth 1969] (avsnitt 4.5.3) undersökte bl.a. en mängd språkliga variablers inverkan på läsbarheten, t.ex. ordklassers inverkan. Nedan följer referat av några andra sådana, engelskspråkiga försök.

    De traditionella formlerna är alltså lätta att automatisera. För de nedan beskrivna metoderna är detta inte alltid lika lätt. I många fall krävs skilda nivåer av automatisk grammatisk analys.

    5.1 Substantivfrekvenser

    [Elley 1969] föreslog en läsbarhetsformel helt knuten till en analys av hur svåra substantiven i texten är. Denna metod är utvecklad för användning på texter för skolklasser. Alla substantiv i texten tilldelas ett nivåvärde (1-8) enligt en särskild lista (den s.k. NZCER-listan utökad, 2700 ord). Alla ord som inte finns med på denna lista tilldelas nivån 9. Därefter beräknas den genomsnittliga nivån för alla substantiv. Elleys formel lyder således:

    AFL = X/Y

    AFL = genomsnittligt frekvensnivå

    X = totalt antal nivåer från NZCER-listan över alla substantiv i texten

    Y = totalt antal substantiv i texten

    Elleys substantivfrekvenser passar bra för datorstödda beräkningar. I och med den beränsade NZCER-listan behövs en analys göras liknande den som görs vid rättstavningskontroll.

    5.2 Språkprofiler

    [Bamberger&Rabin 1984] gjorde i sina läsbarhetsstudier årskursskalor för en hel rad faktorer, en språkprofil, som skulle kunna påverka läsbarheten av en text. Med Lix som utgångspunkt, jfr. avsnitt 4.6.1, konstruerade man skalor för variabler som meningslängd, andel enstaviga ord, andel flerstaviga ord, ovanliga ord (som inte finns med i en särskild lista över vanliga ord), andel krångliga ord etc.

    Likt Bormuth är Bambergers och Rabins studier omfattande. Likheterna med att undersöka en hel rad faktorer är också uppenbar. Skillnaden från Bormuth ligger framförallt i tolkningen av materialet. Österrikarna Bamberger och Rabin tolkar varje enskild faktor för sig. Vid användning av en språkprofil erhålls ett särskilt årskursvärde för varje enskild faktor för sig. En text kan t.ex. motsvara årskurs 8 vad gäller meningslängd och årskurs 6 vad gäller andelen enstaviga ord.

    Presentationen från en språkprofil blir naturligen mer omfångsrik än en ordinär läsbarhetsformel. Dessutom medför en manuell användning en sådan profil mycket arbete. Enligt konstruktörerna är därför beräkningar av dessa faktorer i första hand avsedda att genomföras med datorstöd.

    5.3 Hård, mjuk och dämpad

    [Whitney 1987] refererar till [Gibson 1966] när hon föreslår en ny utgångspunkt för läsbarhetsformler. Walker Gibson definierar tre stycken schematiskt renodlade typer av skribenter i sin analys av språklig stil. Dessa tre typer är:

  • Den hårde skribenten, som skriver kort och studsigt. Ord som "bestämd" och "arg" beskriver denna typ av skribent.
  • Den mjuke skribenten, som skriver "vänligt" och "sympatiskt". En annan tolkning av denna skribent är "insmickrande".
  • Den dämpade skribenten, som enligt Gibson knappast har någon personlighet överhuvudtaget. Byråkratspråk är ett bra exempel på hur den dämpade skribenten formulerar sig. Med utgångspunkt från dessa tre extrema ytterligheter av skribenter föreslår Whitney några kvantifierbara storheter som tillsammans skulle kunna identifiera någon av de tre typerna av stilar hos skribenten:
  • Antal enstaviga ord i en rad. Den hårde skribenten skriver mer på detta sätt än de andra två.
  • Antal pronomen i första och andra person. Den hårde och den mjuke skribenten använder dessa ord. Den dämpade gör det inte.
  • Typer av subjekt. Den hårde och den mjuke använder personer som subjekt medan den dämpade ofta föredrar neutrum ("Saker är den...").
  • Användningen av passivum. Den dämpade använder passivum mer än de andra två.
  • Böjningar. Den hårde böjer sina ord mindre än de andra två.
  • Uppradning av substantiv. Åtminstone för engelska radar den dämpade skribenten upp substantiv efter varandra, vilket de två andra typerna av skribenter inte gör.
  • Användning av bestämd form. Används mest av den hårde skribenten.
  • Användning av satsfragment. Används av den mjuke, sällan av de två andra.
  • Användning av parenteser, förkortningar, citat och frågetecken. Används i högre grad av den mjuke, än av de två andra typerna.
  • Whitney menar att man genom att mäta de nio faktorerna kan ange hur "hård", "mjuk" och "dämpad" texten är. De flesta texter kan alltså betraktas som en kombination av de tre typerna av skribenter. Själva viktningen av faktorerna återstår dock att göra.

    En datorbaserad beräkning enligt Whitneys metod kräver delvis endast enkla, ortografiska beräkningar -- som i de traditionella formlerna -- medan andra kräver olika typer av grammatisk analys.

    Omdömen om skribenten liknande de som Whitney föreslår görs i datorprogrammen RightWriter och PC-Style (Appendix A). De försöker ge bedömningar av typen beskrivande, personlig, händelserik etc. enbart genom att räkna ord av en viss typ (t.ex. en ordklass). Hur personlig texten är mäts t.ex. i andelen personliga pronomen, hur händelserik den är genom andelen innehållsbärande verb samt beskrivande i andelen adverb och adjektiv.

    5.4 Syntaktisk svårighetsgrad

    Botel och Granowsky [Klare 1974/75] föreslog 1972 mätning av syntaktisk svårighetsgrad. Denna skulle användas parallellt med de traditionella läsbarhetsformlerna, vilka, enligt Botel och Granowsky, i första hand angav ordens svårighetsgrad. De värderade olika typer av syntaktiska konstruktioner på en skala 0-3. Med skalan som utgångspunkt kan man sedan beräkna ett genomsnittligt värde för syntaktisk svårighetsgrad hos en text. Botel och Granowsky anger, enligt Klare, olika användningar för sin skala, men framhåller att deras arbete bara skall betraktas som en inriktning på ett framtida större arbete.

    [Fry 1977] definierar kärna och periferi i sin "Kernel Distance Theory". Kärnan i en mening definierar Fry som subjekt, predikat och ibland ett objekt. Periferi är de ord som inte ingår i kärnan. Fry påstår sedan, vilket är en verifierad del av hans teori, att periferi inskjuten mellan subjekt och predikat gör meningen svårare. I teorien ingår två ytterligare påstående som, enligt Fry, inte verifierats: Periferi före kärnan gör en mening svårare än en mening med periferi efter kärnan, samt periferi mellan subjekt och predikat är svårare än periferi mellan predikat och objekt.

    [Perkins 1982] refererar och försöker verifiera en skala för att mäta språklig stil utvecklad av Joseph Williams. Principen för denna skala är att det finns en koppling mellan de grammatiska begreppen subjekt, predikat och det semantiska begreppet agent och vad den gör.

    Datorbaserade läsbarhetsberäkningar av syntaktisk svårighetsgrad kräver naturligen en datorbaserad syntaktisk analys. Resultaten av sådan datorstödd, grammatisk analys blir sällan fullständigt korrekt. För denna tillämpning torde det dock inte betyda så mycket eftersom det vanligen handlar om statistiska beräkningar på vissa syntaktiska komponenter.

    5.5 Sammanhang

    Flera forskare har försökt kvantifiera sammanhanget i en text, dvs. bindningarna mellan meningar och mellan stycken.

    5.5.1 Sammanhangsbindningar

    [Anderson 1983] försökte mäta "Cohesive ties" , dvs. sammanhanget i form av bindningar i en text. Han utgick ifrån den uppdelning av olika typer av sammanhangsbindningar som gjordes i [Halliday&Hasan 1976]. Där delas begreppet sammanhangsbindning in i följande fem klasser:

  • Referens: Personliga, demonstrativa och jämförande
  • Ersättning: Nominal, verbal och sats
  • Ellips: Nominal, verbal och sats
  • Konjunktion: Additiv, adversativ, kausal och temporal
  • Lexikal: Repetition, synonym, underordnad och generellt substantiv
  • Anderson analyserade tre korta texter med avseende på bindningar av dessa typer. Han räknade dels de grammatiska bindningarna (referenser, ersättningar och ellipser) dels de lexikala bindningarna i respektive text. Vidare uteslöt han konjunktionsbindningarna.

    För jämförelsens skull genomförde han dessutom läsbarhetsmätningar enligt två andra metoder: Bedömning och läsbarhetsformel (RIX, beskrivs vidare i avsnitt 4.6.2). Anderson relaterar sedan det totala antalet bindningar till antalet ord. Vid jämförelse mellan denna relation och resultaten från de två andra mätmetoderna erhålles värden som är omvänt proportionella. När Anderson sedan relaterar bindingarna till antalet meningar erhålles däremot värden som är direkt proportionella.

    Materialet är mycket litet, och Anderson menar att mycket forskning återstår att göras kring relationen mellan sammanhanget/bindningarna i en text och läsbarheten/förståelsen av den.

    En datorstödd beräkning av antalet bindningar enligt ovan är kanske inte helt omöjlig. I varje fall de grammatiska bindningarna består tekniskt av en begränsad mängd av funktionsord. De lexikala bindningarna, däremot, kan bli svårare. Här krävs antagligen av datorn en mer fullständig semantisk analys.

    5.5.2 PHAN-systemet

    I [Clark 1981] redogörs för "The PHAN system". I denna metod att analysera läsförståelse utgår Clark från fraser i en text. Det första steget i hans metod är att dela upp texten i fraser (nominalfras, verb etc). Därefter identifieras och kvantifieras tre huvudgrupper av språkliga faktorer i texter:

  • Korrekta bindningar: Referenser, konjunktionsbindningar, underförstådda bindningar samt "separata" bindningar.
  • Oklara bindningar, t.ex. felaktigt använda konjunktioner som gör att läsaren delvis måste "gissa" sammanhanget och vilken konjunktion som skulle stått på platsen egentligen.
  • Vokabulär på frasnivå. Ofta kan, enligt Clark, i sig enkla ord tillsammans bilda en fras som kan vara mycket svår att förstå.
  • De två senare kategorierna räknas, medan bindningarna i den första gruppen kvantifieras som avståndet mellan referens och referent (t.ex. mellan en nominalfras och ett pronomen).

    Clark framhåller att hans PHAN-system inte ersätter läsbarhetsformlerna, utan i stället kompletterar dessa. Han menar att de traditionella formlerna vanligen mäter avkodning av texten, medan hans system mer mäter textförståelse.

    5.6 Metaforisk svårighetsgrad

    [Congleton 1982] konstruerade en skala för att mäta metaforisk komplexitet. Congleton delar in metaforer i åtta olika klasser och viktar dessa på en skala 1 - 5 efter ökande svårighetsgrad:

  • personifikation 1,7
  • metafor 2,0
  • liknelse 2,1
  • analogi 2,1
  • hyperbol (retorisk överdrift) 2,1
  • hänsyftning 3,7
  • paradox 3,8
  • symbol 4,2
  • Congleton försökte verifiera sin skala med bedömningar från kvalificerade bedömare. Resultatet gav en god korrelation (runt 0,9). Hon jämförde också mätningar med sin skala med Frys läsbarhetsgraf och fick här ingen god korrelation. Ur detta drog Congleton slutsatsen att hennes skala inte mäter samma faktorer som de traditionella läsbarhetsformlerna, utan i stället kan användas som ett komplement till dessa.

    Congletons skala är av semantisk karaktär och det krävs kvanlificerade bedömare för att beräkna de metaforiska svårighetsgraden. Det kommer naturligtvis inom överskådlig tid att vara svårt att anpassa denna skala för datorberäkningar.

    6. Slutsatser

    Jag tror att läsbarhetsformler fungerar bra som ett komplement till datorstödd textgransning. Det är dock viktigt att resultaten från läsbarhetsberäkningarna tolkas på rätt sätt:

  • En granskad text blir inte nödvändigtvis mer läsbar bara genom att "förbättra" ett läsbarhetsvärde.
  • Årskursnivåer eller andra exakta värden för läsbarhet skall inte tolkas för exakt, utan skall snarare ses som en indikation på hur läsbar texten är.
  • Verbala omdömen som i KIX-programmet är tilltalande, men bör "tas med en nypa salt".
  • Det är också viktigt att minnas för vilka syften läsbarhetsformlerna i allmänhet skapades. Att t.ex. göra läsbarhetsberäkningar på skönlitterär text ger sällan trovärdiga resultat.

    Med datorer och nya, mer sofistikerade metoder för läsbarhet kan morgondagens läsbarhetsprogram bli mer användbara:

  • Mer användning av datorgrafik och olika (dock vederhäftiga) diagrammetoder för att presentera resultaten.
  • Nya kvantitativa metoder för att beräkna läsbarhet utifrån grammatiska variabler, t.ex. syntaktisk svårighetsgrad eller sammanhang, kan ersätta eller i varje fall komplettera beräkningarna. De metoder, eller idéer till metoder, som refererats till i denna rapport behöver vidareutvecklas.
  • Vid konstruktion av program som beräknar läsbarhetsvärden med hjälp av läsbarhetsformler är det vidare viktigt att vara nogrann i sin definition av ordlängder, meningslängder etc. Mitt försök (avsnitt 4.5.2) visar att alltför enkla program i bland kan ge felaktiga resultat.

    [Bamberger&Rabin 1984] nämner slutligen flera tänkbara, rent nya, framtida forskningsområden: Metoder för att

  • mäta innehållsmässig svårighet.
  • erhålla bättre insikt i läsarens bakgrundskunskaper.
  • textens stilmässiga svårigheter.
  • svårigheterna i textens organisation.
  • interaktionen mellan texten och läsaren (motivation, lässtrategier, resultat av psykolingvistik etc.)
  • Litteraturreferenser

    ANDERSON, JONATHAN, 1981: Analysing the Readability of English and non-English texts in the classroom with Lix. Paper presented at the Annual Meeting of the Australian Reading Association, Darwin, Australia, August 1981; ERIC ED207022

    ANDERSON, JONATHAN, 1983a: Lix and Rix: variations on a little-known readability index. Journal of Reading, no 26, 1983, pp 490-496

    ANDERSON, JONATHAN, 1983b: Cohesion, Comprehending and Comprehensibility. Paper presented at the Annual Meeting of the International Reading Association (28th, Anaheim, CA, USA, May 2-6, 1983); ERIC ED233314

    ANDERSON, RICHARD & DAVISON, ALICE, 1986: Conceptual and Empirical Bases of Readability Formulas. Technical Report No. 392. ERIC ED281180

    BACKMAN, JARL, 1976: Lix-mätning av läsbarhet eller trycksvärta? (Pedagogisk debatt 16). Umeå universitet 1976.

    BAMBERGER, RICHARD & RABIN, ANNETTE T., 1984: New approaches to readability: Austrian research, The Reading Teacher, Feb. 1984, pp. 512-519

    BJöRNSSON, C. H., 1968: Läsbarhet. Liber, Stockholm 1968

    BJöRNSSON, C. H., 1983: Readability of Newspapers in 11 languages. Reading Research Quarterly, vol 18, summer 1983, pp. 480-487

    BORMUTH, JOHN R., 1969: Readability: A new approach. Reading Research Quarterly, Spring 1969, pp 79-135

    CHERRY, L. L. & VESTERMAN, W.: The STYLE and DICTION Programs (Computing Science Technical Report #91). Bell Laboratories, Murray Hill, N.J., USA, 1980.

    CLARK, CHARLES H., 1981: Assessing comprehensibility: The PHAN system. The Reading Teacher, March, 1981

    COHEN, MICHAEL E. & LANHAM, RICHARD A.: HOMER: Teaching Style with a Microcomputer. in The Computer in Composition Instruction: A Writer's Tool, William Wresh (Ed.), National Council of Teachers of English, Urbana, I.L.; ERIC ED241602

    CONGLETON, DONNA M.1982: Development and Validation of a Scale to Measure Metaphoric Complexity. ERIC ED258185

    DAVISON, ALICE, 1986: Readability -- The Situation Today. Reading Education Report No. 70. ERIC ED281166

    DUFFELMEYER, FREDERICK A. 1982: A comparision of two noncomputational readability techniques. The Reading Teacher, Oct 1982.

    DUFFELMEYER, FREDERICK A. 1985: Estimating readability with a computer: Beware the aura of precision. The Reading Teacher, Jan 1985.

    ELLEY, WARWICK B., 1969: The assessment of readability by noun frequency counts. Reading Research Quarterly, Spring 1969,pp. 411-427

    FRENCKNER, KERSTIN 1990: Legibility of continous text on computer screens -- a guide to the literature (IPLab-25). NADA, KTH, Stockholm, 1990.

    FRY, EDWARD 1968: A Readbility Formula That Saves Time. Journal of Reading, April, 1968.

    FRY, EDWARD 1977: Fry`s Readability Graph: Clarifications, Validity and Extension to level 17. Journal of Reading, December, 1977

    FRY, EDWARD 1989: A Readability Formula for Short Passages. Version of a paper presented at the Annual Meeting of the International Reading Association (34th, New Orleans, LA, USA, April 30 - May 4, 1989); ERIC ED308492

    GIBSON, WALKER 1966: Tough, Sweet and Stuffy: An Essay in Modern Prose Styles. Indiana University Press, Bloomington, IA, USA, 1966

    HALLIDAY, M.A.K., & HASAN, R: Cohesion in English. London, UK: Longman, 1976

    HENSINGER, JAMES S., 1988: Readability. Library Software Review, July/August 1988.

    KLARE, GEORGE R.: Assessing readability. Reading research quarterly, No 1 1974-1975.

    LARSSON, ROLAND: Läsbarhetprogram KIX för IBM PC, XT och AT. Scandinavian PC Systems AB, Växjö 1987, ISBN 91-86940-13-9

    LARSSON, ROLAND & FRANKEL, STEVEN 1990: Corporate Voice -- A New Kind of Writing Tool. Scandinavian PC Systems Inc., Rockville, Maryland, USA

    LOSA, J. W., AAGAARD, JAMES A. & KINCAID, J. PETER 1983: Readability grade levels of selected navy technical school curricula (Technical Memorandum 83-2). Training Analysis and Evaluation Group, Orlando, FL 32813, USA; ERIC ED226337

    MCCLURE, GLENDA M.: Readability Formulas: Useful or Useless? IEEE Transactions on Professional Communication. No 1, Mar 1987.

    OLSON, ARTHUR V., 1984: Readability Formulas -- Fact or Fiction. Reports - Research/Technical (143), ERIC ED258143

    PERKINS, KYLE, 1982: The Application of a Stylistic Metric to English as a Second Language Compositions. ERIC ED225383

    PERLMAN, GARY & ERICKSON, THOMAS D.: Graphical Abstractions of Technical Documents. Visible Language, No 4 1983

    RASH, WAYNE JR. 1991: Corporate Style. Byte, feb. 1991.

    RUSH, TIMOTHY, 1985: Assessing readability: Formulas and alternatives. The reading teacher, December, 1985

    SPIEGEL, GLENN & CAMPBELL, JOHN J., 1989: Measuring Readability with a Computer: What We Can Learn. Paper presented at the Meeting of the UCLA Conference on "Computers and Writing: New Directions in Teaching and Research", Los Angeles, CA, USA, May 4-5, 1989; ERIC ED262386

    SVENSSON, CAI, 1989: Index eller intresse? Linköping 1989

    TAYLOR, W, 1953: Cloze procedure: A New Tool for Measuring Readability. Journalism Quarterly, no 30, 1953, pp 415-433

    WHITNEY, MARGRET A., 1987: Combining Elegance and Readability: Walker Gibson's Tough, Sweet, and Stuffy. IEEE Transactions on Professional Communication, No 4, Dec 1987

    Bilagor

    Bilaga A. Några datorprogram som utför läsbarhetsberäkningar

    Correct Grammar

  • Antal stycken

  • Genomsnittlig styckeslängd i antal meningar

  • Antal meningar

  • Genomsnittligt meningslängd i antal ord

  • Antal passiva fraser

  • Antal långa meningar

  • Antal ord

  • Genomsnittlig ordlängd i antal bokstäver

  • Antal stavelser per 100 ord

  • Antal bokstäver

  • Fleschs R.E.

  • Flesch-Kincaids formel

  • Gunnings fog index

    Vissa av resultaten tolkas som procentandelar av en total mängd, såsom t.ex. antal passiva fraser. Fleschs R.E. tolkas som årskursnivå.

    Komersiell programvara för Macintosh
    (egentligen CorrectText från Houghton-Mifflin Co.)

    Lifttree Software

    33 New Montgomery Street

    Suite 1260

    San Fransisco, CA 94105

    USA

    Gram*ma*tik Mac

  • Antal stycken

  • Genomsnittlig styckeslängd i antal meningar

  • Antal meningar

  • Genomsnittlig meningslängd i antal ord

  • Antal meningar som avslutas med "?"

  • Antal meningar som avslutas med "!"

  • Antal fraser i passivum

  • Antal långa meningar (enligt ett förändringsbart kriterium)

  • Antal korta meningar (enligt ett förändringsbart kriterium)

  • Antal ord

  • Genomsnittlig ordlängd i antal bokstäver

  • Antal prepositioner

  • Genomsnittligt antal stavelser per ord

  • Fleschs R.E.

  • Gunnings fog index

  • Flesch-Kincaids formel

    Verbala tolkningar presenteras till en del i resultaten, t.ex. till läsbarhetsvärdena och de genomsnittliga ord-, menings- och styckeslängderna. Läsbarhetsvärdena presenteras dessutom som horisontella stapeldiagram.

    Kommersiell programvara till Macintosh
    (Ursprungligen Grammatik IV för MS-DOS)

    Reference Software

    330 Townsend Street

    Suite 123

    San Fransisco, CA 94107

    USA

    KIX

  • KIX-diagram

  • Meningarnas karaktär (enkel, berättande etc.)

  • Långa ord per mening

  • Meningslängder

  • Korta ord i följd

  • Långa ord i följd

  • Ordlängder

  • "Tegelstenar"

  • "Murbruk" och "tegelstenar"

  • Kommentarer till ordvalet

  • Meningarnas karaktärer (enkel, berättande etc.)

  • Långa ord per mening

  • Meningslängder

  • Sammanfattande omdöme (betygssättning 1-5)

  • Sammanfattande kommentarer (verbala omdömen)

  • Antal meningar och ord

    De flesta värdena presenteras i KIX-programmet som stapeldiagram. "Murbruk" och "tegelstenar" motsvarar ungefär funktionsord och innehållsbärande ord.

    Kommersiell programvara för MS-DOS

    Scandinavian PC Systems 1987

    Box 5004

    350 05 VÄXJÖ

    MAXI-READ

  • Antal meningar

  • Genomsnittlig meningslängd i ord

  • Antal ord

  • Genomsnittlig ordlängd i stavelser

  • Personlig ton -- andel personord

  • Andel "långrandiga" ord

  • Antal stavelser

  • Flesch R.E.

    De mer komplicerade faktorerna presenteras på var sin linjalskala. De sammanfattas verbalt på en skala "Utmärkt" till "Behöver bearbetas".

    Freeware/Shareware för MS-DOS

    (c) 1984 - 1988 RWS & Associates

    132 Alpine Terrace

    San Francisco Ca. 94117

    USA

    PC-Style

  • Antal meningar

  • Genomsnittlig meningslängd (i antal ord)

  • % andel långa ord

  • Personord

  • "Action"-verb

  • Genomsnittlig ordlängd i stavelser

  • Årskursnivå (enligt någon icke ingiven läsbarhetsformel, ev. Gunning`s fog index

    Alla dessa värden presenteras på var sin linjalskala med siffervärden. Dessutom presenteras tre omdömen, läsbarhet, personlig ton och händelser på en skala mellan "Usel" och "Utmärkt".

    Freeware/Shareware för MS-DOS

    (c) 1986 Jim Button

    P.O. Box 5786

    Bellevue WA 98006

    USA

    RightWriter

  • Årskursnivå

  • "Strength index"

  • "Descriptive index" (kvantitativ användning av adjektiv och adverb)

  • "Jargon index"

    Kommersiell programvara för MS-DOS (finns även i versioner för andra plattformar)

    QUE

    11711 N. College Ave.

    Carmel

    Indiana 46032

    USA

    STYLE (Writer`s Workbench)

  • Antal meningar

  • Genomsnittlig meningslängd i antal ord

  • Antal frågor

  • Antal utropssatser

  • Antal långa meningar (> 32 ord)

  • Antal korta meningar (< 17 ord)

  • Längden hos den längsta meningen

  • Längden hos den kortaste meningen

  • Antal ord

  • Antal innehållsbärande ord

  • Genomsnittlig längd hos de innehållsbärande orden

    Dessutom kvantifiering av såväl några syntaktiska mått (enkel, samansatt mening etc.) som ordklasser (verbformer, substantiv, prepositioner etc.) och meningsinledning (indelat i ordklasser).

    Kommersiell programvara för UNIX

    AT&T

    Word Count

  • Antal stycken

  • Styckelängd i antal meningar: Genomsnittligt, längsta och kortaste

  • Antal meningar

  • Meningslängd i antal ord: Genomsnittligt, längsta och kortaste

  • Antal ord

  • Gunnings fog index

    Freeware/Shareware för Macintosh

    Stephen Kirkpatrick

    CIRCLE Lab

    UC Santa Barbara

    (c) Regents, University of California

    USA

    Word Count (WC)

  • Antal meningar

  • Genomsnittlig meningslängd i antal stavelser

  • Genomsnittlig ordlängd i stavelser

  • Antal stavelser

  • Läsbarhet (dels som ett tvåsiffrigt siffervärde, dels som årskursnvå, förefaller vara Fleschs R.E.)

    Redovisar dessutom en sammanställning över de 30 vanligaste orden i texten och hur många gånger resp. ord använts. Frekvenslista över bokstävernas användning i texten.

    Freeware/Shareware för MS-DOS

    Chris B. Sakkas

    (c) 1991 The Software System

    Bilaga B. Sammanställning över några datorbaserade läsbarhetsberäkningar

                                              I  II                III               
    Correct Grammar                                                                  
    Flesch R.E.                        58.2 (9)  77.3 (6)          45.5 (13)         
    Flesch-Kincaid grade l.                 9.6  5.0               11.2              
    Gunning Fog Index                       9.3  5.1               10.0              
    Gram*ma*tik Mac                                                                  
    Flesch-Kincaid grade l.                  10  5                 12                
    Flesch R.E.                              56  78                46                
    Maxi Read                                                                        
    Flesch R.E.                         58 (10)  79 (7)            46 (14)           
    Sensible Grammar                                                                 
    Flesch R.E.                        50% (13)  76% (7)           ?               
    Flesch H.I.                             10%  65%               ?               
    Word Count (Macintosh)                                                           
    Gunning Fog Index                        13  8                 15                
    Word Count (MS-DOS)                                                              
    Flesch R.E.                       58.6 (10)  79.3 (7)          45.8 (13)