Derfor er Word dårligt: et kig på koden og to alternativer

I et udmærket indlæg på online-magasinet Slate giver Tom Scocca udtryk for den frustration over programmet Microsoft Word, jeg kender alt for godt selv. Som han skriver:

“A Word file is the story-fax of the early 21st century: cumbersome, inefficient, and a relic of obsolete assumptions about technology. It’s time to give up on Word.”

Word har groft sagt en “mere-er-bedre”-tilgang til funktioner, som gør det helt unødigt overlæssset for den helt almindelige bruger. Programmet kan utroligt meget, og alle muligheder er slået til som standard – det gælder for eksempel ‘spor ændringer’, ‘autokorrektur’, automatisk indrykning af punktopstillinger og såkaldte “smart quotes”. Altsammen funktioner, der nok kan forekomme hjælpsomme for en person, der aldrig har skrevet før, men for en person, der arbejder seriøst med tekst, gør sig alt alt for mange antagelser om, hvordan teksten skal se ud.

Hvad værre er, for de der arbejder professionelt med at lave bøger, gør alle disse funktioner  dokumentets bagvedliggende kode unødigt kompliceret.

Tom Scocca laver således et eksperiment, hvor han ser på koden til et dokument, der ikke indeholder andet end de to ord “The Word”. Her er et kort uddrag:

<w:LsdException Locked=”false” Priority=”22″ SemiHidden=”false”
UnhideWhenUsed=”false” QFormat=”true” Name=”Strong”/>
<w:LsdException Locked=”false” Priority=”20″ SemiHidden=”false”
UnhideWhenUsed=”false” QFormat=”true” Name=”Emphasis”/>
<w:LsdException Locked=”false” Priority=”59″ SemiHidden=”false”
UnhideWhenUsed=”false” Name=”Table Grid”/>
<w:LsdException Locked=”false” UnhideWhenUsed=”false” Name=”Placeholder Text”/>

Sådan fortsætter doumentet med 8 siders kaudervælsk (sic!). Altsammen for at skrive sølle to ord. Eksemplet demonstrerer tydeligt, hvor meget historisk vraggods, Word-formatet rummer.

HTML

Til sammenligning ville et tilsvarende html-dokument for eksempel se således ud:

<html>

<body>

<p>The Word</p>

</body>
</html>

Det er lidt lettere at læse, ikke?

Medgivet, det er meget simpel kode, så hvis det skulle se lidt pænere ud, ville jeg tilføje et stylesheet, dvs. noget kode som definerer typografien i mit dokument. Det kunne se sådan ud:

<html>
<head>

<style type=”text/css”>
p {
font-family: Garamond, Serif;
font-size: 14px
}

p+p {

text-indent: 2em;

}

</style>

</head>
<body>

<p>The Word</p>

</body>
</html>

Omend det kan forekomme som sort tale for den uindviede, så er der faktisk en gennemskuelig logik i ovenstående kode. Den fortæller, at teksten skal bruge en klassisk skrifttype, hvilken størrelse den skal være og at der skal være indryk efter første afsnit. Selv med lidt typografi, fylder det hele en del mindre end 8 tætbeskrevne sider. Og det er let at lære.

Men, vil den opvakte læser sige: Man kan relativt let eksportere en Word-fil ud som html? Jo, det kan man. Men selv sådan en konvertering efterlader stadig en temmelig kluntet fil at arbejde videre med, for Word gør desværre den ‘tjeneste’, at forsøge at bevare så meget formateringsinformation som muligt i den html, der kommer ud af det. Faktisk er det oftest langt det letteste at konvertere dokumentet til ren tekst og formatere dokumentet helt forfra.

En pointe om opmarkering

Og hvis man nu var startet med at skrive i ren tekst, men gerne ville sørge for at der kom noget opmarkering med i sin tekst, så den i sidste ende kom til at se pæn ud? Den gode nyhed er, at der findes faktisk adskillige strukturelle opmarkeringssprog, der forsøger at gøre det betydeligt lettere at formatere tekst, end at sidde og rode med html-kode. De hedder navne som fountain.io, Markdown, MultiMarkdown, Textile, Tetropy og RestructuredText. De har det til fælles, at man skriver i ren tekst, for eksempel i Notepad, hvorefter man eksporterer til det slutformat, man ønsker, det være sig html, pdf eller endda Word.

I Markdown ville teksten se sådan ud inden man trykkede på én knap som ville lave samme html som ovenstående:

The Word

Kan du se pointen?

 


PS: Min pointe i indlægget er at tydeliggøre problemet. Jeg ved egentlig godt, at det for mange mennesker er uoverskueligt at forholde sig til at kode og lære opmarkeringssprog, og at mange tænker visuelt. At skrive i ren tekst gør det heller ikke lettere at overskue eller reorganisere længere tekster. Derfor anbefaler jeg ofte forfattere at finde et program, der er specialiseret til formålet.

Det kan du læse om i næste indlæg: Hvorfor jeg ikke anbefaler Word som forfatterværktøj.

PPS: tak til diverse folk på twitter (@mariebilde, @infonauten, @sorenpsorensen, @hjhansen, @haverholm, @TinaHolmboe, @Bewildergeist m.fl.) for dialog om emnet. Jeg selv hedder @tokeriis på Twitter.

6 thoughts on “Derfor er Word dårligt: et kig på koden og to alternativer

    • Hej Johs
      Du har ret i, at problemet er større end Word, men da Word er den praktiske standard, er det det jeg forholder mig til i artiklen.

      Man kan også med god ret overføre problemet på alle andre former for publicering, end lige netop bøger, som jeg beskæftiger mig mest med. Det er fx. det lignende problemer, de fleste cms-systemer har, når brugerne kopierer tekst fra Word over i det.

Skriv et svar