Karl-Erik Tallmo,
artikelregister

Får ej kopieras utan författarens medgivande. Copyright © Karl-Erik Tallmo

DN 19/7 1997

Lätt att gå vilse bland finesserna

Det krävs förkunskaper för att kunna söka effektivt i Nationalencyklopedins nya ordbok på cd-rom.

Nationalencyklopedins ordbok (NEO) har nu kommit ut på CD-ROM. Det är cirka 137 000 uppslagsord som så att säga släppts loss ur sitt fysiska fängelse. Tidigare dolda skatter som man bara kunnat finna av en slump kan man nu söka mera systematiskt.

Man kan till och med få höra ordens uttal - inläsningen är gjord av Jörgen Cederberg.

NEO bygger på den lexikaliska databasen hos Språkdata i Göteborg, som tidigare har använts till flera projekt: Frekvensordboken, Baklängesordboken, Svensk Ordbok. Många texter i NEO är faktiskt identiska med motsvarande i Svensk Ordbok. Så om man nu redan har den, vad får man mer i NEO?

Grovt räknat är NEO dubbelt så stor. Förutom Göteborgsmaterialet, som till stor del utgörs av tidningstext, bygger den också på Nationalencyklopedins mer avancerade textmassa. NEO berättar också lite om ordens historia, var de kommer från och när man hittat det första belägget i svenska texter.

Tyvärr finns dock inga beläggande citat, såsom är brukligt i större verk som Akademiens ordbok eller Oxford English Dictionary. Men både NEO och Svensk Ordbok har synonymer, NEO ibland också motsatsord. Under ordet barn står exv. vuxen.

Både NEO och Svensk Ordbok redovisar ibland konstruktioner och fraser, men ganska sparsamt, så ingen av dem kan egentligen ersätta den nya version av Svensk handordbok som vi har väntat på några år nu.

Det intressantaste med elektroniska uppslagsverk brukar ju annars vara de snabba och flexibla sökmöjligheterna. Det gäller även NEO - men det finns invändningar. I svenskan bildar man som bekant lätt sammansatta ord, t.ex. riksdagsmannautskottssuppleantbostadsstäderskevikariebarnbarnsbyxor, som Falstaff, fakir skrev. Men inte ens alla mer hanterliga sammansättningar kan få rum i en ordbok. Urvalet måste bli strängt, väglett av representativitet, med tanke på dels ordfogning och böjning, dels hur vanligt förekommande ordet är. Här är det mycket bra att man kan söka med wildcards (jokertecken) i ordboken, för då kan man söka på exv. *yta och hitta alla sammansättningar med detta ord som slutled (bordsyta, vattenyta osv.).

Däremot kan man märkligt nog inte söka bara bland uppslagsorden - allt blir fritextsökning. Så min sökning efter *yta. blev oväntat imponerande, med 862 träffar. Men bara en bråkdel av dessa är uppslagsord där ordet yta ingår. Den överväldigande majoriteten av träffarna är helt andra uppslagsord, där någon "vattenyta" eller "anliggningsyta" står nämnd i den förklarande texten. Fritextsökning brukar vara en finess, men när bara finessen och inte grundfunktionen finns blir det konstigt.

Likaså kan man inte söka på flera ord tillsammans. Söker man på t.ex. "bestå av" får man träffar på alla "bestå" och alla "av" - i hela textmassan.

Allt det här är förstås irriterande. Om CD:n revideras, ska sökfunktionen göras om, säger man på förlaget Bra Böcker. Och en ny version är nödvändig, för detta är en allvarlig brist som begränsar värdet av ett annars oerhört bra utgångsmaterial.

Visst kan man göra intressanta sökningar ändå. Man kan exv. söka på ord, ordklass, ämnesområde, språk samt år för första belägg. Slår man t.ex. på "språk: singalesiska" finner man att orden anakaonda, beriberi och turmalin kommer därifrån.

Man kan kombinera sökningar, av till exempel ordklass och ämne. Söker man på "ordklass: förled" och "ämne: medicin" får man fyra träffar: kardio-, rödakors-, sanitets- och semin-. Kombinationen interjektioner inom medicinen hade ju varit fascinerande, men där blev träffarna noll. Däremot gav förstås kombinationen militärväsen och interjektioner resultatet halt, manöver, marsch, mittåt med mera.

Sökning på förkortningar och databehandling ger förvånande nog noll träffar, inom ett område där akronymerna är legio, men inte minsta DTP finns med, däremot det utskrivna uttrycket desktop publishing. Man kan ju annars tänka sig att just köparna av CD-versionen skulle vara lite extra intresserade av datatermers ortografi.

Det är inte lätt att hålla i huvudet vad olika beteckningar står för. Lånord betecknas till exempel med av; kommer ordet från flera språk, skriver man ur; översättningslån markeras med efter; mera diffus härledning markeras med till.

Det där bör man ju helst komma ihåg när man till exempel läser under ordet alienera: "efter eng. alienate [...], av lat. alienare, till alienus, 'annan tillhörig'; 'främmande'" Vad olika tecken och förkortningar betyder står i bokens förord, vilket ska finnas med också i CD-versionen som bilaga till den tryckta manualen. I mitt recensionsexemplar saknades dock denna.

NEO på CD är således en ordbok som kräver en hel del både av användarens förkunskaper om språk och ordböcker och av hans dators kapacitet (16 Mbyte RAM och Pentium eller PowerPC). Priset är 1950 kronor. Verkligt prisvärd - i ordets båda betydelser - kan den bli i nästa version.

Karl-Erik Tallmo




[Tillbaka till Artikelindex]
[Tillbaka till Karl-Erik Tallmos startsida]