Mina första steg som ordboksredaktör tog jag för exakt 20 år sedan. Jag hade då ett drygt ettårigt vikariat som redaktör för Ordbok över Finlands svenska folkmål. Här öppnades en värld för mig där röster ur arkiven blandades med rutinartade arbetsuppgifter som att kontrollera att alla uppgifter från uttal till böjning och betydelser gavs i rätt geografisk ordningsföljd i varje ordboksartikel. Uppgiften gjordes med papper och penna och det blev otaliga resor genom Svenskfinland när jag för att komma ihåg ordningsföljden knöt an till egna minnen av vägsträckorna. Från Öja via Larsmo till Pedersöre över Sju broars väg. Paddlandes ner för Tjöckån från Närpes till Tjöck. Med cykel över fasta Åland med start vid posthuset i Eckerö. Med motorbåt från Finby till Bromarv med stuggrannen Ragnar som skeppare. Längst i öster fick jag ta till fantasins hjälp, för så långt österut som till Pyttis hade jag aldrig varit.
Min huvuduppgift under vikariatet bestod ändå i att hjälpa till med att föra in ordboken i en ny tidsålder med redigering i XML (eXtensible Markup Language) i stället för det förlegade WordPerfect-format som hade använts under det senaste årtiondet, men som höll på att bli ett problem eftersom de flesta tryckerier inte längre kunde handskas med det.
Lexikografins rötter går tusentals år tillbaka i tiden och under de senaste århundradena har det självklara formatet varit tryck på papper. Ännu för 20 år sedan kändes det också självklart att de planerade sju banden av dialektordboken, av vilka tre redan var publicerade, skulle publiceras som tryckta böcker. Som så många andra stora pågående ordboksprojekt blev projektet ändå omkört av den digitala utvecklingen.
Nya förutsättningar
När jag ifjol återvände som redaktör till ordboken var mycket sig likt. Registret med sina omkring en miljon alfabetiskt ordnade ordsedlar stod i samma specialdesignade arkivmöbler med samma färgmarkeringar på lådorna: vitt (=publicerat), rött (=bearbetat) och grönt (=orört). Andelen lådor markerade med vitt hade givetvis vuxit avsevärt. Också redaktionen var sig till stor del lik, också den med en något större andel vitt, i frisyrerna.

Men mycket var också annorlunda. Efter det fjärde tryckta bandet, som jag hade varit med och gjort kontrolläsningar av, hade man upphört med publicering i tryck och gått över till att ge ut ordboken som nätordbok. XML-strukturen som jag hade varit med om att skapa en första version av kunde jag fortfarande känna igen grunddragen av, men den hade utvidgats och preciserats för att uppfylla nätordbokens krav. Kontrollen av att alla geografiska uppgifter är placerade i rätt ordningsföljd tog numera självklart datorerna hand om.
Övergången till publicering på nätet var i första hand en kostnadsfråga – tryckkostnaderna hade blivit allt för höga. Omvandlingen från tryckt ordbok till nätordbok hade ändå under åren tagit mycket tid och resurser i anspråk av redaktionen och av IT-experterna. Det är nämligen ingen trivial uppgift att byta distributionsmedium för en ordbok. Manus till de första banden var handskrivna med blyertspenna på A5-pappersark och satta på tryckeri. Det gällde att skanna in ordbokssidorna, använda optisk teckenigenkänning och förse den inskannade texten med XML-taggning; arbetsmoment där automatisering inte fungerar felfritt och där resultatet behöver kontrolleras och korrigeras i flera steg. För de band som var skrivna på dator var läget något bättre, men även där krävdes mycket arbete.
Många fördelar med nätordboken
Den digitala utvecklingen har gått så fort att många ordboksprojekt har haft svårt att hänga med. Knappt hade nätordböckerna slagit igenom på bred front innan användningen flyttade från stora datorskärmar till små mobilskärmar, vilket ställde nya krav på teknik och layout. I ordboksredaktionerna behöver man ständigt balansera mellan att lägga resurser på att producera innehåll, dvs. nya ordboksartiklar, och att anpassa distributionsformatet till de senaste teknikutvecklingarna.
För att slå upp i något av de tjocka banden var de flesta användare tidigare tvungna att ta sig till ett välsorterat bibliotek. Nuförtiden har nära nog alla användare hela ordboken bokstavligt talat på en armlängds avstånd.
Nätordboksformatet har ändå många fördelar. En specialordbok som Ordbok över Finlands svenska folkmål är inget alla har stående hemma i bokhyllan. För att slå upp i något av de tjocka banden var de flesta användare tidigare tvungna att ta sig till ett välsorterat bibliotek. Nuförtiden har nära nog alla användare hela ordboken bokstavligt talat på en armlängds avstånd.
I nätordboken behöver man inte heller tänka på att spara utrymme, vilket ger nya möjligheter att hjälpa läsaren. Betydelsebeskrivningen ”kort åksläde vanl. med böjd framgavel” berättar vad en kibitka(du flyttar till en annan tjänst) är för något, men en bild på släden gör nog begreppet betydligt mer konkret för läsaren.
Ytterligare en fördel med nätordboken är att inte bara ordboken finns närmare användarna utan att också användarna finns närmare ordboksredaktörerna. Digitala ordböcker samlar i regel anonyma data över ordbokens användning, vilket gör att redaktörerna får information om vilka artiklar som är oftast lästa och hur användarna hittar fram till ordboksartiklarna. På så sätt går det att anpassa sökgränssnitten efter användarnas behov.
Utöver att på traditionellt vis leta bland ordbokens alfabetiskt ordnade uppslagsord erbjuder digitala ordböcker ofta avancerade sökmöjligheter, som att söka på uttal eller bland ord i betydelsebeskrivningarna. Erfarenheterna har ändå visat att det bara är en liten bråkdel av användarna som tar sig tid på att lära sig använda sådana sökfunktioner.
AI i ordboksanvändarens tjänst
Samtidigt som många ordböcker ännu inte har hunnit bli fullt anpassade till nätordboksformatet är nästa digitala revolution redan i full gång. I ordboksredaktioner världen över funderar man på hur man kan dra nytta av stora språkmodeller och generativ AI.
I arbetet med att skriva nya artiklar för den finlandssvenska dialektordboken ser jag inte att maskinerna kommer att kunna ersätta människorna inom en nära framtid. Dels krävs källkritik och specialkunskap på en nivå som de stora språkmodellerna inte har tillräckligt med träningsmaterial för, dels ställs rena tekniska hinder i form av att en stor del av dialektmaterialet är skriven med det svenska landsmålsalfabetet, som än så länge saknar digital standard och därmed inte är maskinläsbart.
Däremot skulle AI kunna användas för att göra ordboken mer tillgänglig för användarna. En skräddarsydd chattbot, låt oss kalla den ordbot, som utnyttjar stora språkmodeller och samtidigt med s.k. RAG-teknik (Retrieval-Augmented Generation) hämtar svaren direkt ur dialektordboken, skulle kunna befria användaren från att lära sig fylla i avancerade sökformulär. Användaren skulle i naturlig samtalston kunna ställa en fråga som ”Vad betyder föus?” och av ordbotten bli hänvisad till artikeln fähus(du flyttar till en annan tjänst).
De stora språkmodellerna är dessutom experter på synonymer. Nätordbokens avancerade sökning erbjuder visserligen möjligheten att söka bland betydelsebeskrivningar, men fungerar bara så länge den som söker använder precis samma ord som använts av redaktörerna. Om en ordbot får frågan ”Vilka ord används i dialekterna om ladugård?” skulle den kunna ge en lista med ord som fägård(du flyttar till en annan tjänst), kohus(du flyttar till en annan tjänst) och nöthus(du flyttar till en annan tjänst), trots att det inte alls står ”ladugård” i betydelsebeskrivningen utan till exempel ”fähus” eller ”hus för boskapen”.
Men den tekniska utvecklingen har inte stannat av och innan ordbotten sett dagens ljus har kanske helt nya förväntningar på ordboken väckts.