Ett spännande projekt är på gång! Det är ett samarbete mellan vår finlandssvenska dialektordbok, alltså Ordbok över Finlands svenska folkmål och Svenska litteratursällskapet i Finland (SLS), samt Projekt Fredrika som på uppdrag av oss arbetar med att lägga in material från ordboken i Wikidata.
AI behöver riktig kunskap
Projekt Fredrika har som målsättning att det svenska Finland ska finnas på Wikipedia och göras synligt. Det har på sikt stor betydelse att det finns svenskt material från Finland på Wikipedia eftersom Wikipedia inte bara används som uppslagsverk utan också till exempel av generativ AI (Gen AI, till exempel programmet Chat GPT). Ju mer info på svenska och om svenska som finns där, desto kunnigare om det svenska blir den artificiella intelligensen. Och det är förstås viktigt att kunskapen är riktig.
Nu matas alltså material från dialektordboken in i Wikidata (som ligger i bakgrunden för Wikipedia). Det innebär att svenska dialekter i Finland kan komma med på ett hörn i den vokabulär som används av internationella IT-bolag (Google, Amazon, Facebook, Apple osv.) men också modeller för artificiell intelligens. Och vi vill inte att vokabulären bara finns på engelska, eller på de så kallade stora språken. Lite skämtsamt har vi talat om att Chat GPT också ska kunna fungera på Nagu- eller Pyttisdialekt. Det som inte AI känner till riskerar bli bortglömt i framtiden.
Ett samarbete
Språkinstitutet bidrar med ordboksmaterialet och konsulteringshjälp, och Projekt Fredrika gör själva jobbet med inmatningen. Men utan Svenska litteratursällskapet skulle inget gå att genomföra, för de bidrar med finansieringen. Och orsaken till det är att även SLS ser fördelarna med att integrera våra dialekter i den enorma datapool som finns i botten för generativ AI. SLS och Projekt Fredrika har också lagt in ljudprov ur intervjuer med både yngre och äldre talare från olika orter i Svenskfinland på Wikimedia commons.
Dialekterna bevaras
Men när blir det möjligt för Pyttisborna att kommunicera med Chat GPT på sitt modersmål?
Jag tror tyvärr att de får vänta en längre tid på det. Men det här är en god början. Snart kommer det att finnas dialektord som Gen AI kan använda. Så småningom kan materialet utvidgas, och ju mer som gjorts, desto mer kan göras automatiskt eftersom maskinerna då lärs upp hur de ska göra. Det är ju det som artificiell intelligens går ut på i grunden.
Detta projekt bidrar framför allt till att våra dialekter inte lika lätt blir bortglömda, som de nog annars skulle bli i den blixtsnabba tekniska utvecklingsfas som vi just nu befinner oss i. Och vi på Språkinstitutet är oerhört stolta över att på detta sätt kunna bidra till att bevara det kulturarv som de svenska dialekterna i Finland är!