Lenge til norsk kunstig intelligens i skolene

Norske skoler har begynt å gi elevene tilgang utenlandsk kunstig intelligens – som snakker norsk. Det er et godt stykke igjen før en innfødt norsk KI kan tilbys elevene.

Nora er et norsk forskningsinitiativ om kunstig intelligens (KI). Forskerne får tekster fra blant annet Nasjonalbiblioteket og lar Europas kraftigste datamaskin (LUMI) lære seg opp på tekstene. Datamaskinen er den femte sterkeste i verden. Dette arbeidet skal bli til norske kunstige intelligenser som vi alle kan få nytte av.

Barnevakten gjestet et informasjonsmøte om KI, i regi av Nora (bildet over) i midten av april 2024. Forskerne startet med å vise at ChatGPT hallusinerer frem falske fakta. Det at ChatGPT finner på «fakta» har vært kjent lenge, men når man åpner et foredrag med å vise eksempler på feil, uttrykker man samtidig en edruelig holdning til kunstig intelligens. KI er som en ny industriell revolusjon som vil forandre verden, men den er altså fremdeles umoden.

Med KI i denne artikken menes generativ KI, det er KI som bygger på enorme mengder med tekster og som ikke er spesialisert for smale oppgaver som for eksempel å sjekke røntgenbilder.

KI-er har ulik kultur innbakt

Den mest kjente KI-en i verden per nå, er antagelig ChatGPT fra OpenAI som er sterkt støttet av Microsoft som holder til i California. Forskerne poengterte at KI-er «fra vestkysten av USA» inneholder kultur fra nettopp vestkysten av USA, og at det er viktig at vi i Norge får KI-er som bygger på norske tekster. Ikke minst for at vi selv skal kunne styre utviklingen av norsk språk.

Kan ta flere år før en norsk skole-KI er på plass

Det finnes allerede tre KI-er utviklet av norske forskere ved UiO i samarbeid med Sigma2 og Nasjonalbiblioteket. To av modellene er trent fra bunnen av på norsk.

Disse KI-ene er ennå ikke utstyrt med «skikk og bruk» fra forskerne, KI-ene har heller ikke noe chatbot-grensesnitt. Så det er et stykke igjen før skoleelever kan få boltre seg i norske KI-er.

Foto: Barnevakten

Erik Velldal (bildet over) er professor ved Institutt for informatikk, han sier til Barnevakten at en norsk skole-KI ikke vil være på plass om noen måneder, men at det forhåpentligvis ikke vil ta flere år.

Han forklarer at store norske språkmodeller har gått gjennom såkalt grunntrening og at det er flere steg som gjenstår før de vil fungere trygt og godt som samtalepartner og åpen dialog.

Det som gjenstår er instruksjonstrening og preferansetrening. Problemet er at forskerne per i dag mangler storskala datasett av høy kvalitet for å gjøre denne type trening for norsk. Men får forskerne større budsjetter, kan det la seg løse.

Trenes på norske tekster

Treningsdata for norske KI-er i offentlig regi kommer fra blant annet Nasjonalbiblioteket. Men selv om alle norske forfattere, bedrifter, privatpersoner og aviser er pliktige til å sende alle sine offentliggjorte tekster dit hvert eneste år, så kan ikke en norsk KI trene seg opp på alt som ligger der, fordi opphavspersonene har rettigheter.

Svein Arne Brygfjeld fra Nasjonalbiblioteket sa på informasjonsmøtet at i Norge har vi tradisjon for kollektive avtaler, så man regner med å finne en løsning slik at norske KI-er skal kunne bruke også en del av tekstene som det er opphavsrett på. Hvis du vil sjekke hvilke tekster som så langt benyttes av den norske KI-treningen, kan du se her.

Mer KI-åpenhet i Norge

Inntrykket er at vi i Norge er mer opptatt av redelighet og åpenhet enn i USA hvor utviklere har brukt tekster uten å spørre opphavspersonene. Et eksempel er at avisen New York Times i desember 2023 gikk til søksmål mot OpenAI. 

Det viser seg at ChatGPT ikke bare har lest enorme tekstmengder fra avisen, men har også tatt kopi av tekstene. Bildet under er hentet fra søksmålet, rød tekst er identisk mellom artikkelen fra avisen og hva ChatGPT leverer ut.

På nettstedet Titan sier Erik Velldal at det er problematisk at ChatGPT ikke er åpen om hvilke tekster den er trent på.

Norske forskere satser derimot på mer åpenhet. Velldal sier også at det er viktig at vi har norske løsninger som er trygge dersom man for eksempel jobber med helsedata.

Det virker altså som at det er to ulike syn på kunstig intelligens i Norge. Skolene, og andre steder i offentlig sektor, sier «kjør på» til KI fra California. Forskerne peker derimot litt oftere på det problematiske ved utenlandske KI-er og arbeider for å lage norske løsninger.

Barn ble ikke nevnt

Barnevakten er opptatt av at barn og tenåringer skal benytte digitale medier trygt og bevisst. Dessverre kan de utenlandske KI-ene anbefale både hjemmebrent og farlige aktiviteter, derfor er det nødvendig å utstyre KI-ene med barnefilter som kommer i tillegg til «bombefilter» og «etisk filter».

Barn ble ikke nevnt på informasjonsmøtet til Nora, det er naturlig at barn ikke ble nevnt siden arbeidet er i en så tidlig fase.

Men skulle noen av de norske språkmodellforskerne lese denne artikkelen, så lyder altså oppfordringen: Husk barnefilter.

Fordele KI-oppgaver mellom staten og private aktører

Også medieselskapet Schibsted deltok i informasjonsmøtet. I en panelsamtale ble det diskutert hvor KI-oppgavene til Staten bør slutte og hvor private bedrifter bør overta.

Når norske KI-er etter hvert blir klare, er det Barnevaktens oppfordring at aktørene må bli enige om hvem som skal lage barnefilter. Er det ikke kommersiell interesse, bør Staten trå til.

I panelsamtalen drøftet man et mulig nordisk samarbeid og at det er behov for et nasjonalt senter for KI som kan overta etter at forskerne har dratt i gang utviklingen av norsk KI de siste årene.

Forskningsmiljøene i Norge er små. Kanskje kan man i Norden samarbeide om et felles barnefilter?

Begge bildene  er fra et av informasjonmøtene i Domus Bibliotheca i Oslo om norsk kunstig intelligens, i regi av Nora.

(Foto: Sjur Jansen / Barnevakten.)