Foto: Shutterstock / Ground Picture / Barnevakten. Bildet viser en elev som sitter i klasserommet og noterer med kulepenn. Han ser på en dataskjerm.

ChatGPT: Hvilke kilder bruker den kunstige intelligensen?

ChatGPT sprer seg til klasserom og folk flest nå i starten av 2023. Vi spurte den kunstige intelligensen hvilke kilder den bruker før den svarer på spørsmål og oppgaver den får.

Kunstig intelligens bygger på store mengder data, først og fremst ved gjennomlesing av enormt mange nettsider. Vi brukte ChatGPT til å fortelle om seg selv. Men siden svarene kommer fra den kunstige intelligensen, og ikke fra forskerne som utvikler den, så må du ikke sette to streker under svarene i denne artikkelen. Aller først litt info om ChatGPT:

Fakta om ChatGPT
  • Gratis kunstig intelligens som du kan bruke.
  • Kan svare på svimlende mange spørsmål.
  • Bygger sine svar ut fra ekstremt mange nettsider.
  • Bruken foregår som en samtale mellom deg og den kunstige intelligensen.
  • Dine spørsmål brukes til å gjøre tjenesten enda bedre.
  • Kan inneholde feil, farlige forslag og partiskhet (bias), det sier utviklerne.
  • Den dikter også innimellom opp «fakta», for eksempel forteller om bøker som slett ikke finnes.
  • Har lite kunnskap om hva som har skjedd i verden etter 2021.
  • Ble introdusert sent i 2022.
  • Fikk over en million brukere den første uken.
  • Har over 100 millioner brukere i mars 2023.
  • Den raskest voksende appen noensinne.
  • Utviklet av Openai som er en ikke-kommersiell forskningsorganisasjon.
  • Microsoft bidro med 10 milliarder dollar i oppstarten.
  • Er en konkurrent til Googles søketjeneste, for man slipper å lete etter beste søketreff som for øvrig kanskje kommer langt nedenfor annonsetreffene.
  • Selskaper kan mot betaling til Openai benytte ChatGPT som en del av sine egne tjenester utad.
  • Snapchat var tidlig ute med å tilby ChatGPT som en digital samtalevenn til brukerne.
  • Er et nyttig hjelpemiddel som kommer til å bli en del av hverdagen vår på samme måte som internett og søkemotorer. Kunstig intelligens og søkemotorer vil utfylle hverandre.
  • Kan være risikabel for barn som ikke er modne nok til å forstå de gangene den tar feil.
Oppdiktede kilder

Før vi går i gang med å lete etter hvilke kilder som ChatGPT benytter, må vi opplyse om at den noen ganger dikter opp kilder. En lærer skrev til oss at hun hadde testet ChatGPT som hadde svart med en henvisning til tre bøker, som ikke fantes. Både bøkene og forfatterne var diktet opp. Og da læreren spurte om utgiver, fikk hun navn på både forlag og årstall, men også det var diktet opp, siden bøkene ikke finnes. Læreren spurte til slutt om sammendrag, og da diktet ChatGPT til og med «innhold» i kapitlene. Vi har fortalt om lignende faktadikting i andre artikler om ChatGPT, se lenker nederst.

Kildene til ChatGPT

ChatGPT svarte oss at dens kunnskapsnivå går frem til september 2021. Men i et annet svar sa den at den fremdeles trenes i å lese nettsider. Det siste kan bety at den fortsatt trenes i å tolke de nettstedene som allerede er blitt lest frem til september 2021.

Den svarte også at den fortsetter å lære seg selv opp via de spørsmålene som brukerne stiller den.

Vi spurte ChatGPT hvilke nettsteder den har hentet sin informasjon fra. Det ble en del oppfølgingsspørsmål, og vi er ikke helt sikre på hva som er fasit her, men det virker som at den prioriterer:

  • offentlige nettsteder
  • akademiske kilder
  • nyhetsartikler
  • leksikon
  • andre pålitelige kilder

Den har hentet informasjon også fra:

  • blogger
  • sosiale medier som for eksempel Twitter-meldinger
  • e-bøker
  • videoer

Den har ikke hentet informasjon fra personlige meldinger eller kontoer som krever passord.

Nettsider fra mange land er med

ChatGPT har hentet informasjon fra nettsidene i mange land. «Ingen land er ekskludert,» sier den til oss. Vi spurte om noen konkrete land, som Kina, Nigeria og Norge, og den bekreftet at disse landene er med i grunnlaget som den setter sammen informasjon fra. Samtidig viste den en viss skepsis til kinesiske og nigerianske nettsider. Kinesiske sider kan være sensurert av myndighetene og «Nigeria har lenge vært assosiert med svindel og bedrageri på nettet».

Pålitelige nettsider prioriteres

Vi spurte så hvordan den prioriterer mellom to nettsider som påstår det motsatte av hverandre. Den svarte at den vil prioritere den nettsiden som er mest kjent for å være pålitelig. Den vil også sjekke konteksten. Hvis ChatGPT er usikker, vil den presentere begge synspunktene.

Men hvordan vet den hva som er en pålitelig kilde?

Det virker som at den anser disse som pålitelige kilder:

  • akademiske institusjoner
  • regjeringer
  • anerkjente nyhetsmedier
  • ekspertise innenfor et bestemt fagområde
  • nettsider som har en god kvalitetskontrollprosess, for eksempel nettsider som har en redaksjonell prosess
  • nettsider som gir en balansert og upartisk presentasjon av informasjon

Også forfatterens pålitelighet, samt i hvilken grad nettsiden har et profesjonelt og ryddig design, teller med.

Vi spurte om den er programmert til at nettsider med .edu- eller .gov-domener anses som mer pålitelige enn .com-domener. Men det svarte den nei til. Men i et nytt spørsmål svarte den at den er programmert til å evaluere slike forhold. Man må være presis i spørsmålsstillingen i samtalen med ChatGPT, du kan få ulike svar hvis du endrer spørsmålet noe.

Med tiden kan vi forhåpentlig få mer presis informasjon om hvordan den enkelte kunstige intelligensen er skrudd sammen. Foreløpig er kunstig intelligens på dette nivået i offentligheten såpass nytt at vi er neppe alene om å forsøke å forstå hvordan slike programmer er kodet. Hva har mennesker kodet inn og hva er basert på at programmet lærer seg selv opp?

Når vi stiller ChatGPT spørsmål om hvordan den er programmert, er det heller ikke lett å vite om den faktisk svarer på spørsmålet eller om den bare kommer med generelle betraktninger.

Men i et svar hevder den at for å sjekke påliteligheten til en nettside sjekker den om nettsiden har kildehenvisninger. Deretter sjekker den kildehenvisningene. Det holder altså ikke at en tekst er utstyrt med svada som omtales som «kilder». ChatGPT vil sjekke disse kildene. Den sjekker for eksempel om kilden er autentisk og om kilden har «en pålitelig historie med å produsere nøyaktig og objektiv informasjon».

ChatGPT undersøker også om informasjonen på nettsiden er i tråd med andre uavhengige kilder, og om den er støttet av bevis eller data.

ChatGPT hevder også at den forsøker å finne ut om kilden har noen skjulte agendaer. Hvis programmet faktisk klarer å avsløre slikt, da er det virkelig imponerende.

Den sjekker også om det er andre tegn til pålitelighet, slik som forskning eller om forfatteren har rykte som pålitelig eller er en autoritet på området.

Vi spurte om den setter vekttall på ulike nettsider for å rangere pålitelighet, men da svarte den nei.

ChatGPT vurderer også om organisasjonen som står bak nettsiden er pålitelig.

Fra arbeid med søkemotoroptimalisering kjenner Barnevakten til at Google rangerer nettsider blant annet ved å forsøke å finne ut hvilke nettsteder som er «viktige». Et tegn på å være viktig, er at det er mange store aktører som lenker til nettstedet. Hvis for eksempel VG, som er en stor aktør, skriver om Barnevakten og lenker til oss, vil vi bli ansett som litt mer viktig i Googles rangering. Man kan anta at ChatGPT bruker lignende grep for å rangere pålitelighet. Dersom flere pålitelige nettsider lenker til en ny nettside, vil antagelig noe av påliteligheten smitte over på den nye nettsiden, i øynene til ChatGPT.

ChatGPT forteller oss at også datoen til en nettside er med på å vurdere hvor pålitelig den er. Er nettsiden fersk, gir det et pluss  i store regnestykket som avgjør pålitelighet. Men hva menes med fersk når ChatGPT sluttet å lese i 2021? Eller leser den enkelte sider fremdeles?

Så klarte vi ikke å la være; vi spurte ChatGPT om den anser Barnevakten som en pålitelig kilde. Den svarte at vi har godt omdømme og er anerkjent, og er en organisasjon med et bredt spekter av kunnskap og ekspertise på feltet trygg og ansvarlig bruk av digitale medier blant barn og unge. «Informasjon og veiledning fra organisasjonen kan derfor være en verdifull og pålitelig kilde for foreldre og andre som ønsker råd og veiledning om dette temaet.»

Takk for det, ChatGPT, vi sender deg en digital sjokolade som en oppmuntring, du har det sikkert veldig travelt nå for tiden.

(Hovedbilde øverst Foto: Shutterstock / Ground Picture / Barnevakten.)

Artikkelen ble publisert 13. mars 2023 og er blitt oppdatert senere.

Les mer om kunstig intelligens: