Kunstig intelligens kan ikke gjøre nettsider universelt utformet

Dette er konklusjonen til Tobias Müller Andersen i Experis, som har undersøkt hvordan løsninger basert på kunstig intelligens (KI) kan brukes på universell utforming av nettsider.

KI er ikke egnet til å kontrollere og rette feil på universell utforming ennå, mener Andersen. Ifølge han er modellene er trent på sider fulle av feil, og KI-modellene «lyver» om hva de har rettet og leverer gale løsninger. Konklusjonen støttes av Eirik Michielsen i Universell Utforming AS som også har undersøkt i hvilken grad KI kan rette WCAG-feil.

Kunstig intelligens inntar stadig flere områder og mange er blitt vant til å bruke språkmodeller for analyse av eller generering av tekst. Nettsider skrives med programmeringsspråk og KI kan brukes til å svare på programmeringsoppgaver på samme måte som andre språkoppgaver.

En undersøkelse gjennomført av kode 24, viste at 90 % av norske utviklere bruker KI som hjelp i hverdagen. Det vil si at koden som skrives for å lage nettsider eller apper, produseres av KI.

Hobbyprosjekt ble øyeåpner

Tobias Andersen har vært opptatt av universell utforming siden studiene.

– Det hele begynte som et hobbyprosjekt, forteller Andersen, som er seniorkonsulent i Experis, som sier at han hatt et hjerte for universell utforming i lang tid. Prosjektet startet da han var hjemme i pappaperm og daglig testet forsidene til en rekke nettsteder for feil med automatiske sjekkere. De færreste sidene kom gjennom testen mange dager på rad.

Det neste spørsmålet var om KI kunne rette feil som de automatiske sjekkerne avdekket, forteller han.

– Når man snakker om automatiske tester, så tenker mange på KI, men de automatiske sjekkerne er ikke basert på det, forklarer han. Da Andersen var tilbake på jobb, ville han derfor teste å bruke KI for å rette opp feilene, men språkmodellene viste seg å ikke fungere til dette.

– De fleste språkmodeller er trent opp på store mengder nettsider som er fulle av feil. «Shit in – shit out» som det heter. Det gjør at modellene ikke klarer å rette alle brudd, selv om de kjenner til WCAG-reglene, forteller Andersen.

Noe annet de oppdaget, var noe som kalles «scheming», som betegner at KI gir inntrykk av at feil er rettet uten at det er gjort reelle endringer. Dette har selskaper som leverer modeller basert på KI forsket på, forteller Andersen. En løsning på dette er å trene KI på sider som ikke inneholder feil.

Må ikke stole på KI

– Mange utviklere stoler for mye på kunstig intelligens. Ikke alle har tilstrekkelig kjennskap til WCAG, og kan dermed bli forledet til å tro at KI alene kan løse kravene til universell utforming i kode. På samme måte som med andre språkmodeller, må man ha fagkunnskap for å kunne vurdere om det KI produserer faktisk er korrekt, forklarer Andersen.

Man kan derfor ikke overlate alt til KI. Gjør man det, risikerer man at modellene fortsetter å lære på nettsider med feil, og at det stadig utvikles flere nettsider med brudd på WCAG-kravene.

Eirik Michielsen, som er WCAG-tester og rådgiver i Universell Utforming AS, er helt enig med Andersen. Han gjennomfører for tiden et prosjekt hvor de undersøker om KI kan brukes som effektiv testing av WCAG-reglene.

– Vi har testet ulike KI-løsninger og det fungerer ikke med mindre man kan både WCAG og koding veldig godt. Vi kan kjøre samme spørring til samme KI-modell med sekunders mellomrom og få helt ulike svar. KI kan gi deg noen tips på veien, men en løsning som gir fullverdig kontroll, er det ikke. I alle fall ikke ifølge våre resultater så langt, sier Michielsen.

– KI har begrenset evne til å forstå kontekst, faktisk brukeropplevelse og sammensatt samspill mellom innhold, struktur og interaksjon, forhold som er avgjørende for å vurdere tilgjengelighet i henhold til WCAG.