Hvad ervores forudsigelse baseret på?

Forudsigelsesresultatet er en score mellem 0 og 1, der tilskrives hver elev i dashboardet. Jo højere score er på 1, jo mere sandsynligt er det, at der er noget der er værd at undersøge. Det er beregnet ved hjælp af Turnitin's forudsigelsesalgoritme, som bruger Natural Language Processing (NLP) metoder.

NLP er et underfelt af kunstig intelligens, der er fokuseret på at gøre det muligt for computere at forstå og behandle menneskelige sprog, for at få computere tættere på en menneskelig forståelse af sproget.

Så hvordan virker det?

Vi gav algoritmen et stort datasæt af dokumenter, som vi ved er blevet købt online og instruerede den til at analysere hundredvis af sproglige funktioner. Dette træner algoritmen til at lære, hvad man skal kigge efter i et dokument.

Disse sproglige træk er ofte for komplekse til at præsentere som værdifulde data. Af denne grund kombinerer vi dem til en score, som vi kan tilskrive en studerende. Denne score er et reelt tal og let at forstå.

Er det korrekt?

https://www.tandfonline.com/doi/abs/10.1080/02602938.2019.1662884

Vores nøjagtighedsmål var baseret på forskning foretaget af Deakin Universityom, hvor godt markører identificerer kontraktsnyd, når de bliver instrueret i at holde udkig efter det. I denne undersøgelse nåede de en 62% følsomhed i at identificere kontraktsnyd. Vores algoritme er indstillet til at have samme følsomhedsniveau (registreringsrate) med at identificere forskellige forfattere baseret på vores validering af forudsigelsesalgoritmer.

Jo mere du og andre institutioner bruger Forfatterskab for Efterforskere, jo bedre vil forudsigelsesmodellen blive.

Vi hævder aldrig, at en studerende har begået kontraktsnyd, vi kan blot anbefale yderligere undersøgelse. Det er op til Efterforskeren at afgøre, om der er nok beviser til at fremlægge en anklage om kontraktsnyd.