Ordklasstaggning

SUC-taggarna finns i labbinstruktionen men är även tillgänglig här

Några exempelmeningar:

0 / 250

Redo.

Tokenisering

Moderna språkmodeller använder sig framförallt av kompressionsalgoritmer snarare än ord/morfem-indelning. Pröva morfemindela några ord, och se hur det skiljer sig från hur några språkmodeller skulle dela upp texten innan det processas genom nätverket.

0 / 90

Redo.

Sekvensanalys

Här kan du skriva in text i textlådan nedanför, och få en token-för-token analys över den texten. Pröva skriv in en mening och klicka på analysera. Klicka sen på varje tokenposition för att se vad det mest sannolika token är för den valda positionen.

Log-sannolikhet: Log-sannolikhet är ett sätt att skriva sannolikheter så att de blir lättare att räkna med i datorer då sannolikheterna annars blir oerhört små. Ju mer negativt talet är, desto mindre sannolikhet.

0 / 250

Redo.

Token Sannolikhet

Textgenerering

Här kan du leka med hur en generativ språkmodell genererar text, ett token i taget. Pröva att skriva in början till en mening som du vill att modellen ska fortsätta och klicka sen i listan av tokens!

Redo. 0 / 150
Temperatur
0
Kallt Varmt

Nästa token Sannolikhet - klicka för att välja