This post is also available in: English
Siden september 2021 har professor i litteraturhistorie Mads Rosendahl Thomsen sammen med fem forskerkolleger arbejdet på Fabula-NET-projektet, der er et tværfagligt samarbejde mellem litteraturforskning, lingvistik og informatik. Efter tre års indsats har teamet udviklet en teknologi, der kan vurdere, om et ukendt værk har en særlig litterær kvalitet.
”Det havde været håbløst for os som mennesker at læse og vurdere de 9.000 værker, som vi har haft med i projektet. Vi har benyttet maskinlæring – eller kunstig intelligens – til at øge vores forståelse af forskellige former for litterær kvalitet. De mange typer af data og muligheden for at træne et system til at forudsige, hvad der vil være succesfuldt, gør, at vi nu kan se det litterære landskab mere klart,” siger Mads Rosendahl Thomsen, professor i litteraturhistorie ved Institut for Kommunikation og Kultur og leder af Center for Language Generation and AI (CLAI) på Aarhus Universitet i en pressemeddelelse.
Vil skabe dybere forståelse af litteratur og kvalitet
Projektets mål er at skabe en dybere forståelse af litterær kvalitet og udvikle et mere kvalificeret system til vurdering af litterære værker, som kan komme forlæggere, forfattere, bibliotekarer og forskere til gavn.
Læs også: Alle fakulteter på Aarhus Universitet får sin egen innovatør – TechSavvy
”Vi kan se sammenhæng mellem folks præferencer for litteratur og de indre egenskaber, som litteraturen har. Vi betragter det som humanistisk grundforskning. Vi kan kigge bagud og bedre forstå, hvordan litteraturhistorien hænger sammen, og vi kan se, om et værk er blevet uretfærdigt overset. Vi kan også kigge fremad og blive klogere på, hvorfor et værk besidder en særlig litterær kvalitet. Det er vigtigt at have et begreb om,” siger Mads Rosendahl Thomsen.
Forskerne har ambitioner om at gøre teknologien tilgængelig for alle og planlægger at udvikle et dashboard, hvor brugere kan uploade deres tekster.
”Vi har fundet ud af, at læsere reagerer negativt, hvis et værk er for tilfældigt eller for forudsigeligt opbygget. Ved at fokusere på de emotionelle perspektiver i de enkelte ord, en såkaldt sentimentsanalyse, kan vi gå videre og beregne, hvor forudsigeligt et narrativ er,” siger Mads Rosendahl Thomsen.
Redaktører får dermed mulighed for at identificere manuskripter med potentiale, mens forfattere kan evaluere og forbedre deres tekster. Samtidig kan forskere analysere store tekstsamlinger fra verdenslitteraturen på et mere avanceret niveau.
Forskergruppen planlægger at afslutte Fabula-NET-projektet i juni 2025. Projektet er finansieret med 5,3 millioner kroner fra VELUX FONDENs kernegruppeprogram.
Sådan virker Fabula-NET: Fodrer teknologien med succesparametre
Forskerne har blandt andet benyttet det såkaldte Chicago-korpus, som består af over 9.000 værker udgivet i USA mellem 1880 og 2000.
De har dermed fodret teknologien med højkvalitetsfiktion af prisvindende forfattere, heriblandt vinder af Nobelprisen i litteratur Toni Morrison og vinder af den amerikanske National Book Awards Don DeLillo, men også med mainstreamlitteratur af Agatha Christie og betydningsfulde værker inden for såkaldt genrelitteratur af bl.a. J.R.R. Tolkien.
Forskerne har dernæst arbejdet med tre succesparametre for et værk.
Den intrinsiske succesparameter kigger på et værks indre struktur såsom læsbarhed eller stilistiske kendetegn. Det kan afsløre, hvordan et værk, som enten er tilfældigt eller forudsigeligt opbygget, påvirker læseren.
Det ekstrinsiske succesparameter evaluerer, hvor ofte biblioteker låner et værk ud, hvor mange eksemplarer butikker sælger, eller hvor positive anmeldere ser på et værk.
Det præferentielle succesparameter undersøger, om et værk appellerer bedre til for eksempel mænd eller kvinder eller unge eller ældre, og om et værk vinder større indpas hos målgrupperne, alt efter om de kommer fra land eller by.