You've found us in English! The English version of TechSavvy.media is currently only available in a beta version. This means, among other things, that the majority of articles are machine translated. We hope you'll still want to stick around a little longer

Alvenir: Forskning og open source kan godt forenes med et kommercielt startup

Stifterne af Alvenir (fra venstre): Martin Carsten Nielsen og Rasmus Arpe Fogh Egebæk. Danspeech-modellerne til talegenkendelse ligger tilgængeligt for alle som open source på udviklerportalerne GitHub og HuggingFace. DTU har dog rettighederne til den underliggende, modulære software, der også er skabt gennem forskningen, og som danner grundlag for spinoutet Alvenir.
@Redaktionen

Med forskning fra DTU har startuppet Alvenir bygget en skalarbar platform for talegenkendelse, som allerede er bedre til dansk end giganterne Google og Amazon. Målet er en stor forretning, men alligevel er sprogmodellerne bag stillet gratis til rådighed for andre gennem open source.

Med forskning fra DTU har startuppet Alvenir bygget en skalarbar platform for talegenkendelse, som allerede er bedre til dansk end giganterne Google og Amazon. Målet er en stor forretning, men alligevel er sprogmodellerne bag stillet gratis til rådighed for andre gennem open source.

Artiklen er udarbejdet i samarbejde med Digital Tech Summit. Læs mere om messen for startups og forskningsverdenen og tilmeld dig her.


Uanset om det er Siri, Google eller Alexa der assisterer dig digitalt, hører du sikkert ind imellem nogle sjove bud på, hvad det er assistenten mener, du har sagt.

Talegenkendelse er kompliceret, og det bugner ikke ligefrem med satsninger på et lille sprogområde som det danske. Derfor satte en gruppe forskere og specialestuderende på DTU sig for at forbedre dansk talegenkendelse med projektet ”Danspeech”, som startede i 2019.

”Danspeech er et open source-project som springer ud af mit og Rasmus Arpe Fogh Egebæks speciale. Det mundende ud i nogle modeller, og det er blevet en meget fin showcase på, hvordan deeptech kan flytte sig: Da vi gik i gang for tre år siden var vi meget i tvivl om, om man kunne konkurrere med de store, når man ikke havde store mængder data og en masse penge at kaste efter træning af modellerne. Men i dag er vores model bedre til dansk end Google,” siger Martin Carsten Nielsen.

Læs også: Forskning med startup-fart: Syncsense brugte universitetet til at kickstarte virksomheden

Da specialet var færdigt fik han egentlig et almindeligt job. Men så blev han hevet tilbage til DTU med et tilbud om at afsøge forretningspotentialet i den teknologi til talegenkendelse, som han havde været med til at udvikle. Og efter flere legater fra DTU og Innovationsfonden til at afsøge markedspotentialet og bygge softwaren, er han nu medstifter af startuppet Alvenir, som skal gøre talegenkendelsen mainstream på dansk.

Potentialet er i nichen

Med Danspeech har Alvenir fået en sprogmodel, som er bedre til dansk end de store techgiganter. Men samtidig er modellen udgivet som ’open source’ og derfor tilgængelig for alle – hvilket gør det til en mindre konkurrencefordel, end man måske skulle tro.

Til gengæld har stifterne af startuppet selv stået for forskningen bag sprogmodellerne. De kender den bedre end nogen anden, og det har gjort dem i stand til at bygge en platform omkring modellerne, som gør det hurtigt at målrette og træne talegenkendelsen til særlige nicher.

”Transskription i sig selv er sjældent super værdiskabende – det er analysen af transkriptionen til gengæld. Derfor bygger vi alt modulært, og over det seneste års tid har vi fået en fleksibel og skalerbar Machine Learning Operations-platform. Konceptet er sådan set, at vi kan specialisere sproggenkendelsen og drive analyse i forskellige domæner hurtigt og effektive – fx til sundhedsindustrien, finanssektoren osv.,” siger Martin Carsten Nielsen.

Læs også: Startuppet QuasiOS vil slå Microsoft: Bygger et nyt og sikrere styresystem for robotter

Selvom Alvenir nok kommer til at tilbyde simpel transkription i bred forstand, ser de det store forretningspotentiale i, at de nemt kan opdatere datagrundlaget og dermed træne talegenkendelsen til niche-formål – blandt andet finanssektoren.

Finanssektoren er nemlig stærkt reguleret og derfor også i høj grad afhængig af, at talegenkendelsen er rigtig, hvis den skal bruges til at effektivisere. Og her kan Alvenir altså med sin særlige platform træne modellerne til at blive super gode til ”finans-dansk”.

”Lige nu optager bankerne eksempelvis opkald fra mæglerne mellem hinanden. Det giver en enorm mængde lyddata, som vi kan tilføre en kæmpe værdi alene ved at få transskriberet den korrekt, så den er søgbar,” forklarer Martin Carsten Nielsen.

Open source understøtter forretningen

Fordi sprogmodellerne er udviklet med offentlige forskningsmidlerne, er det også helt naturligt, at de er gjort tilgængelige som open source. Men det glæder samtidig stifteren af Alvenir, for selv uden startuppet ville han have været en del af open source-bevægelsen indenfor talegenkendelsen:

”Det er jo også et statement. Vi synes, at de basale sprogmodeller skal være åbne, for vi kan måske godt holde på den i en periode, men på et tidspunkt kommer der bare nogle andre og åbner det. Det gavner os at være med i open source-communitiet – og så vil vi hellere konkurrere på andre parametre,” siger Martin Carsten Nielsen.

Læs også: Amunet Studio: Når studiepraktik bliver til startup

I det hele taget mener han da også, at DTU har en stor del af æren for, at startuppet Alvenir i dag eksisterer.

”I teorien kunne vi vel godt have udviklet det selv, men jeg tror, at en meget stor del af at lave deeptech er, at nogen stiller sikkerhed. Noget andet er, at vi grundlæggende startede med en fed teknologi til talegenkendelse – og ikke anede en skid om at lave forretning. Der er jo også en modningsproces i, at jeg overhovedet kan sidde her i dag og vide, hvad et product/market-fit er. Og den modning tror jeg ikke, var kommet uden DTU,” siger Martin Carsten Nielsen.


Fakta: Digital Tech Summit

  • Digital Tech Summit 2021 er Danmarks samlende udstillingsvindue for digitale teknologier og mødested for stærke forskningsmiljøer, teknologiførende virksomheder og ikke mindst startups.
  • Digital Tech Summit forventer deltagelse fra 5.000 besøgende, 1.000 virksomheder, 200 startups samt over 350 indlægsholdere fordelt på 80 konferencesessioner. Konferenceprogrammet for de faglige sessioner kan ses her.
  • Digital Tech Summit 2021 åbner dørene for publikum den 30. november og 1. december 2021 i Øksnehallen/DGI-Byen i København. For adgang kræves gyldigt coronapas.
    Partnerne bag Digital Tech Summit tæller Copenhagen Business School, Danmarks Tekniske Universitet, IT Universitetet, Københavns Universitet, Roskilde Universitet, Syddansk Universitet, Aalborg Universitet, Aarhus Universitet samt IT-Branchen og Teknologiens Mediehus.
  • Otto Mønsted Fonden og Otto Bruuns Fond er hovedsponsorer på Digital Tech Summit Startup Community og eventet er etableret som et samarbejde på tværs af universiteterne i samarbejde med bl.a. DIREC, Open Entrepreneurship samt en række impact fonde, herunder KRING.
  • TechSavvy.media er mediepartner på Digital Tech Summit og kommer til at sætte fokus på startups – blandt andet med et magasin på messen.

 

FLERE FRA COMMUNITY