Spring til indhold

Indsamling af biomedicinsk tekstkorpus

I dette projekt samarbejder vi med forskellige danske forlag og videnskabelige opslagsværker om indsamling af et dansk biomedicinsk korpus. Det indsamlede korpus kan bruges til udvikling af biomedicinske sprogmodeller og som evalueringsværktøj af disse.

Vi leder aktivt efter at udvide vores eksisterende korpus, og er meget interesseret i flere samarbejdspartnere. Kontakt Jannik Pedersen, jasp@mmmi.sdu.dk, hvis du ønsker at bidrage eller har spørgsmål til projektet.

Tak til vores samarbejdspartnere for deres uundværlige bidrag til dette projekt!

MeDa-BERT: A medical Danish pretrained transformer model. Jannik Skyttegaard Pedersen, Martin Sundahl Laursen, Pernille Just Vinholt, Thiusius Rajeeth Savarimuthu. NoDaLiDa 2023