Schneller Einblick in aktuelle Forschungsergebnisse Studierende entwickeln Plattform, die Corona-Publikationen besser durchsuchbar macht
Seit Beginn der Corona-Pandemie sind Tausende wissenschaftliche Forschungsartikel zu den Themen Sars-CoV-2 und Covid-19 erschienen, viele davon als Vorveröffentlichungen. Einen Überblick darüber zu behalten, ist schwierig. Mit „Collabovid“ haben Studenten der Technischen Universität Braunschweig und der Technischen Universität Berlin eine Plattform entwickelt, die dabei helfen soll, die Vielzahl an Veröffentlichungen besser durchsuchen zu können. Dabei setzen sie auf Künstliche Intelligenz. Das Projekt wird jetzt im Rahmen der Fördermaßnahme „Prototype Fund“ des Bundesministeriums für Bildung und Forschung als eines von 34 Hackathon-Projekten gefördert. Für die Förderung der Projekte stehen insgesamt rund 1,5 Millionen Euro zur Verfügung.
Gemeinsam haben fünf Informatik-Studenten der TU Braunschweig und der TU Berlin „Collabovid“ entwickelt. Die Plattform soll Forscherinnen und Forschern, Wissenschaftsjournalistinnen und –journalisten und Interessierten helfen, einen besseren Überblick über neu erschienene Corona-Preprints und Publikationen zu erhalten. Dafür sammelt die Plattform Vorveröffentlichungen von verschiedenen Preprintservern sowie in Fachzeitschriften veröffentlichte Publikationen und macht sie leichter sortier- und durchsuchbar.
„Auf Collabovid sind alle Veröffentlichungen zu den Themen SARS-CoV-2 und Covid-19 zu finden, die auf den Servern bioRxiv, medRxiv, arXiv, Elsevier und PubMed erschienen sind. Die Daten werden mehrmals täglich aktualisiert. Die Plattform nimmt aber keine inhaltliche Bewertung der Artikel vor“, betont TU-Student Eike Niehs. Nutzerinnen und Nutzer können die Publikationen nach verschiedenen Kriterien filtern oder mithilfe der semantischen Suche die Abstracts und Inhalte der Artikel durchsuchen und sich so ähnliche Artikel anzeigen lassen.
„Die semantische Suche ist das Besondere an unserer Plattform“, erklärt Yannic Lieder, Informatik-Student an der TU Braunschweig. „Wir haben den Algorithmus so trainiert, dass er Zusammenhänge zwischen Wörtern erkennt. Sucht man zum Beispiel nach dem Wort ‚Klima‘, werden auch semantisch verwandte Begriffe wie Umwelt, Temperatur oder Luftfeuchtigkeit erkannt. Das macht die Suche viel effizienter.“
Künstliche Intelligenz hilft bei der Suche
Um die Plattform zu programmieren, haben die Informatik-Studenten verschiedene Ansätze des Maschinellen Lernens angewendet. Die semantische Suche beruht auf dem so genannten „Natural Language Processing“, einer Schnittstelle zwischen Informatik und Linguistik. Während Menschen beispielsweise die Zusammenhänge zwischen Wörtern und Sätzen leicht erkennen können, muss ein Computer so etwas erst einmal lernen. Beim Natural Language Processing wird versucht, die natürliche menschliche Sprache mithilfe von Algorithmen computerbasiert zu erfassen und zu verarbeiten.
Unterstützung im Solution Enabler und durch das BMBF
Unterstützung erhält das Projekt „Collabovid“ im Solution Enabler, einem Umsetzungsprogramm, das die Organisatorinnen und Organisatoren des #wirvsvirus Hackathons der Bundesregierung aufgesetzt haben. 130 Projektideen mit digitalen Lösungen für die Herausforderungen durch die Corona-Krise haben sich für dieses Programm qualifiziert. 34 besonders anspruchsvolle und innovative von ihnen wurden außerdem als passend zur bereits laufenden Fördermaßnahme „Prototype Fund“ des Bundesministeriums für Bildung und Forschung identifiziert. Mit dieser Förderung werden die Teams dabei unterstützt, ihre Prototypen weiter zu entwickeln und zu realisieren.
Ein Ausblick in die Zukunft
„Collabovid“ befindet sich im Moment noch im Aufbau. „Wir wollen gerne weitere Funktionen integrieren. Zum Beispiel sollen viel diskutierte Arbeiten angezeigt werden. Außerdem würden wir es gerne verifizierten Expertinnen und Experten ermöglichen, die Preprints informell zu bewerten und zu überprüfen, um eine Diskussion einzuleiten, bevor der Artikel offiziell veröffentlicht wird, und um Hinweise auf die Qualität der Artikel zu geben. So ein informelles Bewertungssystem ist im Moment noch nicht auf unserer Plattform vorhanden, aber in Planung“, sagt Yannic Lieder. Um das Open-Source-Projekt weiter zu optimieren, freut sich das Team über Feedback zur Nutzung von Collabovid.