3 Fragen zum DAVALab – Projekt der Reihe «DSI Infrastrukturen & Labs»
DSI Infrastrukturen & Labs sind gemeinsam nutzbare Infrastrukturen oder strukturelle Gefässe zur Schaffung kollaborativer Forschungsumgebungen, die sich auf die digitale Transformation beziehen. Teodora Vuković stellt das Projekt DAVALab vor.
Was ist das Ziel des DAVALab?
Das DAVALab (Digital Audio-Visual Annotation Lab) ist eine webbasierte Infrastruktur, welche die automatische Annotation von Text-, Audio- und Videodaten ohne Programmierkenntnisse ermöglicht. Sie stellt fortgeschrittene multimodale Analysen über leicht zugängliche Pipelines bereit und macht die Annotationen über eine gemeinsame Timeline sichtbar. DAVALab basiert auf TIB-AV-A, einer hochmodernen Software, die an der TIB Hannover entwickelt wurde. An der UZH erweitern wir sie mit neuesten KI-gestützten Modellen.
Wie analysiert Ihre Plattform Text-, Sprach- und Videodaten, und wer kann sie nutzen?
Das DAVALab bietet fortgeschrittene multimodale Analysen über eine benutzerfreundliche Weboberfläche. Diese umfasst Spracherkennung, Sprechererkennung, Text-zu-Sprache-Abgleich, Syntax sowie Videoanalysen (Gesicht, Pose, Blick, Emotion). Forschende und Studierende aus verschiedenen Fachbereichen können Daten hochladen, Annotationen wählen, Resultate in der Timeline ansehen oder für weitere Analysen exportieren.
Welches Potenzial sehen Sie für Forschung und Lehre?
Das DAVALab bietet einen einfachen Zugang zu fortschrittlichen KI-Tools, für die sonst Programmierkenntnisse erforderlich wären. Es ermöglicht reproduzierbare multimodale Forschungsabläufe aus den Bereichen Linguistik und Digital Humanities bis hin zu Psychologie, Rechtswissenschaften, Filmwissenschaft und KI. Zudem unterstützt es praxisorientierte Kurse zu KI-Methoden und digitalen Kompetenzen, wobei reale Sprach- und Videodaten verwendet werden.
Mehr über das DAVALab erfahren Sie hier.
Alle Projekte der Reihe «DSI Infrastrukturen & Labs» finden Sie hier.
Teodora Vuković leitet die Multimodal Technology Group an der Universität Zürich (DSI / Departement für Computerlinguistik / LiRI). Sie ist PI des DAVA Lab und entwickelt KI-gestützte Tools und Infrastrukturen für die automatische multimodale Annotation und Analyse von Sprach-, Text- und Videodaten. Ihre Arbeit verbindet NLP, Computer Vision und Forschungsinfrastruktur.