Multimodale Aktivitätserkennung mit VLMs zur semantischen Transkription von erkannten Akti – Ausschreibung | auftrag.ai