Konfrontation mit der Realität: Neuer KI-Benchmark OfficeQA

Databricks stellt OfficeQA vor: Ein Open-Source-Benchmark, der KI-Agenten in realitätsnahen Unternehmensszenarien testet.