Data Maturity bei Boehringer Ingelheim: Wie KI die Datenqualität auf ein neues Level hebt

Boehringer Ingelheim bedient weltweit 130 Märkte. Das Geschäft erfordert und generiert Massen von Stammdaten – die nur durch 100 % sauberes Datenmanagement handhabbar sind und einen Mehrwert liefern. Um die nötige Datenqualität zu gewährleisten, setzt Boehringer Ingelheim auf modernste KI-Methoden.

„Als weltweit agierender Konzern verfügen wir über eine riesige Menge an Daten, die das Potenzial haben, wichtige Erkenntnisse und erweiterte Funktionalitäten zu liefern“, sagt Frank Sommerer. Er ist Program Lead Master Data Quality bei Boehringer Ingelheim und mit seinem Team unter anderem dafür verantwortlich, diese Komplexität handhabbar zu machen. Er schafft damit die Basis, auf der Boehringer Ingelheim datengetriebene Erkenntnisse gewinnen und datengetriebene Prozesse umsetzen kann. Eine besondere Herausforderung liegt im Management der zentralen Stammdaten, die konzernweit u. a. für sämtliche Vendor- & Sales-Prozesse genutzt werden.

„Bei einem global agierenden Konzern wie unserem nimmt die Menge und die Komplexität der Stammdaten kontinuierlich zu. Dazu kommen globale und lokale Compliance- und Regulatorik-Anforderungen, die beim Stammdatenmanagement berücksichtigt werden müssen. Wenn es hier zu Fehlern kommt, können die Auswirkungen auf Reputations- und Kostenebene dramatisch sein“, erläutert Frank Sommerer die Relevanz eines sauberen Stammdatenmanagements. Um dieses Risiko zu minimieren und Daten immer effizienter zu nutzen, suchte Boehringer Ingelheim eine Lösung.

1885 gründete Albert Boehringer das pharma­zeutische Unternehmen Boehringer Ingelheim. Aus den damals 28 Mitarbeiter:innen sind heute 53.000 geworden. Das Unternehmen ist weltweit in den Geschäftsbereichen Human- und Biopharmazeutika sowie Tiergesundheit tätig und bedient über 130 Märkte. Das Ziel rund um den Globus: die Gesundheit von Mensch und Tier zu verbessern.

Datenkompetenz allein schafft noch keine Datenqualität

Viele klassische Ansätze für das Datenmanagement, wie z. B. die regelbasierte Dublettenerkennung, führen trotz hoher Investitionen nur zu marginalen Effekten: Häufig fehlen qualitativ hochwertige und vollständige Kontextinformationen, um geschäftsrelevante Entscheidungen zu treffen und Prozesse zu optimieren. Hinzu kommt das Thema Datenkompetenz. Mitarbeiter:innen müssen geschult sein, damit beim Anlegen neuer und bei der Pflege vorhandener Stammdaten die Datenqualität gesichert wird. „Datenqualität beginnt an der Eingabemaske. Daher ist die Schulung von Mitarbeiter:innen ein essenzieller Schritt für besseres Datenmanagement“, sagt Frank Sommerer und fügt hinzu: „Egal wie gut Menschen geschult sind, können sie bei komplexen Datenmengen aber irgendwann nicht mehr den Überblick behalten und brauchen digitale Unterstützung. Diese beiden Faktoren gehen wir zusammen mit Comma Soft an.“

Mit KI lässt sich die Komplexität meistern

Künstliche Intelligenz, insbesondere in Kombination mit Ansätzen aus der Graphentheorie, eignet sich hervorragend, um mit der beschriebenen Komplexität umzugehen und daraus nützliche Informationen zu gewinnen. Boehringer Ingelheim hat hierfür mit Hilfe von Comma Soft zunächst über 400.000 vorhandene Daten katalogisiert, analysiert und bereinigt. „Wir konnten allein in unseren Stammdaten 58.000 Lieferanten inaktivieren, deren Daten als Duplikate vorlagen oder veraltet waren. Gleichzeitig haben wir uns angeschaut, welche Anforderungen Nutzer:innen tagtäglich bei der Arbeit mit solchen Daten haben“, berichtet Frank Sommerer. Diese Anforderungen reichen vom schnellen Auffinden der gerade benötigten Daten über die einfache und korrekte Datenpflege bis hin zur Arbeit mit Datensätzen, die je nach Region unterschiedlichen Regularien unterliegen. Um zu gewährleisten, dass all das reibungslos funktioniert, wurden Prozesse neu designt und von Grund auf auf eine optimale Datenqualität ausgerichtet. Zudem hat Boehringer Ingelheim globale Standards (Governance) etabliert, die für die Anlage und Pflege von Stammdaten gelten und gleichzeitig länderspezifische Besonderheiten berücksichtigen. In Zukunft soll außerdem ein eigenes Data Quality Dashboard dafür sorgen, dass Frank Sommerer und sein Team in Echtzeit wissen, wie es gerade um die Qualität der Daten im gesamten Unternehmen steht und wo sie mit welcher Priorität eingreifen müssen. „Konsistent, korrekt, komplett: Das sind die drei Eckpfeiler, an denen wir Datenqualität ausrichten“, fasst Frank Sommerer zusammen.

Datenqualität auf der Zielgeraden

Aktuell ist das Datenmanagement in fast allen Konzernbereichen von Boehringer Ingelheim ausgerollt. In den nächsten zwei Jahren soll es konzernweit gelebte Praxis werden. „Statt wie früher nur reaktiv die Datenqualität im Worst Case zu optimieren, gehen wir sie jetzt bereits proaktiv an – und nähern uns mit großen Schritten dem Level ‚Managed‘, auf dem wir sie durchgehend und kosteneffizient beherrschen“, ist sich Frank Sommerer sicher.

Welche Gedanken und Fragen haben Sie zum Thema Datenqualität und Datenmanagement? Tauschen Sie sich dazu gerne direkt mit Dr. Henning Dickten und seinen Kolleg:innen aus: Hier können Sie Kontakt mit ihnen aufnehmen.