Daten, das „Gold des 21. Jahrhunderts“?

Ist Ihnen das auch schon einmal passiert? – Sie haben fünf verschiedene Tabellen mit wertvollen Daten und möchten damit weiterarbeiten. Nun stellt sich aber heraus: Es passt nicht zusammen. Die Tabellen haben unterschiedliche Spalten, die Formate sind verschieden, Dubletten verfälschen Ihre Ergebnisse, sind aber gar nicht so einfach zu erkennen und auszumerzen.

Mit diesem Problem sind Sie nicht allein!

In der Praxis führen solche Aufgabenstellungen meist zu einem hohen manuellen Aufwand. Und schon ist das vielgerühmte "Gold des 21. Jahrhunderts" gar nicht mehr so glänzend – Sie können den Schatz nicht heben.

Praxisbeispiel: Alle Kunden minus Bestandskunden = potenzielle Neukunden

Es klingt einfach: Sie möchten Ihre potenziellen Neukunden erheben und verwenden dazu den Datensatz eines kommerziellen Anbieters (z.B. Gelbe Seiten). Die Daten Ihrer Bestandskunden liegen in Ihrer eigenen CRM-Datenbank vor. Sie müssen also lediglich diese Bestandskunden aus den Gelben Seiten herausfiltern, und schon wissen Sie, wer Ihre potenziellen Neukunden sind.

Nur wer sich noch nie damit beschäftigt hat, wird meinen, dass diese einfache Aufgabe "auf Knopfdruck" zu erledigen ist!

Schwierigkeiten bei der Integration von Standortdaten? Schildern Sie uns Ihr Problem. Wir sind Spezialisten!

Herausforderung Datenintegration

Daten aus verschiedenen Quellen für die gemeinsame Auswertung aufzubereiten, nennt man Datenintegration. Meist sind die Daten redundant und inkonsistent. Ein weiteres Beispiel: Sie möchten eine vollständige, valide Liste aller Hotels einer Region erstellen und benutzen dazu unterschiedliche Tabellen – eigene Daten, lokale Gelbe Seiten, Open Data von Behörden, Daten aus Internetrecherchen.

Viele der Hotels kommen in mehreren oder allen Listen vor, Sie müssen also die Dubletten verschmelzen. Vermutlich wird jeder Datensatz einen Namen enthalten. Aber Achtung, manche Hotels werden unter verschiedenen Namen auftauchen, z.B. aufgrund von Eigentümerwechseln. Erst indem Sie die Adressdaten miteinander abgleichen, werden Sie das bereinigen können.

Weiters werden manche Hotels unter leicht abweichenden Koordinaten aufscheinen, obwohl sie - real - einen Standort darstellen. Wie finden Sie das heraus? Und falls ein Standort in einem Datensatz als Punkt vorliegt, der - in einem anderen Datensatz - innerhalb einer Fläche (Polygon) liegt, wie stehen die beiden miteinander in Beziehung, und wie bilden Sie das ab?

Vermutlich kämpfen Sie mit den unterschiedlichen Formaten, die sich bei Standortdaten über die Jahre etabliert haben. Die verfügbaren Metadaten unterscheiden sich. Eine Tabelle enthält die Bettenzahl, in einer anderen fehlt diese, dafür gibt es Einträge zu Ausstattung und Preis.

Bis Sie eine konsistente Tabelle haben, mit der Sie weiterarbeiten können, müssen Sie einiges an Zeit und Aufwand investieren!


SLIPO schafft Abhilfe für Daten mit Raumbezug

Im Zuge eines von der EU geförderten Forschungsprojekts namens SLIPO konnte WIGeoGIS gemeinsam mit Partnern aus Forschung & Wirtschaft ein Tool- und Methodenset entwickeln, mit dem wir genau dieses Ziel verfolgen: Wir wollen diese eine, konsistente Tabelle - und zwar weitgehend automatisiert, schneller, effizienter.

Wie das geht?  – Wir machen uns die räumliche Komponente der Daten zunutze!

Denn knapp 80% aller Unternehmensdaten haben einen Raumbezug.

Nicht nur klassische Standortdaten (wie Filialen und andere Immobilien), sondern z.B. auch Ihre Kundendaten, die ja eine Adresse aufweisen. Stimmen bei der Integration von Daten aus unterschiedlichen Quellen die Koordinaten überein, so liefert die systematische, automatisierte Bewertung der übrigen Attribute die Information, ob es sich um denselben Inhalt / Datensatz handelt. Das spart nicht nur Zeit, sondern bringt im Ergebnis auch bessere Daten.

Die Grafik zeigt Ihnen stark vereinfacht den Prozess der Integration, Validierung und qualitätsgesicherten Anreicherung von Standortdaten bzw. Daten, die eine Koordinate aufweisen („Point of Interest“-Daten). Dahinter verbergen sich innovative, komplexe sogenannte Linked-Data-Technologien.

Slipo Datenintegration mit Mehrwert

Sie haben Standortdaten unterschiedlicher Quellen und wollen das Beste aus Ihnen herausholen, mit möglichst wenig Aufwand? – Wir können Ihnen helfen!

Test Case Münchner Rück

In Kooperation mit der Münchner Rück unterzogen wir unsere Entwicklung einem Praxistest.

Die Münchner Rück (Munich Re) ist ein Rückversicherer, d.h. sie versichert Versicherungsunternehmen ("Erstversicherer"). Sie agiert global und gehört zu den Größten ihrer Branche. Die Bewertung weltweiter Standorte im Hinblick auf Risiko gehört zu ihren Kernaufgaben.

Dass Standortdaten vollständig und geografisch exakt vorliegen, ist dabei essentiell. Neben eigenen Standortdatenbanken (z.B. Naturgefahrenkarten) greift Munich Re auf eine Vielzahl unterschiedlicher Datenquellen kommerzieller sowie OpenData Standortdatenanbieter zurück. Aktuell verursacht die Zusammenführung von Datenquellen bei Munich Re hohen manuellen Aufwand.

Im Test wurden Adresslisten von Hotels vier verschiedener Quellen zusammengeführt bzw. integriert. Die Problemstellungen waren ähnlich wie oben beschrieben.

Erfolgreicher Einsatz

Unsere Werkzeuge bewährten sich und stehen bereit für weitere Projekte.

Angewandte Forschung bringt Ergebnisse

„Für mich ist diese Zusammenarbeit ein vielversprechendes Beispiel dafür, wie zielorientiert und praxisnah Forschung und Wirtschaft zusammenarbeiten müssen, um erfolgreich zu sein.“

Andreas Siebert, Head of Geospatial Solutions, Munich Re

Intelligente Datenintegration: Kostenloses Erstgespräch vereinbaren!

  • GRATIS Erstgespräch zu intelligenter Datenintegration
  • Unverbindlich, ohne weitere Verpflichtungen
  • Per Telefon oder Video-Call

Möchten Sie Ihre Daten intelligent integrieren? Ich unterstütze Sie gerne. Kontaktieren Sie mich!

* Pflichtfelder - Bitte lesen Sie hier unsere Datenschutzbestimmungen