Datenbereinigung: Datenmüll im Unternehmen sicher entsorgen

0

Mit Tipps zu einer umfassenden Strategie der Datenbereinigung wird die Datenqualität erhöht und somit ein wichtiger Erfolgsfaktor des Unternehmens verbessert.

Datenbereinigung steigert die Datenqualität

Die Relevanz einer hohen Datenqualität für den Unternehmenserfolg ist unbestritten. In Konsequenz ist die Datenbereinigung zur Beseitigung von Datenmüll ein wichtiger Faktor für den gesamten Unternehmenserfolg. Ohne eine verlässliche Datenbasis kann das Management keine optimalen Entscheidungen treffen, sodass eine mangelnde Qualität der Informationen zum gravierenden Risikofaktor für die künftige Unternehmensentwicklung wird. Die Beseitigung des Datenmülls ist eine notwendige Aufgabe, die im Rahmen eines Clean Data Managements verfolgt werden sollte.

Datenbereinigung mit Clean Data kontra Datenmüll

Wir leben in einer Informationsgesellschaft und diese Tatsache führt dazu, dass in den Unternehmen eine Unmenge an Daten abgespeichert werden. Wissen wird zum Produktionsfaktor und entscheidet darüber, welches Unternehmen sich im Wettbewerb behaupten kann. Informationen über die Kunden, die Konkurrenten und die eigenen Mitarbeiter bilden nur die Spitze des Eisberges einer exponentiell wachsenden Datenmenge. Letztlich soll mit den Daten die Realität möglichst exakt abgebildet und damit eine valide Entscheidungsgrundlage für das Management geschaffen werden.

Die Unternehmensführung an sich erfolgt immer mehr mit Unterstützung der Informationstechnologie. Das Stichwort lautet Business Intelligence. Der Einsatz von Business Intelligence (BI)-Tools, mit denen Informationen in entscheidungsrelevante Daten transferiert und anschließend grafisch visualisiert werden, ist nicht mehr nur den Global Playern vorbehalten. BI-Tools werden vermehrt in kleineren und mittelständischen Unternehmen eingesetzt und aus diesem Grund wird der Umgang mit den Daten, die letztlich die Grundlage einer derartigen Unternehmensführung sind, erfolgskritisch.

Damit die Entscheidungen auf einer verlässlichen (Daten-)Basis getroffen werden, ist es für jedes Unternehmen wichtig, die Datenqualität zu sichern. Das ist wiederum nur möglich, wenn konsequent Maßnahmen zur Datenbereinigung im Rahmen eines integrierten Clean Data Managements umgesetzt werden. Es sollte schon bei der Datenspeicherung darauf geachtet werden, dass dieser Prozess korrekt abläuft. Später nach Fehlern zu suchen und diese dann zu korrigieren, ist weitaus aufwendiger, als von vornherein auf eine systematische Inventarisierung der Datenbestände zu achten.

Die Wichtigkeit einer vertrauenswürdigen Datenbasis wird besonders in Krisensituationen deutlich. Wenn unmittelbares Handeln erforderlich wird, ist es fatal, wenn das Vertrauen in die Qualität der Informationen nicht ausreicht. Langwierige Nachprüfungen und das Herausfiltern der relevanten Informationen erfordern Zeit und schränken somit die Handlungsfähigkeit des Managements genau dann ein, wenn Zögern erfolgskritisch wird.

BI-Tools werden vermehrt in kleineren und mittelständischen Unternehmen eingesetzt und aus diesem Grund wird der Umgang mit den Daten, die letztlich die Grundlage einer derartigen Unternehmensführung sind, erfolgskritisch. (#01)

BI-Tools werden vermehrt in kleineren und mittelständischen Unternehmen eingesetzt und aus diesem Grund wird der Umgang mit den Daten, die letztlich die Grundlage einer derartigen Unternehmensführung sind, erfolgskritisch. (#01)

Wie erkennt man Datenmüll?

Um Datenmüll zu erkennen, muss zunächst die Frage beantwortet werden, was die Merkmale einer hohen Datenqualität sind. Der Datenbestand sollte aktuell, zuverlässig und der Detaillierungsgrad sollte adäquat sein. Letztlich sollen genau die Daten in aktueller Form vorhanden sein, die das Management für das Treffen seiner Entscheidungen und die Einschätzung der wirtschaftlichen Situation des Unternehmens benötigt.

Die Datenbereinigung sorgt dafür, dass Informationen in den Datenbanken des Unternehmens, die diesen Kriterien nicht entsprechen, gelöscht oder korrigiert werden. Eine Datenbereinigung (Cleansing) wird also immer dann notwendig, wenn die Daten an sich fehlerhaft oder auch nur falsch formatiert sind. Auch unvollständige, doppelte oder veraltete Datensätze bedürfen der Korrektur. Der Datenbereinigung geht immer eine Datenanalyse voraus. Im Rahmen einer Strategie zur Datenbereinigung können Analytics Tools verwendet werden, mit denen der gesamten Datenbestand eines Unternehmens nach bestimmten Kriterien systematisch durchleuchtet wird.

Warum ist eine Datenbereinigung sinnvoll?

Datenmüll oder allgemein eine mangelhafte Qualität der Informationen führen dazu, dass die Prozesse im Unternehmen nicht reibungslos ablaufen können. Es gibt verschiedene Bereiche, die direkt negativ von fehlerhaften oder nicht mehr aktuellen Daten tangiert werden:

  • Business Intelligence Tools können nicht erfolgreich angewendet werden
  • Geschäftsprozesse können nicht harmonisiert werden
  • Cross-Selling-Strategien werden durch Dubletten erschwert
  • Risikomanagement ist nicht effektiv möglich
  • Direkt-Marketing mit Mailingaktionen wird erschwert
  • Falsche Adressen führen zur Minderung der Produktivität im Vertriebsbereich
  • Dokumentationspflichten gegenüber Kunden und dem Gesetzgeber werden verletzt
  • Fehlerhafte Lagerdaten führen zu Doppelbestellungen oder fehlenden Beständen
  • Probleme mit der Sicherheit und dem Datenschutz

Abgesehen von den oben genannten Konsequenzen auf der Unternehmensebene ist eine weitere Folge eines allzu umfangreichen Datenbestands auf der persönlichen Ebene der Mitarbeiter nicht von der Hand zu weisen: Das sogenannte „Information-Overload-Syndrom“. Dieses besagt, dass auf der individuellen Ebene Filterfunktionen im Gehirn versagen, wenn das Gehirn mit massenhaftem „Datenmüll“ überflutet wird. Weitere Folgen sind kognitive Einschränkungen wie Konzentrationsprobleme oder Wortfindungsstörungen und sogar vegetative Auswirkungen wie Schlafstörungen und Depressionen.

 Es sollte explizit ein Verantwortlicher für die Datenqualität benannt werden (Data Owner). Dieser Verantwortliche steht in ständigem Austausch mit dem Datenqualitätsteam hinsichtlich der erreichten Qualität, der Qualitätskriterien und der Maßnahmen, die sich aus der Beurteilung ergeben. (#02)

Es sollte explizit ein Verantwortlicher für die Datenqualität benannt werden (Data Owner). Dieser Verantwortliche steht in ständigem Austausch mit dem Datenqualitätsteam hinsichtlich der erreichten Qualität, der Qualitätskriterien und der Maßnahmen, die sich aus der Beurteilung ergeben. (#02)

Was sind die Voraussetzungen für eine effektive Bereinigung des Datenmülls?

Die oben genannten Probleme können mit Hilfe einer konsequenten Strategie der Datenbereinigung beseitigt werden. Dafür ist eine unternehmensweite Sensibilisierung für das Thema notwendig. Das Data Cleansing wird zu einem wichtigen Erfolgsfaktor für das Unternehmen und muss dementsprechend organisatorisch verankert sein. Es sollte als Managementaufgabe betrachtet werden und bedarf neben der organisatorischen Verankerung der konzeptionellen und technischen Umsetzung. Die folgenden Tipps erleichtern den Cleansing-Prozess.

Organisatorischer Rahmen der Datenbereinigung

Der organisatorische Rahmen ist die Basis einer konsequenten Datenbereinigung. Dazu werden die Zuständigkeiten und die Prozesse festgelegt. Zu diesem Zweck sollte ein Team im Data Governance beauftragt werden, dessen Hauptaufgabe das Daten-Profiling ist. Von diesem Team werden auch die Regeln für die Beurteilung einer hohen Informationsqualität festgelegt. Es sollte explizit ein Verantwortlicher für die Datenqualität benannt werden (Data Owner). Dieser Verantwortliche steht in ständigem Austausch mit dem Datenqualitätsteam hinsichtlich der erreichten Qualität, der Qualitätskriterien und der Maßnahmen, die sich aus der Beurteilung ergeben.

Von der Arbeit des Datenqualitätsteams und des Beauftragten für Datenqualität profitieren alle Anwender im Unternehmen, die sogenannten Data User. Die Anwender sind im täglichen Geschäft diejenigen, die Mängel feststellen und auch Qualitätskriterien definieren. Es ist wichtig, dass die Relevanz der Datenbereinigung oder allgemein der Datenqualität erkannt wird und das Datenqualitätsteam von anderen Aufgaben befreit wird, damit es sich auf diese wichtige Aufgabe konzentrieren kann.

Was soll mit der Datenbereinigung erreicht werden?

Die Anwendung von Software Tools zur Datenbereinigung soll verschiedene Effekte initiieren:

  • Extrahieren der Informationen aus strukturieren und unstrukturierten Quellen
  • Adressprüfung und -korrektur
  • Erstellung von Regeln zur Validierung und Korrektur des Datenbestands
  • Identifikation von Dubletten
  • Daten-Aggregation und -Konsolidierung
  • Stammdaten um sinnvolle Zusatzinformationen erweitern (Geo-Daten)
  • Formatierung von Datensätzen verbessern und harmonisieren
  • Bereinigte Daten performant weiterverarbeiten

Ziel ist ein Bestand an Stamm- und Bewegungsdaten, der den festgelegten Kriterien für die Qualität der Informationen entspricht. Ein wichtiger Tipp besteht auch darin, die Aufgabe der Datenbereinigung als Daueraufgabe anzusehen und entsprechend die Qualitätskriterien immer wieder zu hinterfragen und anzupassen.

Video: CCleaner – Datenmüll richtig entfernen (Teil 1 von 2)

Wie sollte der Prozess der Datenbereinigung ablaufen?

Nachdem die organisatorischen Voraussetzungen geschaffen wurden, wird der Prozess des Data Cleansing konkret geplant und durchgeführt. Die Anwendung spezieller Software Tools erleichtert die automatische Datenbereinigung. Bei der Auswahl der Tools ist es wichtig, darauf zu achten, dass sich die Software individuell an die Erfordernisse des Unternehmens anpassen lässt. Das Tool zur Datenbereinigung übernimmt dann wesentliche Teile des Prozesses. Viele der Software Tools verfügen über „Best-Practice-Einstellungen“, die besonders am Anfang die Vorgehensweise erleichtern. Im Folgenden wird anhand verschiedener Tipps dargestellt, wie die Bereinigung der Daten ablaufen kann und was dabei zu beachten ist.

Unternehmensweite Sensibilisierung für den Problembereich Datenbereinigung

Es ist nicht möglich, BI-Tools anzuwenden, ohne für eine Bereinigung der Informationen zu sorgen. Deshalb müssen alle Mitarbeiter, die mit dem Datenbestand arbeiten, für dieses Thema sensibilisiert werden. Sinnvoll ist die Formulierung von Zielen, die mit einer gesteigerten Datenqualität erreicht werden sollen. Lautet ein Ziel, dass die Kundenbeziehungen verbessert werden müssen, folgt daraus, dass besonders der Kundendatenbank eine hohe Aufmerksamkeit geschenkt wird und die Informationen dort redundanzfrei gespeichert sein müssen.

Vermeidung von Datenmüll durch Datenanalyse

Am Anfang des Cleansing-Prozesses steht zunächst eine Bestandaufnahme, bei der die Informationsqualität ermittelt wird. Hier kommen Analyse Tools zur Anwendung, mit denen der aktuelle Datenzustand zunächst analysiert und anschließend dokumentiert wird. Die Dokumentation ist wichtig, damit die Datenbereinigung nachvollziehbar bleibt und revisionssicher ist. Aus diesem Grund sollten Informationen niemals einfach gelöscht, sondern separat abgespeichert werden. Mit der entsprechenden Software können relativ einfach Probleme identifiziert und Fehlerhäufigkeiten festgestellt werden, sodass beispielsweise redundante Stammdaten erkannt werden. Diese Analytics Tools erkennen darüber hinaus, ob Datensätze unvollständig oder falsch sind und Widersprüche in zugrunde gelegten Modellannahmen vorhanden sind. Meist ist die überwiegende Zahl der Datensätze korrekt. Dennoch werden bei fünf bis zehn Prozent Probleme festgestellt, die beseitigt werden sollten.

Video: CCleaner – Datenmüll richtig entfernen (Teil 2 von 2)

Wie sieht ein korrekter Datensatz aus?

Nur wenn feststeht, wie der Sollzustand aussehen soll, kann dieser angestrebt werden. Jetzt sollte auch spätestens die Frage beantwortet werden, welche Informationen für das Unternehmen wichtig sind. Besteht dann Einigkeit darüber, ob die Adressdaten des Kunden mit oder ohne Telefonnummer benötigt werden, sollten die Festlegungen im Unternehmen kommuniziert und auf Einhaltung der Regeln geachtet werden. Mit der Festlegung des Soll-Zustands ist es in Zukunft möglich, Abweichungen schneller zu erkennen und zu beseitigen.

Datenmüll beginnt meist bereits mit der Datenerfassung

Eine korrekte Datenerfassung ermöglicht die Ausschaltung der meisten Fehlerquellen und verhindert, dass Datenmüll überhaupt in großem Umfang entsteht. Aus diesem Grund ist es sehr wichtig, dass die Eingabemasken einfach und selbsterklärend sind. Wenn im Unternehmen moderne ERP-Systeme genutzt werden, sorgen diese mit eigenen Plausibilitätsprüfungen für einen Check der eingegebenen Datensätze. Dabei werden sowohl die Vollständigkeit als auch logische Zusammenhänge betrachtet. Eine Warnfunktion erlaubt dem Nutzer dann eine Korrektur der Eingabe.

Datenmüll durch Vermeidung von Doppelspeicherungen verhindern

Doppelspeicherungen können relativ leicht durch eindeutige Artikelbezeichnungen verhindert werden. Werden für die Artikelbezeichnungen von Anfang an verbindliche und detaillierte Vorgaben vereinbart, minimiert sich das Potential für fehlerhaftes Speichern erheblich. Wichtige Aspekte sind in diesem Zusammenhang das Einbeziehen der Gewohnheiten der Nutzer und das Vermeiden von Abkürzungen.

Die Automatisierung der Datenerfassung reduziert Datenmüll

Mit automatisierten Workflows werden ebenfalls Fehlerquellen beseitigt. Im Lagerbereich können die Bestände mit Transpondern überwacht werden. Die moderne Software erleichtert auch in diesem Bereich die Zusammenarbeit der verschiedenen Abteilungen. Alle Informationen werden zentral gesammelt. So werden Schritte bei der Datenerfassung weder vergessen noch doppelt vorgenommen. Wird der Prozess einmal durchdacht und entsprechend automatisiert, erreichen die Mitarbeiter eine wesentlich höhere Produktivität. Schnellere Prozesse senken Kosten und erhöhen die Kundenzufriedenheit und damit, zumindest perspektivisch, die Einnahmen des Unternehmens.

Datenbereinigung als sich wiederholender Regelkreis

Der Soll-Zustand ist fixiert und nun können die Abweichungen ermittelt und anschließend beseitigt werden. Das Cleansing ist eine Daueraufgabe, denn jeden Tag strömen neue Informationen ins Unternehmen und somit ist eigentlich nie der Idealzustand einer perfekten Qualität der Informationen erreicht. Dieser Zustand kann aber kontinuierlich angestrebt und zumindest näherungsweise erreicht werden. Mit einer Analytics Software, die als Download zur Verfügung steht, können in regelmäßigem Turnus die Qualitätsmessungen und die Datenbereinigung vorgenommen werden.

Infografik: Die 5 Dimensionen der Datenqualität

Infografik: Die 5 Dimensionen der Datenqualität

Wichtiger Tipp: Zuweisung von Kompetenzen sichert den Erfolg der Datenbereinigung

Das Einpflegen der Informationen und die Datenkorrektur sind für die Vermeidung und Beseitigung von Datenmüll sehr wichtig. Aus diesem Grund sollten diese Aufgaben auch organisatorisch verankert und die dafür beauftragten Mitarbeiter mit den entsprechenden Kompetenzen ausgestattet werden. Auf diese Weise wird ein Versanden der Datenbereinigung nach dem Motto „niemand ist wirklich zuständig“ verhindert. Es sollte darauf geachtet werden, dass Datenbanken, die parallel im Unternehmen vorhanden sind, synchronisiert werden. Das ist der einfachste Weg, um Redundanzen zu vermeiden.

Es ist wichtig, dass bei allen Aufgaben, die von mehreren Abteilungen gleichzeitig erledigt werden, Einigkeit über die Datenspeicherung herrscht. Beispielsweise müssen Auftragsnummer nach einem festgelegten System vergeben werden. Stellt ein Mitarbeiter Probleme fest, muss es Strukturen geben, damit er diese dem Management zeitnah mitteilen kann. Die Mitarbeiter können außerdem Hinweise auf unnötige Datenbestände geben und auch auf diese Weise dazu beitragen, den Datenmüll zu verringern.

Mitarbeiterschulungen erleichtern die Bereinigung der Datenbestände

Damit die Aufgaben rund um das Thema Datenbereinigung kompetent wahrgenommen werden können, müssen die Mitarbeiter regelmäßig geschult werden, um die Sensibilität für das Thema Datenpflege zu erhöhen und die Voraussetzungen für eine erfolgreiche Wahrnehmung der Aufgabe zu schaffen. Im Zentrum der Schulungen stehen alle Tätigkeiten, die nicht automatisch von den Analytics Software erledigt werden können. Darunter fallen beispielsweise einheitliche Schreibweisen.

Video: Datenmüll entfernen und Registry säubern mit Ccleaner

Perfekte Archivierung trägt zur Datenbereinigung bei

Eine allgemeine Begrenzung des Datenbestands ist wünschenswert, denn ein steigendes Datenvolumen verlangt nach stärkeren Anstrengungen im Bereich des Cleansing und erschwert auch das Arbeiten mit den Datensätzen. Deshalb sollte immer wieder kritisch hinterfragt werden, welche Datensätze noch benötigt werden. Die nicht mehr aktiven Datensätzen sollten automatisch archiviert werden. Eine schlankere Datenbank ist einfacher zu handhaben und außerdem steigt die Qualität der Informationen, wenn nur die Datensätze berücksichtigt werden, die für das aktive Geschäft relevant sind. Durch die gesetzlich vorgeschriebenen Nachweispflichten kann auf eine Archivierung jedoch nicht verzichtet werden.

Durch Datenbereinigung Datenmüll beseitigen und Unternehmenserfolg steigern

Die Qualität des Datenbestandes ist für das Unternehmen wichtig, damit es erfolgreich seine Wettbewerbsposition verteidigen und im Idealfall sogar weiter ausbauen kann. Es ist eine große Herausforderung, die Fülle an Unternehmensdaten, Kundendaten und allgemeinen Informationen aus teilweise unstrukturierten Quellen mit Hilfe von Business Intelligence Software so zu verarbeiten, dass das Management alle nötigen Informationen erhält. Der gesamte Prozess von der Datenaufnahme bis zur -archivierung sollte immer unter dem Aspekt einer Vermeidung und wenn nötig einer Bereinigung des Datenbestandes von Datenmüll betrachtet werden. An jeder Stelle des Prozesses ergeben sich Ansatzpunkte, die eine Datenbereinigung ermöglichen und damit die Qualität der Informationen verbessern.

Das Managen der Datenflut wird zur zentralen Herausforderung der modernen Unternehmensführung. Mit der geeigneten Analyse-Software, einer konkreten Strategie und der Beachtung von einigen Tipps ist es jedoch möglich, Datenströme zu kanalisieren und dafür zu sorgen, dass die aktiven Daten aktuell, zuverlässig und hinsichtlich des Detaillierungsgrads adäquat sind. Wenn das gelingt, steigt der Informationsgehalt und damit werden die Analysen verbessert und ein reibungsloser Ablauf der Geschäftsprozesse erreicht.


BIldnachweis:©Shutterstock-Titelbild: Dmitry Kalinovsky  -#01:  JanneStan_-#02: GaudiLab

Über 

Marius Beilhammer, Jahrgang 1969, studierte Journalismus in Bamberg. Er schreibt bereits viele Jahre für technische Fachmagazine, außerdem als freier Autor zu verschiedensten Markt- und Businessthemen. Als fränkische Frohnatur findet er bei seiner Arbeit stets die Balance zwischen Leichtigkeit und umfassendem Know-how durch seine ausgeprägte Affinität zur Technik.

Share.

Leave A Reply