Digitales ABC: B wie...

Big Data (von englisch big = gross und data = Daten)

Von Markus Häfliger · 10. Juni 2022

Bedeutungen

  • Sehr grosse Datenmengen
  • Technologien zur Verarbeitung und Auswertung sehr grosser Datenmengen
  • Schlag- resp. Buzzwort der Medien für Analyse-Anwendungen riesiger Datenmengen

 

Ursprung
Die zunehmende Industrialisierung der Informatik und die im neuen Jahrtausend damit einhergehenden stetig sinkenden Kosten für Speicherkapazitäten veranlassten Unternehmen, alle möglichen Geschäftsdaten quasi auf Vorrat zu speichern. Der Anglizismus Big Data wurde denn auch ursprünglich hauptsächlich synonym mit der Ansammlung riesiger Datenmengen, insbesondere in unterschiedlichen strukturierten und unstrukturierten Formaten aus verschiedenen Datenquellen verwendet. Diese Daten waren allerdings in ihrer Zusammensetzung mit herkömmlichen Methoden nur schwer auszuwerten. Mit der Zeit wurde die Verwendung des Begriffs auf Technologien zur Auswertung von Massendaten ausgeweitet.

Technologien
Die Verarbeitung und Auswertung von sehr grossen Datenmengen ist nicht zu verwechseln mit den bewährten Business-Intelligence- und Analysemethoden, die mehrheitlich unabhängig von der Grösse der zu betrachtenden Datenmengen funktionieren. Die Problematik von Big Data liegt in der Intensität der Rechenprozesse, die den Computern abverlangt wird. So haben sich denn neben dem Einsatz von Supercomputern wie dem bekannten Blue Gene Watson von IBM oder anderen Systeme durchgesetzt, die hochverfügbare Rechenkapazitäten von vernetzten Computern (Cluster) nutzen. Dazu gehören beispielsweise das freie (Open Source) Framework Apache Hadoop, das seine hohe Effizienz hauptsächlich aufgrund der Parallelisierung der Berechnungen auf verteilten Rechnern erzielt. Ein weiteres häufig eingesetztes verteiltes Dateisystem ist Cassandra (ebenfalls von der Apache Software Foundation).

Anwendungen
Cassandra kommt beispielsweise beim VBV-System (Vehicle by Vehicle) des Bundesamtes für Strassen Astra zum Einsatz, in dem mittels elektronischer Zähler an  Nationalstrassen jährlich rund 5,5 Milliarden Einzelfahrzeugmeldungen gesammelt und gespeichert. Abraxas stellt für das Bundesamt den Applikationsbetrieb sicher. Zusammen mit den Daten des Öffentlichen Verkehrs sollen in der Open-Data-Plattform Mobilität Schweiz der SBB in Echtzeit auch Drittanbietern wie Städten oder Blaulichtorganisationen u.v.m. zur Verfügung gestellt werden. Um in Zukunft Verkehrsströme besser zu lenken, wird an diese Big-Data-Anwendung auch die ebenfalls auf Cassandra laufende, aber unabhängig betriebene Verkehrsdatenplattform des Kantons Zürich angeschlossen. Ein weiteres Beispiel für Big Data im öffentlichen Sektor ist der IBM Watson Explorer, der von Abraxas für Ermittlungstätigkeiten bei Polizeikorps implementiert wird. Dabei werden anstelle manueller Auswertungen grosse Datenmengen unterschiedlicher Herkunft eingelesen, indexiert und analysiert und so fallrelevante Daten schneller ins Blickfeld der Fahnder gerückt.

Buzzword für alle möglichen Szenarien
Während sich Big Data im eigentlichen Sinne auf die Verwendung statistischer Modelle (Algorithmen) zur Analyse von Massendaten im mittleren bis hohen dreistelligen Tera- bzw. Petabyte-Bereich bezieht, wird der Terminus vor allem bei mittelständischen Unternehmen auch für geringere Datengrössen verwendet. Von den Massenmedien werden typische Anwendungen wie Markt- und Trendforschung, Meteorologie und Klimatologie, Nachrichtendienst, Biochemie oder personalisierter Medizin u.v.m. mit Big Data gleichgesetzt. Aber auch ganz allgemeine Digitalisierungsthemen wie Cloud Computing, Internet der Dinge oder die mögliche Verletzung von Datenschutzgesetzen werden mitgemeint. So wird die eigentliche Bedeutung mehr und mehr verwässert.

Alle bisher erschienenen Buchstaben im digitalen ABC

Abraxas erklärt die wichtigsten Begriffe und Buzzwords der IT-Branche.
Markus Häfliger

Über Markus Häfliger

Markus Häfliger ist Inhaber der auf Business-to-Business-IT spezialisierten PR-Agentur Häfliger Media Consulting. Er verfügt über jahrzehntelange Erfahrung mit Technologie- und Wirtschaftsthemen sowohl auf Agentur- als auch auf Medienseite. Er war Chefredaktor der IT-Branchenzeitschrift IT Reseller und von Infoweek (heute Swiss IT Magazine), der Zeitschrift für IT-Entscheider in Unternehmen. Er publiziert als Ghostwriter regelmässig in namhaften Industrie- und Wirtschaftsmedien Fachartikel und Berichte zu IT-Anwendungen in der Praxis. Für das Abraxas-Magazin verfasst er das «Digitale ABC», eine fortlaufende Artikelserie im Lexikon-Stil.