Die traditionellen Datenbanken speichern ihre Daten in einzelnen Datensätzen: und zwar Datensatz für Datensatz. Das hat Vorteile bei transaktionalen Datenbanken, weil die Daten, die in einer Operation benötigt werden, eng zusammenliegen.
Bei analytischen Anwendungen ist man aber z. B. am durchschnittlichen Verbrauch aller Kunden in einer bestimmten Postleitzahlregion interessiert. Hier müssen sehr viel einzelne Datensätze berücksichtigt werden, die sehr "weit" im Speicher auseinanderliegen können.
Wenn die Daten nach den jeweiligen Spalten gespeichert werden, bringt dieses Geschwindigkeitsvorteile. Man kann die einzelnen Spalten auch besser komprimieren, weil die Datem sich oft sehr ähnlich sind.
Damit sind die spaltenbasierten Datenbanken besser für analytische Anwendungen geeignet.
Einige Beispiele:
Copyright © 2007-2012 Jörn Dinkla. All rights reserved.