Wenn Sie ein open-Source-Benutzer von Datenbankstrukturen sind, sind Sie wahrscheinlich vertraut mit Hadoop. Das ist der Cloud-Datenbank-Framework, das große Datasets skaliert über mehrere Cluster, die unter der Apache v2 open-Source-Lizenz vertrieben. Nun hat Microsoft das Programm in seinen Server und Cloud-Technologien integriert.
Benutzer von Hadoop
Verarbeitung große Datenmengen ist das Markenzeichen von Hadoop. Ein Beispiel ist Twitter. Sie müssen 12 Terabyte an Daten auf einer täglichen Basis verarbeiten, und so sie Hadoop verwenden, um die Verarbeitung zu ermöglichen. Für Twitter ist das Problem, dass sie mehr Daten pro Tag als zuverlässig auf eine einzelne Festplatte geschrieben werden können, so muss es zum Speichern von Daten auf Cluster speichern müssen. Twitter verwendet die Cloudera Hadoop Verteilung seiner Cluster an die macht.
View the Original article
Нема коментара:
Постави коментар