A survey of data partitioning and sampling methods to support big data analysis

Computer clusters with the shared-nothing architecture are the major computing platforms for big data processing and analysis. In cluster computing, data partitioning and sampling are two fundamental strategies to speed up the computation of big data and increase scalability. In this paper, we prese...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Big Data Mining and Analytics Jg. 3; H. 2; S. 85 - 101
Hauptverfasser: Mahmud, Mohammad Sultan, Huang, Joshua Zhexue, Salloum, Salman, Emara, Tamer Z., Sadatdiynov, Kuanishbay
Format: Journal Article
Sprache:Englisch
Veröffentlicht: Beijing Tsinghua University Press 01.06.2020
Schlagworte:
ISSN:2096-0654, 2097-406X
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!