Using Performance Measurements to Improve MapReduce Algorithms

The Hadoop MapReduce software environment is used for parallel processing of distributively stored data. Data mining algorithms of increasing sophistication are being implemented in MapReduce, bringing new challenges for performance measurement and tuning. We focus on analyzing a job after completio...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:Procedia computer science Ročník 9; s. 1920 - 1929
Hlavní autoři: Plantenga, Todd D., Choe, Yung Ryn, Yoshimura, Ann
Médium: Journal Article
Jazyk:angličtina
Vydáno: Elsevier B.V 2012
Témata:
ISSN:1877-0509, 1877-0509
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.