Kategorie:Hadoop

From MetaCentrum
Jump to: navigation, search

Hadoop je software usnadňující paralelní zpracování velkého množství dat.

Hadoop zajišťuje distribuci výpočtů zpracovávajících data na mnoho výpočetních uzlů a následné sesbírání výsledků. Není vhodný pro všechny druhy výpočtů, jen pro takové výpočty, v nichž je možné paralelně zpracovat velké množství nezávislých kousků dat a sesbírat výsledky, například hledání jehly v kupce sena.

V MetaCentru je pro Hadoop vyhrazen jeden cluster jménem hador.