Kategorie:Hadoop

Z MetaCentrum
Skočit na navigaci Skočit na vyhledávání

Hadoop je software usnadňující paralelní zpracování velkého množství dat za použití algoritmu MapReduce. Hlavním rozdílem ve zpracování dat klasickým clusterem v MetaCentru a clusterem postaveným na Hadoop je, že ve klasickém prostředí musí být nahrána všechna data v jedné dávce ještě před jejich zpracováním, kdežto prostředí Hadoop umožňuje postupné sbírání a ukládání dat, která se poté zpracují.

Hadoop zajišťuje distribuci výpočtů zpracovávajících data na mnoho výpočetních uzlů a následné sesbírání výsledků. Není vhodný pro všechny druhy výpočtů, jen pro takové výpočty, v nichž je možné paralelně zpracovat velké množství nezávislých kousků dat a sesbírat výsledky, například hledání jehly v kupce sena.

V současné době je Hadoop provozován jako virtuální klastr v rámci cloudové infrastruktury.

Stránky v kategorii „Hadoop“

Zobrazují se 4 stránky z celkového počtu 4 stránek v této kategorii.