Kategorie:Hadoop

From MetaCentrum
Jump to navigation Jump to search

Hadoop je software usnadňující paralelní zpracování velkého množství dat za použití algoritmu MapReduce. Hlavním rozdílem ve zpracování dat klasickým clusterem v MetaCentru a clusterem postaveným na Hadoop je, že ve klasickém prostředí musí být nahrána všechna data v jedné dávce ještě před jejich zpracováním, kdežto prostředí Hadoop umožňuje postupné sbírání a ukládání dat, která se poté zpracují.

Hadoop zajišťuje distribuci výpočtů zpracovávajících data na mnoho výpočetních uzlů a následné sesbírání výsledků. Není vhodný pro všechny druhy výpočtů, jen pro takové výpočty, v nichž je možné paralelně zpracovat velké množství nezávislých kousků dat a sesbírat výsledky, například hledání jehly v kupce sena.

V současné době je Hadoop provozován jako virtuální klastr v rámci cloudové infrastruktury.

Pages in category "Hadoop"

The following 4 pages are in this category, out of 4 total.