Kategorie:Hadoop
Hadoop je software usnadňující paralelní zpracování velkého množství dat za použití algoritmu MapReduce. Hlavním rozdílem ve zpracování dat klasickým clusterem v MetaCentru a clusterem postaveným na Hadoop je, že ve klasickém prostředí musí být nahrána všechna data v jedné dávce ještě před jejich zpracováním, kdežto prostředí Hadoop umožňuje postupné sbírání a ukládání dat, která se poté zpracují.
Hadoop zajišťuje distribuci výpočtů zpracovávajících data na mnoho výpočetních uzlů a následné sesbírání výsledků. Není vhodný pro všechny druhy výpočtů, jen pro takové výpočty, v nichž je možné paralelně zpracovat velké množství nezávislých kousků dat a sesbírat výsledky, například hledání jehly v kupce sena.
V současné době je Hadoop provozován jako virtuální klastr v rámci cloudové infrastruktury.
Pages in category "Hadoop"
The following 4 pages are in this category, out of 4 total.