Nejlepší postupy pro nasazení serveru Hadoop na CentOS/RHEL 7 – část 1
V této sérii článků pokryjeme celou budovu Cloudera Hadoop Cluster Building doporučenými doporučenými postupy Vendor a Industrial.
Instalace OS a provedení úrovně OS Předpoklady jsou prvními kroky k vytvoření Hadoop Clusteru. Hadoop může běžet na různých variantách platformy Linux: CentOS, RedHat, Ubuntu, Debian<, SUSE atd., V produkci v reálném čase je většina Hadoop Clusterů postavena na RHEL/CentOS. bude používat CentOS 7 pro demonstraci v této sérii výukových programů.
V organizaci lze instalaci OS provést pomocí kickstartu. Pokud se jedná o cluster se 3 až 4 uzly, je možná ruční instalace, ale pokud vytvoříme velký cluster s více než 10 uzly, je zdlouhavé instalovat OS jeden po druhém. V tomto scénáři přichází na řadu metoda Kickstart, můžeme přistoupit k hromadné instalaci pomocí kickstartu.
Dosažení dobrého výkonu z prostředí Hadoop závisí na zajištění správného hardwaru a softwaru. Vytváření produkčního klastru Hadoop tedy vyžaduje mnoho úvah týkajících se hardwaru a softwaru.
V tomto článku si projdeme různé benchmarky o instalaci OS a některé osvědčené postupy pro nasazení Cloudera Hadoop Cluster Server na CentOS/RHEL 7.
Důležitá úvaha a doporučené postupy pro nasazení serveru Hadoop
Níže jsou uvedeny doporučené postupy pro nastavení nasazení Cloudera Hadoop Cluster Server na CentOS/RHEL 7.
- Servery Hadoop nevyžadují k sestavení clusteru podnikové standardní servery, ale vyžadují komoditní hardware.
- V produkčním clusteru se doporučuje mít 8 až 12 datových disků. Podle charakteru pracovní zátěže se o tom musíme rozhodnout. Pokud je cluster určen pro výpočetně náročné aplikace, je nejlepším postupem mít 4 až 6 jednotek, abyste se vyhnuli problémům s I/O.
- Datové disky by měly být rozděleny jednotlivě, například od /data01 do /data10.
- Konfigurace RAID se pro pracovní uzly nedoporučuje, protože samotný Hadoop poskytuje odolnost proti chybám u dat tím, že ve výchozím nastavení replikuje bloky do 3. Takže JBOD je nejlepší pro pracovní uzly.
- Pro hlavní servery je nejlepším postupem RAID 1.
- Výchozí souborový systém na CentOS/RHEL 7.x je XFS. Hadoop podporuje XFS, ext3 a ext4. Doporučený souborový systém je ext3, protože je testován na dobrý výkon.
- Všechny servery by měly mít stejnou verzi operačního systému, alespoň stejnou menší verzi.
- Nejlepší je mít homogenní hardware (všechny pracovní uzly by měly mít stejné hardwarové charakteristiky (RAM, místo na disku, jádro atd.).
- V závislosti na zátěži clusteru (vyvážená zátěž, výpočetně intenzivní, I/O intenzivní) a velikosti se bude plánování zdrojů (RAM, CPU) na server lišit.
Níže naleznete příklad rozdělení disku na servery s 24TB úložištěm.
Instalace CentOS 7 pro nasazení serveru Hadoop
Věci, které potřebujete vědět před instalací serveru CentOS 7 pro Hadoop Server.
- Minimální instalace je dostatečná pro Hadoop Servers (pracovní uzly), v některých případech lze GUI nainstalovat pouze pro Master servery nebo Management servery, kde můžeme použít prohlížeče pro webová rozhraní Nástroje pro správu.
- Konfigurace sítí, názvu hostitele a dalších nastavení souvisejících s OS lze provést po instalaci OS.
- V reálném čase budou mít například prodejci serverů vlastní konzolu pro interakci a správu serverů – servery Dell mají iDRAC, což je zařízení, ve kterém jsou servery vestavěné. Pomocí tohoto rozhraní iDRAC můžeme nainstalovat OS s obrazem OS v našem místním systému.
V tomto článku jsme nainstalovali OS (CentOS 7) do virtuálního počítače VMware. Zde nebudeme mít více disků pro provádění oddílů. CentOS je podobný RHEL (stejná funkce), takže uvidíme kroky k instalaci CentOS.
1. Začněte stažením obrazu ISO CentOS 7.x do místního systému Windows a vyberte jej při spouštění virtuálního počítače. Vyberte „Install CentOS 7“ podle obrázku.
2. Vyberte Jazyk, výchozí bude Angličtina a klikněte na Pokračovat.
3. Výběr softwaru – Vyberte „Minimální instalace“ a klikněte na „Hotovo“.
4. Nastavte heslo uživatele root, které nás vyzve k nastavení.
5. Cíl instalace – Toto je důležitý krok, abyste byli opatrní. Musíme vybrat disk, na který má být OS nainstalován, pro OS by měl být vybrán vyhrazený disk. Klikněte na „Cíl instalace“ a vyberte Disk, v reálném čase tam bude více disků, musíme vybrat nejlépe „sda“.
6. Další možnosti úložiště – Vyberte druhou možnost (nakonfiguruji dělení), chcete-li nakonfigurovat dělení související s operačním systémem jako /var, / var/log, /home, /tmp, /opt, /swap.
7. Po dokončení zahajte instalaci.
8. Po dokončení instalace restartujte server.
9. Přihlaste se na server a nastavte název hostitele.
hostnamectl status
hostnamectl set-hostname tecmint
hostnamectl status
souhrn
V tomto článku jsme prošli kroky instalace OS a osvědčené postupy pro dělení systému souborů. To vše jsou obecné pokyny, v závislosti na povaze pracovní zátěže se možná budeme muset soustředit na více nuancí, abychom dosáhli nejlepšího výkonu clusteru. Plánování clusteru je umění pro správce Hadoop. V příštím článku se podrobně ponoříme do předpokladů na úrovni OS a zabezpečení Hardening.