PREZENTARE - Serverul redundant SALIENT VITAL TWIN PII 2x266

Faceţi cunoştinţă cu un server redundant autohton
din gama midrange, care permite rularea non-stop
a aplicaţiilor critice din firma dvs.

Serverele redundante din familia VITAL TWIN a firmei SALIENT permit rularea aplicaţiilor critice de firmă timp de 24 de ore din 24 şi 7 zile din 7. Au o arhitectură duală specifică, care permite detectarea unor anomalii majore în funcţionare a componentelor hard/soft şi pornirea, în timp util, a unei rezerve identice. Acesta va prelua din mers toate funcţionalităţile sistemului defectat, şi va continua deservirea clienţilor de reţea, în mod transparent pentru utilizator.

Cvasisimultan cu firme ca Dell, Digital, HP etc., SALIENT a lansat încă în anul trecut această soluţie interesantă (şi mult aşteptată…), imediat ce a fost disponibil softul de gestiune specific pentru un astfel de cluster (masiv) de două PC-uri: Microsoft Cluster Server (MSCS), prima versiune comercială. Rolul acestuia este supravegherea continuă a celor două sisteme interconectate, şi la o oprirea unuia (defectare hard sau soft, operaţii de service, upgrade hard şi soft etc.) permite aplicarea unui scenariu dinainte stabilit, scopul fiind deservirea continuă, fără opriri costisitoare, a clienţilor din reţea.

Simplific vorbind, un astfel de server redundant se compune din două PC- uri high-end, montate în aceeaşi carcasă, care funcţionează independent. Ele sunt dotate absolut identic: placă de bază (P6DLF, Supermicro, USA) dual procesor (Pentium II la 266MHz), disc hard local (Quantum Atlas II, SCSI UW, 4,5 GB), adaptor de disc SCSI UW (Adaptec, AHA 2940, BIOS Rev. 1.32), monitor (Philips 102B, 14, digital), tastatură (Win95, US), unitate CD-ROM (TEAC 32x) etc. Ambele noduri rulează acelaşi sistem de operare - Windows NT 4.0 - de pe cele două discuri locale. Alimentarea este rezolvată din două surse (400W) independente, hot-swapable, cuplate la reţea printr-un UPS (sursă neîntreruptibilă; 1KW).

Ambele noduri comunică cu exteriorul prin propriul său adaptor de reţea de 10/100MBps (Intel EtherExpress Pro 100-TX), şi între ei prin alte două plăci de 10 Mbs (SMC 1208). În contrast cu soluţiile simple tolerante la erori (gen servere de back-up, oglindiri etc.), care rulează doar aceleaşi aplicaţii client-server critice, aici aveţi o libertate mai mare: de exemplu, unul din noduri poate fi configurat ca server de Web şi celălalt ca server SQL.

Nu sunt dublate doar câteva elemente: carcasa metalică, sursa UPS şi matricea de discuri RAID (care are un sistem propriu, eficient, pentru securitatea datelor), în rest toate componentele au o "rezervă caldă", comutabilă în timp real.

Pentru stocarea datelor, cele două noduri NT partajează o matrice de discuri RAID, cuplată la cele două sisteme prin două adaptoare SCSI UW (AHA 2940). Este formată din 4 discuri rapide (Quantum Atlas II, SCSII UW, 4,5 GB, 7200 RPM), cuplate la un controler RAID performant: IFT 3102UA (Infortrend), dotat cu propriul procesor 486/66MHz şi cu un cache de 32 MB (expandabil la 128 MB). Permite implementarea mai multor nivele RAID: 0, 1, 0+1, 3, 5 etc. Discurile sunt, evident, hot swapable, deci pot fi scoase/schimbate/introduse din mers, fără repornirea sistemului.

Pentru a vedea eficienţa unui astfel de server redundant, am făcut un scurt test relevant cu un SALIENT VITAL TWIN 2x266. Acesta foloseşte în total 4 procesoare Pentium II 266 MHz, şi are instalat Windows NT 4.0 (multiprocessor kernel, enterprise edition) cu suportul 4GT (4 GB RAM Tunning – vechea limitare de 2 GB per proces creşte la 3 GB). Am configurat un server virtual pentru partajarea fişierelor (File Share) şi un server Internet.

Oprirea nodului activ din comutatorul de alimentare a fost observată după 10 secunde de către "fratele" său operativ, şi după alte 8 secunde el a şi preluat integral serviciul de Fail Sharing. A rezultat deci o durată de doar 18 secunde - numită fail-back-timp în care clientul trebuia să aştepte suplimentar pentru rezolvarea cererii sale, dacă exact atunci a căzut nodul activ. La refacerea nodului iniţial (repornire din comutator), serviciul a fost trecut înapoi, pe nodul iniţial, în timp util: 26 de secunde (durata fail-back).

Testul cu serverul virtual de Internet a dat următoarele valori: fail-over de 20 secunde (trecere pe rezervă) şi fail-back de 60 secunde (întoarcere pe nodul iniţial). De reţinut că, datorită acestor timpi (nesemnificativi pentru un acces WWW, dar totuşi mari pentru o aplicaţie Windows clasică), softul care poate beneficia din plin de această arhitectură de clustering trebuie să fie scris special (în primul rând, este important ca el să poată aştepta).

Această soluţie autohtonă de vârf, bazată pe o arhitectură x86 duală, are un grad ridicat de fiabilitate şi performanţă. Foloseşte componente hard de la fabricanţi de marcă, garantate pentru 3 ani. Softul principal, Microsoft Cluster Server, permite o gestiune extrem de eficientă şi o oarecare echilibrare a încărcării.

Serverul redundant
SALIENT VITAL TWIN PII 2x266

BYTE România - mai 1998

(C) Copyright Computer Press Agora