Co se u WEDOS změnilo a jaká vylepšení připravujeme

[gtranslate]

Pravidelně vylepšujeme věci a postupy jak technicky tak i organizačně. Plánujeme i více komunikace směrem k zákazníkům. Více otevřenosti a úplně nový systém pro automatickou notifikaci v případě problémů (například odstávky serverů). Na co jsme si nevzpomněli? Co byste ještě doporučili a poradili? Nápady, které budeme realizovat odměníme dárkem.

Co všechno se změnilo

Přečtěte si, co se u nás změnilo nebo ještě změní. Některé věci měníme technicky, jiné organizačně a některé se týkají komunikace směrem ke klientům. Budeme ještě otevřenější a hodě věcí zveřejníme automaticky (třeba výpadky serverů).

  • Výměna jedné UPS za novou, která má navíc baterie na výrazně delší dobu (fotogalerie je zde).
  • Motorgenerátor od července již testujeme 1x měsíčně pod zátěží na 15 minut (kompletně nasimulujeme výpadek celé budovy), běžný týdenní test zůstane zachován.
  • Budeme mít druhý automatický generátor s vlastním ATS, který bude zálohovat ten stávající, tj. 100% záloha výkonu 2 motorgenerátory (záležitost, kterou v ČR asi moc datacenter nemá).
  • Naprosto všechny PC v kancelářích jedou přes speciální samostatnou UPS (doposud tam chyběla PC ve 2 kancelářích).
  • Provedeme výměnu hlavního rozvaděče, který bude dimenzován na vyšší kapacity (s ohledem na budoucnost).
  • Příprava na další přípojku elektřiny ze zadní strany budovy, kde plánujeme vybudovat vlastní trafostanici a máme motrogenerátor (a do budoucna budou 2 motorgenerátory).
  • Urychlujeme přípravy druhého datacentra (ať jde o případné olejové nebo nějaké klasické řešení v jiné lokalitě).
  • Firewall pro kanceláře se bude také 1x měsíčně testovat v plném provozu a uvidíme, zda naběhne na záložní řešení + jsou u firewallů, přiložené náhradní CF karty s nainstalovaným systémem.
  • Do kanceláře byl zakoupen wifi router, který podporuje automaticky připojení přes mobil a tak bude nouzové připojení v případě jakéhokoliv problému.
  • V kancelářích na monitorech s kamerami a výpisem monitoringu se přidá výpis z Free-coolingu a klimatických hodnot v serverovně a hodnot napájení celé budovy, abychom měli neustálý přehled o tom, co se v našem datacentru děje a tento přehled měla k dispozici i nonstop zákaznická podpora.
  • Zákazníkům umíme nabídnout výběr kompenzace přímo v administraci, protože jsme naprogramovali rozhraní pro kompenzace. Pokud dojde k nějakému problému, budete o tom nejenom informování, ale zároveň si vyberete kompenzaci, bez nutnosti kontaktovat naši zákaznickou podporu.

Organizačně ještě proběhlo nebo proběhne:

  • Hesla k sociálním sítím dáme do obálky a uložíme někam na bezpečné místo ( a v případě potřeby je bude moci otevřít i např. člen zákaznické podpory, který se k nim jinak běžně nemá možnost dostat).
  • Založíme speciální profily na sociálních sítích, kde bude status našich služeb.
  • Na podpoře bude vždy určen vedoucí konkrétní směny a ten bude mít na starost řešení krizové komunikace směrem ven nebo zajistí někoho, kdo to vyřeší).
  • Sjednocení pravidel (plus zavedení školení) pro přiznávání kompenzací tak, aby byli zákazníci spokojeni.
  • Upravili jsme postupy nebo upravíme kompletně ve Wiki postupy pro podobné situacea bude vhodnější některé pasáže i vytisknout, protože v případě havárie interní sítě jsme bez přístupu k některým informacím.
  • Přidáme automatické hlášení poruch (a výpadků) do zákaznické administrace (a to zákazníkům, kterých se to týká = mají službu na postiženém serveru) a do chatu, tj. jakýsi monitoring přenést do administrace.
  • Rozsáhlejší problémy nebo zásadnější problémy budeme hned dávat na web plus do administrace a plus do chatu plus na sociální sítě. Z našich zkušeností víme, že se často jedná o problémy, které nejsou na naší straně (rozsáhlé phisingové e-maily, problémy velkých poskytovatelů internetu, ztráta konektivity do zahraničí, velký poskytovatel e-mailových služeb na blacklistu). Je potřeba však o nich informovat, abyste mohli přijmout patřičná opatření.
  • Pracujeme na řešení, kdy náš web a zákaznická podpora (chat, kontaktní formuláře, e-mail) bude dostupný za všech okolností i v případě opravdu masivního globálního výpadku.
  • Všem zákazníkům v případě globálního problému musíme urychleně poslat hromadný mail.
  • Při jakémkoliv výpadku VPS z naší strany (například restart hypervizoru) budeme automaticky posílat mailem notifikaci, při déletrvajícím výpadku jiných služeb taky.
  • U telefonního operátora je nutné nastavit přesměrování hovorů v případě nedostupnosti.
  • Motivační program pro WEDOS bez výpadků.
  • Do půlnoci budou v práci technici junioři, kteří mají nyní přístup na některé servery, kde budou moci zasáhnout a řešit některé věci.
  • Budeme pravidelně testovat různé havarijní situace.

Testování, testování a testování za živa…

Ano, budeme testovat různé havarijní situace za běhu. Je to sice riskantní, ale když odstávku nebo poruchu uděláte plánovitě, tak víte, co se stalo a máte šanci se vrátit zpět k funkčnímu stavu.

Máme v plánu testování různých havarijních situací. Samozřejmě vše bude pod dozorem odpovědných osob, aby nemohlo dojít k situacím, které by mohly ohrozit chod našich služeb. Některé testy budou probíhat plánovaně a jiné neplánovaně. Následně se vše bude vyhodnocovat, abychom podchytili slabá místa. O všem budeme průběžně informovat.
Pokud chceme být jedničkou na trhu, musíme být připraveni na všechno a vždy.

Napadá někoho ještě něco?

Na co jsme si nevzpomněli? Co byste ještě doporučili a poradili? Nápady, které budeme realizovat, odměníme dárkem.