Co se u WEDOS změnilo a jaká vylepšení připravujeme

[gtranslate]

Pravidelně vylepšujeme věci a postupy jak technicky tak i organizačně. Plánujeme i více komunikace směrem k zákazníkům. Více otevřenosti a úplně nový systém pro automatickou notifikaci v případě problémů (například odstávky serverů). Na co jsme si nevzpomněli? Co byste ještě doporučili a poradili? Nápady, které budeme realizovat odměníme dárkem.

Co všechno se změnilo

Přečtěte si, co se u nás změnilo nebo ještě změní. Některé věci měníme technicky, jiné organizačně a některé se týkají komunikace směrem ke klientům. Budeme ještě otevřenější a hodě věcí zveřejníme automaticky (třeba výpadky serverů).

Výměna jedné UPS za novou, která má navíc baterie na výrazně delší dobu (fotogalerie je zde).
Motorgenerátor od července již testujeme 1x měsíčně pod zátěží na 15 minut (kompletně nasimulujeme výpadek celé budovy), běžný týdenní test zůstane zachován.
Budeme mít druhý automatický generátor s vlastním ATS, který bude zálohovat ten stávající, tj. 100% záloha výkonu 2 motorgenerátory (záležitost, kterou v ČR asi moc datacenter nemá).
Naprosto všechny PC v kancelářích jedou přes speciální samostatnou UPS (doposud tam chyběla PC ve 2 kancelářích).
Provedeme výměnu hlavního rozvaděče, který bude dimenzován na vyšší kapacity (s ohledem na budoucnost).
Příprava na další přípojku elektřiny ze zadní strany budovy, kde plánujeme vybudovat vlastní trafostanici a máme motrogenerátor (a do budoucna budou 2 motorgenerátory).
Urychlujeme přípravy druhého datacentra (ať jde o případné olejové nebo nějaké klasické řešení v jiné lokalitě).
Firewall pro kanceláře se bude také 1x měsíčně testovat v plném provozu a uvidíme, zda naběhne na záložní řešení + jsou u firewallů, přiložené náhradní CF karty s nainstalovaným systémem.
Do kanceláře byl zakoupen wifi router, který podporuje automaticky připojení přes mobil a tak bude nouzové připojení v případě jakéhokoliv problému.
V kancelářích na monitorech s kamerami a výpisem monitoringu se přidá výpis z Free-coolingu a klimatických hodnot v serverovně a hodnot napájení celé budovy, abychom měli neustálý přehled o tom, co se v našem datacentru děje a tento přehled měla k dispozici i nonstop zákaznická podpora.
Zákazníkům umíme nabídnout výběr kompenzace přímo v administraci, protože jsme naprogramovali rozhraní pro kompenzace. Pokud dojde k nějakému problému, budete o tom nejenom informování, ale zároveň si vyberete kompenzaci, bez nutnosti kontaktovat naši zákaznickou podporu.

Organizačně ještě proběhlo nebo proběhne:

Hesla k sociálním sítím dáme do obálky a uložíme někam na bezpečné místo ( a v případě potřeby je bude moci otevřít i např. člen zákaznické podpory, který se k nim jinak běžně nemá možnost dostat).
Založíme speciální profily na sociálních sítích, kde bude status našich služeb.
Na podpoře bude vždy určen vedoucí konkrétní směny a ten bude mít na starost řešení krizové komunikace směrem ven nebo zajistí někoho, kdo to vyřeší).
Sjednocení pravidel (plus zavedení školení) pro přiznávání kompenzací tak, aby byli zákazníci spokojeni.
Upravili jsme postupy nebo upravíme kompletně ve Wiki postupy pro podobné situacea bude vhodnější některé pasáže i vytisknout, protože v případě havárie interní sítě jsme bez přístupu k některým informacím.
Přidáme automatické hlášení poruch (a výpadků) do zákaznické administrace (a to zákazníkům, kterých se to týká = mají službu na postiženém serveru) a do chatu, tj. jakýsi monitoring přenést do administrace.
Rozsáhlejší problémy nebo zásadnější problémy budeme hned dávat na web plus do administrace a plus do chatu plus na sociální sítě. Z našich zkušeností víme, že se často jedná o problémy, které nejsou na naší straně (rozsáhlé phisingové e-maily, problémy velkých poskytovatelů internetu, ztráta konektivity do zahraničí, velký poskytovatel e-mailových služeb na blacklistu). Je potřeba však o nich informovat, abyste mohli přijmout patřičná opatření.
Pracujeme na řešení, kdy náš web a zákaznická podpora (chat, kontaktní formuláře, e-mail) bude dostupný za všech okolností i v případě opravdu masivního globálního výpadku.
Všem zákazníkům v případě globálního problému musíme urychleně poslat hromadný mail.
Při jakémkoliv výpadku VPS z naší strany (například restart hypervizoru) budeme automaticky posílat mailem notifikaci, při déletrvajícím výpadku jiných služeb taky.
U telefonního operátora je nutné nastavit přesměrování hovorů v případě nedostupnosti.
Motivační program pro WEDOS bez výpadků.
Do půlnoci budou v práci technici junioři, kteří mají nyní přístup na některé servery, kde budou moci zasáhnout a řešit některé věci.
Budeme pravidelně testovat různé havarijní situace.

Testování, testování a testování za živa…

Ano, budeme testovat různé havarijní situace za běhu. Je to sice riskantní, ale když odstávku nebo poruchu uděláte plánovitě, tak víte, co se stalo a máte šanci se vrátit zpět k funkčnímu stavu.

Máme v plánu testování různých havarijních situací. Samozřejmě vše bude pod dozorem odpovědných osob, aby nemohlo dojít k situacím, které by mohly ohrozit chod našich služeb. Některé testy budou probíhat plánovaně a jiné neplánovaně. Následně se vše bude vyhodnocovat, abychom podchytili slabá místa. O všem budeme průběžně informovat.
Pokud chceme být jedničkou na trhu, musíme být připraveni na všechno a vždy.

Napadá někoho ještě něco?

Na co jsme si nevzpomněli? Co byste ještě doporučili a poradili? Nápady, které budeme realizovat, odměníme dárkem.