Pravidelně vylepšujeme věci a postupy jak technicky tak i organizačně. Plánujeme i více komunikace směrem k zákazníkům. Více otevřenosti a úplně nový systém pro automatickou notifikaci v případě problémů (například odstávky serverů). Na co jsme si nevzpomněli? Co byste ještě doporučili a poradili? Nápady, které budeme realizovat odměníme dárkem.
Co všechno se změnilo
Přečtěte si, co se u nás změnilo nebo ještě změní. Některé věci měníme technicky, jiné organizačně a některé se týkají komunikace směrem ke klientům. Budeme ještě otevřenější a hodě věcí zveřejníme automaticky (třeba výpadky serverů).
- Výměna jedné UPS za novou, která má navíc baterie na výrazně delší dobu (fotogalerie je zde).
- Motorgenerátor od července již testujeme 1x měsíčně pod zátěží na 15 minut (kompletně nasimulujeme výpadek celé budovy), běžný týdenní test zůstane zachován.
- Budeme mít druhý automatický generátor s vlastním ATS, který bude zálohovat ten stávající, tj. 100% záloha výkonu 2 motorgenerátory (záležitost, kterou v ČR asi moc datacenter nemá).
- Naprosto všechny PC v kancelářích jedou přes speciální samostatnou UPS (doposud tam chyběla PC ve 2 kancelářích).
- Provedeme výměnu hlavního rozvaděče, který bude dimenzován na vyšší kapacity (s ohledem na budoucnost).
- Příprava na další přípojku elektřiny ze zadní strany budovy, kde plánujeme vybudovat vlastní trafostanici a máme motrogenerátor (a do budoucna budou 2 motorgenerátory).
- Urychlujeme přípravy druhého datacentra (ať jde o případné olejové nebo nějaké klasické řešení v jiné lokalitě).
- Firewall pro kanceláře se bude také 1x měsíčně testovat v plném provozu a uvidíme, zda naběhne na záložní řešení + jsou u firewallů, přiložené náhradní CF karty s nainstalovaným systémem.
- Do kanceláře byl zakoupen wifi router, který podporuje automaticky připojení přes mobil a tak bude nouzové připojení v případě jakéhokoliv problému.
- V kancelářích na monitorech s kamerami a výpisem monitoringu se přidá výpis z Free-coolingu a klimatických hodnot v serverovně a hodnot napájení celé budovy, abychom měli neustálý přehled o tom, co se v našem datacentru děje a tento přehled měla k dispozici i nonstop zákaznická podpora.
- Zákazníkům umíme nabídnout výběr kompenzace přímo v administraci, protože jsme naprogramovali rozhraní pro kompenzace. Pokud dojde k nějakému problému, budete o tom nejenom informování, ale zároveň si vyberete kompenzaci, bez nutnosti kontaktovat naši zákaznickou podporu.
Organizačně ještě proběhlo nebo proběhne:
- Hesla k sociálním sítím dáme do obálky a uložíme někam na bezpečné místo ( a v případě potřeby je bude moci otevřít i např. člen zákaznické podpory, který se k nim jinak běžně nemá možnost dostat).
- Založíme speciální profily na sociálních sítích, kde bude status našich služeb.
- Na podpoře bude vždy určen vedoucí konkrétní směny a ten bude mít na starost řešení krizové komunikace směrem ven nebo zajistí někoho, kdo to vyřeší).
- Sjednocení pravidel (plus zavedení školení) pro přiznávání kompenzací tak, aby byli zákazníci spokojeni.
- Upravili jsme postupy nebo upravíme kompletně ve Wiki postupy pro podobné situacea bude vhodnější některé pasáže i vytisknout, protože v případě havárie interní sítě jsme bez přístupu k některým informacím.
- Přidáme automatické hlášení poruch (a výpadků) do zákaznické administrace (a to zákazníkům, kterých se to týká = mají službu na postiženém serveru) a do chatu, tj. jakýsi monitoring přenést do administrace.
- Rozsáhlejší problémy nebo zásadnější problémy budeme hned dávat na web plus do administrace a plus do chatu plus na sociální sítě. Z našich zkušeností víme, že se často jedná o problémy, které nejsou na naší straně (rozsáhlé phisingové e-maily, problémy velkých poskytovatelů internetu, ztráta konektivity do zahraničí, velký poskytovatel e-mailových služeb na blacklistu). Je potřeba však o nich informovat, abyste mohli přijmout patřičná opatření.
- Pracujeme na řešení, kdy náš web a zákaznická podpora (chat, kontaktní formuláře, e-mail) bude dostupný za všech okolností i v případě opravdu masivního globálního výpadku.
- Všem zákazníkům v případě globálního problému musíme urychleně poslat hromadný mail.
- Při jakémkoliv výpadku VPS z naší strany (například restart hypervizoru) budeme automaticky posílat mailem notifikaci, při déletrvajícím výpadku jiných služeb taky.
- U telefonního operátora je nutné nastavit přesměrování hovorů v případě nedostupnosti.
- Motivační program pro WEDOS bez výpadků.
- Do půlnoci budou v práci technici junioři, kteří mají nyní přístup na některé servery, kde budou moci zasáhnout a řešit některé věci.
- Budeme pravidelně testovat různé havarijní situace.
Testování, testování a testování za živa…
Ano, budeme testovat různé havarijní situace za běhu. Je to sice riskantní, ale když odstávku nebo poruchu uděláte plánovitě, tak víte, co se stalo a máte šanci se vrátit zpět k funkčnímu stavu.
Máme v plánu testování různých havarijních situací. Samozřejmě vše bude pod dozorem odpovědných osob, aby nemohlo dojít k situacím, které by mohly ohrozit chod našich služeb. Některé testy budou probíhat plánovaně a jiné neplánovaně. Následně se vše bude vyhodnocovat, abychom podchytili slabá místa. O všem budeme průběžně informovat.
Pokud chceme být jedničkou na trhu, musíme být připraveni na všechno a vždy.
Napadá někoho ještě něco?
Na co jsme si nevzpomněli? Co byste ještě doporučili a poradili? Nápady, které budeme realizovat, odměníme dárkem.