A héten meglátogattam cégünk legnagyobb európai alkatrészraktárát.
A héten meglátogattam cégünk legnagyobb európai alkatrészraktárát.
A raktár fantasztikus volt: a 90000 m2 alapterületű raktár felelős egész Európa ellátásáért. Ez konkrétan 350000 különféle alkatrészt jelent. 200 fős személyzet gondoskodik róla, hogy napi 24 órában történjenek a kiszállítások és bevételezések.
Ami különösen inpozáns volt: a bejárat melletti tábla szerint az utolsó baleset 2005 közepén történt.
Na és mikor történt az utolsó informatikai „baleset”?
A hétvégén. Két adatbázis hiba lépett fel, az egyik kritikus volt, a másik kevésbé. A Helpdesk hívta az ügyeletben lévő DBA-t, de nem sikerült elérni. Egy idő múlva a DBA észrevette a hívást és visszahívta a HD-t – akik összekeverték a két esetet, és a kevésbé fontosat vették elő. A DBA mérges lett, hogy miért hívják hétvégén egy lényegtelen üggyel, és lerakta a telefont.
Mire tisztázódott a félreértés, vasárnap este lett. Igen ám, csak közben a VPN eléréssel történt valami, és a DBA nem tudta elérni a belső hálózatot.
Úgyhogy hétfő reggelre nem sikerült kiállítani a számlákat, és a 200 ember (plusz a kamionok) 1 órát álltak, mire a szakértő beautózott és megjavította a hibát.
Ha már hibánál tartunk…
Az év eleje valami miatt elég zűrösen alakult. Volt vagy 10 batch job hibánk, amiket kb 3 hétig tartott kitakarítani. Az üzleti oldal szerint a hibák nagyjából 600k EUR veszteséget okoztak. Nem beszélve arról, hogy a fejlesztéseink sem haladtak ezen idő alatt.
Öröm az ürömben, hogy a hibákra sikerült hosszú távú megoldást találni, nem fognak újra visszajönni. De mindenképpen el kell gondolkodni, hogyan tudnánk csökkenteni a hibákat, és hogyan tudnánk egy ilyen eseményt gyorsabban lekezelni.
Utolsó kommentek