fbpx

Skip links

To steg til å redusere løsningstid med moderne monitorering

Se for deg at du er på en middag med venner og mottar et varsel på mobilen om at ditt favorittlag er i ferd med å vinne for første gang på lenge. Du fyrer opp mobilappen for å se de siste fem minuttene live, bare for å motta en kort melding:

«Tjenesten er ikke tilgjengelig, vennligst prøv igjen»

For den motsatte siden er meldingen like frustrerende – det kalles inn til krisemøte i IT-avdelingen, og generalene samles. Teamet møtes i kommandorommet – fysisk eller virtuelt – og klokken tikker.

Tjenesteeieren roper at brukerne ikke får sett kampen..

Applikasjonsteamet kan se at tjenesten er oppe og at brukere er oppkoblet..

Nettverksovervåkingen viser grønt og alt i orden..

Infrastrukturteamet sier at deres tjenester fungerer normalt og det er det samme svaret uansett hvem du spør. Akkurat som en vannmelon – alt viser grønt på utsiden og rødt på innsiden.

Virksomheter har to måter å tjene penger: selge fler varer, eller redusere kostnadene. En hendelse som omfatter kritiske applikasjoner påvirker begge disse, og for hver time en kritisk tjeneste er nede taper virksomheten penger ­– ofte MYE penger.

Så hvorfor ble det sånn?

Kommandorom har sin opprinnelse i militæret, og mange prosesser for håndtering av hendelser ble etablert lang tid tilbake i tid. Utfordringen vi ser i mange organisasjoner er også tilstede i militæret, som har adressert dette med et konsept de kaller «Multi-domain battle» (MDB). MDB bruker fem domener i en samlet innsats: luft, sjø, land, verdensrommet og «cyber space». For at MDB skulle fungere, måtte militæret fjerne snevre domenetankesett.

For ikke-militære folk som meg er domenetankesettet at når en krise oppstår på land, er det hæren som anses å eie det domenet og som skal respondere. Hvis en krise oppstår til havs, er det marinen som anses å eie domenet og et skip eller en ubåt involveres.

Tenk deg at en hær skyter ned et missil som er avfyrt mot et fly, og flyet hadde tatt av fra et skip. Hæren har løst domenetankesettet gjennom samhandling og innsikt. Dette er tilsvarende mange av de utfordringene som virksomheter møter i dag. Hvis hæren kan få flere domener til å samhandle, burde vi kunne få til det samme i et IT kommandorom.

Du kan redusere tiden det tar å løse et problem med moderne monitorering

En moderne IT driftsplattform gjør det mulig for IT-organisasjonen å bruke de samme prinsippene som i hærens MDB metode. Moderne IT-drift har fire nøkkelkomponenter som gir samhandling og innsyn

  1. Undersøke: Innsikt i logger og måleparametre
  2. Monitorere: Innsyn i applikasjoner, containere, IT-infrastruktur og nettverk
  3. Analysere: Tjenester og hendelser
  4. Reagere: Samhandle, AIOps, prediksjon og orkestrering

Samhandling

Det første steget er å bryte ned siloer for å samhandle og lære, gjøre det mulig for team å jobbe på tvers av organisasjonens strukturer, og samle nødvendig informasjon for å finne gode løsninger.

En av de beste måtene å samhandle på, er å sikre at alle jobber ut fra de samme dataene, men kan se de ut fra sin egen kontekst. At nettverks-teamet ser de samme dataene som applikasjonsteamet. Begge teamene ser på de samme dataene med sitt perspektiv for å finne ut om en hendelse påvirker ytelse, tilgang eller kundeopplevelsen. Det viktigste er at dette gjør at alle har samme forståelsen. Vi sparer tid og stress knyttet til å forstå hvem som har den rette informasjonen. Du har med dette erstattet stress med data som kan virke i parallell for å finne og løse problemet – og med det blidgjøre brukere, kunder og bunnlinjen i virksomheten!

Et tilbakeblikk på hendelsen i kommandorommet da fotballsendingen gikk i svart

Før hendelsen inntraff, hadde selskapet en tradisjonell løsning for applikasjonsovervåking som ikke var i stand til å se tilgjengeligheten av tjenesten fra brukerens ståsted (ende til ende). Dette er et eksempel på silo-monitorering der hvert team overvåker sine komponenter. Uheldigvis har denne fremgangsmåten begrensninger om gir en falsk tilstandsrapport rundt tilgjengelighet av en tjeneste og begrenser muligheten for samhandling når feil oppstår. Med en moderne monitorerings-plattform kan applikasjonsteamet ha innsikt i firewall og sikkerhetsdata og være i stand til å se feil relatert til applikasjonen tidligere. De kan redusere MTTR ved å tilby innsikt i hele kjeden involvert i å produsere en tjeneste, og gjennomføre en samlet analyse for å identifisere problemet raskere.

Innsyn

Det første steget er å bryte ned siloer for å samhandle og lære, gjøre det mulig for team å jobbe på tvers av organisasjonens strukturer, og samle nødvendig informasjon for å finne gode løsninger.

Svarene skjuler seg i siloene, men kan du finne dem? Det andre steget er å tilby ende-til ende innsyn i hvordan en tjeneste fungerer.

For å identifisere problemet raskt må teamet ha en moderne monitorerings-plattform med datadrevet tjenesteintelligens. Når en applikasjon eller tjeneste er nede, kan du raskt identifisere de riktige områdene å fokusere på.

Et godt eksempel er en kommandorom-hendelse som hadde pågått i tre dager og som involverte full driftsstans for virksomhetens CRM-system. De hadde en mengde overvåkings-skjermer og operatører som så på ulike komponenter og avhengigheter i CRM-systemet. Telefonkonferanser pågikk og tredjepart support var involvert. Det ble jobbet frenetisk – «Ping server XYZ. Hva er responsen?». Informasjon ble journalført i Notepad og konklusjonen var at det måtte være noe med applikasjonen. Med så mange ledd, gamle applikasjoner og avhengigheter, greide de ikke å finne ut hva som var galt. I dette tilfellet var det ingen feil ved selve applikasjonen.

Datadrevet tjenesteintelligens gir nødvendig klarhet for å kunne løse problemer. I dette tilfellet var problemet i databasen. Tre dager bortkastet feilsøking på applikasjonsnivå kunne vært unngått, for ikke å snakke om kostnadene for virksomheten.

Unngå krisemøter gjennom innsyn og samhandling

Kunstig intelligens for IT Operations (AIOps) reduserer antall hendelser som leder til IT kommandorom. Kanskje du en dag kan kvitte deg med dem. Når vi vet at en gjennomsnittlig kritisk applikasjonsfeil kan koste millioner pr time, er det essensielt å redusere løsningstiden (MTTR) når kritiske feil oppstår. Virksomheter kan bruke moderne IT driftsplattformer for å redusere IT og bevege seg oppover IT modenhetskurven og bort fra tradisjonelt silotankesett i IT.

Vil du vite mer om hvordan du kan bruke moderne teknologi for å oppnå målet om samhandling og innsyn?

Last ned whitepaper Lær mer om Splunk