Infrastrukturhendelse - driftsavbrudd for flere tjenester

Incident Report for Norsk helsenett

Postmortem

Søndag 01. Mars opplevde vi en alvorlig hendelse i et av våre primære datasenter.
Klokken 15:21 kom det alarmer til vårt operasjonssenter, som medførte utkalling av flere bakvakter. Denne feilen eskalerte fort og klokken 15:30 eskalerte de hendelsen og startet utkalling av flere ressurser, samt. satte i gang et incident response team.

Det blir videre tydelig at vi har en infrastruktur-hendelse som påvirker et helt datasenter, og det er et datasenter hvor vi kjører flere viktige tjenester. Hendelsen påvirker også management-systemer, overvåkingssystemer og tilganger til servere -noe som gjør håndteringen utfordrende.

Flere tjenester har geografisk redundans og begynner arbeid for å flytte over til annet datasenter ihht. rutinene sine.

Rotårsaken til feilen er ikke åpenbar, og man benytter tid på å feilsøke. Feilen gir mye loggstøy og det er ikke enkelt å skille symptom fra rotårsak. Man følger flere teorier som viser seg å være konsekvenser av feilen før man kommer frem til at problemet virker å ligge på en av brannmurnodene.
Klokken 17:10 utfører man tiltak som har umiddelbar effekt. En konsekvens av det tiltaket er at det vanskeliggjør leting etter rotårsak, og man jobber videre med dette mens tjenester stabiliserer seg.
Klokken 18:30 er det aller meste tilbake i normal drift og ressurser som har verifisert tjenester under sine ansvarsområder som OK, dimitteres fortløpende.

Rotårsaken er på tidspunktet fortsatt ikke konkludert, men man har teorier og kobler på leverandør for å ettergå disse nærmere.
Etter mye feilsøking konkluderer man rotårsaken som en bug i brannmur-software, dette skjer sent på dagen tirsdag 03.03.2026.
Som følge av det utføres det hasteendringer på alle NHNs brannmurer de 3 påfølgende dagene, og vi anser hendelsen som løst.

Posted Mar 10, 2026 - 15:07 CET

Resolved

Hendelsen er løst.

Posted Mar 03, 2026 - 08:40 CET

Update

Tiltakene har hatt ønsket effekt.
Klokken 14:43 oppsto det en feil i vår infrastruktur. Denne feilen forverret seg gradvis og førte fra ca. klokken 15:15 til nedetid for flere av våre tjenester. Feilrettende tiltak ble utført kl. 17:20. De fleste tjenester stabiliserte seg i løpet av kort tid etter dette. Konsekvens og varighet for tjenester kan variere noe.

Posted Mar 01, 2026 - 19:42 CET

Monitoring

Vi har utført feilrettende tiltak og berørte tjenester skal nå virke som normalt. Rotårsak til feilen er ikke kjent, så vi beholder økt bemanning for å kunne respondere raskt dersom vi ser indikasjoner på ytterligere problemer.

Posted Mar 01, 2026 - 17:30 CET

Update

Vi jobber fremdeles med feilsøking knyttet til denne hendelsen. Vi kommer tilbake med ytterligere informasjon så snart det lar seg gjøre.

Posted Mar 01, 2026 - 16:55 CET

Update

Vi jobber fremdeles med feilsøking knyttet til denne hendelsen. Vi kommer tilbake med ytterligere informasjon så snart det lar seg gjøre.

Posted Mar 01, 2026 - 16:53 CET

Update

Feilsøking pågår og alle tilgjengelige ressurser er aktivert for feilsøking.

Posted Mar 01, 2026 - 16:35 CET

Update

Vi jobber fremdeles med feilsøking knyttet til denne hendelsen. Vi kommer fortløpende til å oppdatere denne varslingen med berørte tjenester.

Posted Mar 01, 2026 - 16:17 CET

Investigating

Saksnummer: 506144
Vi opplever for tiden problemer med en sentral infrastruktur-tjeneste. Dette medfører feil og nedetid for flere av våre andre tjenester. Feilsøking pågår.

Posted Mar 01, 2026 - 15:52 CET

This incident affected: Helsenorge, HelseID, Reseptformidleren, Grunndata og register (Adresseregisteret (AR), Communication Party API, CPPA, Fastlegeregisteret (FLR), Persontjenesten, RESH), Kjernejournal (Kjernejournal portal, Pasientens journaldokumenter), Medisinske kvalitetsregistre (eReg (elektronisk registerløsning), FALK (Felles autentisering for kvalitetsregistre), MRS (Medisinsk registreringssystem), QReg (OpenQReg), Rapporteket), Helsenettet (Hjemmekontor 2.0), and Pasientreiser (NISSY).