Vannacht zijn alle klanten bij ons niet geladen. We kregen in de trace:
A web exception occurred during communication with Customer Service: System.Net.WebException: The remote server returned an error: (503) Server Unavailable.
Is er vannacht een probleem geweest met het ophalen van de licentieinformatie vanaf jullie servers? Alle processen zijn gestopt voordat er uberhaupt gestart werd met logging naar de logfile. Of moet ik dit ergens anders zoeken?
Gisteravond is een upgrade van Customer Service geplaatst. Deze is circa 1 uur uit de lucht geweest. Advies is om in geval van onbeschikbaarheid van de Invantive infrastructuur buiten kantooruren een voorziening te treffen om het later nogmaals te proberen.
Een 503 melding is een melding van voorbijgaande aard. Meer tips over de omgang met dit soort meldingen is te vinden vanaf bijvoorbeeld 503 Service Unavailable - HTTP | MDN.
De komende weken zullen regelmatig na kantooruren upgrades plaatsvinden op grote delen van de infrastructuur, e.e.a. afhankelijk of en hoe Exact Online de API-wijzigingen gaat doorvoeren.
Hoe kunnen we deze meldingen voorkomen? We doen deze calls niet zelf, de software doet deze onderliggende calls automatisch. Worden deze responscodes überhaupt teruggegeven door Data Hub aan het besturingssysteem? Of zouden we het dan moeten retryen als de software binnen een bepaalde tijdsduur na de start direct afsluit, of zoiets arbitrairs?
Dit betreft een storing in een infrastructuurcomponent tussen gisteravond 22:00 en vanochtend 9 uur, zie https://status.invantive.com/:
Jul 8, 2021 Infrastructure component down Resolved - The incident has been resolved. It was caused by system maintenance not correctly an exceptional condition. Changes will be implemented today to avoid it from recurring again.
Jul 8, 09:00 CEST Investigating - Applications are responding slowly or displaying errors due to an Invantive infrastructure being down.
Jul 8, 08:51 CEST
Er zijn geen mogelijkheden om dit te voorkomen. Vanuit Invantive proberen we storingen te vermijden, maar helaas is het gecontroleerd in productienemen erg lastig door wijzigingen op een van de verbonden cloudplatformen die niet vooraf te testen waren. Dit probleem zal naar verwachting nog enkele maanden leiden tot storingen.