Statuspagina uitgebreid met doorvoersnelheid en Exact Online metingen

De Invantive statuspagina biedt een overzicht van de status van de meeste Invantive-diensten. Een verkorte weergave is rechtsboven op de forums te zien in de vorm van een stoplichtje. De statuspagina met alle details opent zich door op het stoplichtje te klikken of door te navigeren naar https://status.invantive.com.

De statuspagina is met ingang van 1 december 2021 uitgebreid met een achttal grafieken die een inzage geven in de variaties in de tijd van:

  • de verschillende doorvoersnelheden van Invantive Cloud,
  • de snelheden en betrouwbaarheid van de Exact Online API’s.

De tijdsweergave is in UTC. UTC is op dit moment 1 uur eerder dan Nederland (1 december 2021) en soms 2 uur eerder afhankelijk van zomertijd/wintertijd.

De cijfers worden elk uur bijgewerkt na afloop van het hele uur. De situatie voor het voorgaande uur wordt dan bepaald en getoond. In voorkomende gevallen wordt ook al de verwachte situatie voor de huidige meetperiode tijdstip weergegeven.

Exact Online is als enige platform apart opgenomen omdat circa 60% van de gebruikers hiermee werkt.

Vanaf 1 december zijn de cijfers structureel gemeten. Op basis van historische cijfers zijn de vier weken ervoor zo accuraat mogelijk voorzien van metingen.

Doorvoersnelheden Invantive Cloud

De doorvoersnelheden op Invantive Cloud vallen uit elkaar in vier onderdelen:

  • de downloadsnelheid van een enkelvoudige download gecomprimeerd waarbij de gegevens niet uit OData4 cache komen,
  • de downloadsnelheid van een enkelvoudige download gecomprimeerd waarbij de gegevens wel uit OData4 cache komen,
  • de downloadsnelheid van de verschillende achterliggende (cloud)platformen,
  • de downloadsnelheid van specifiek Exact Online.

De eerste twee metingen worden weergegeven in doorvoersnelheid op het netwerk na compressie. De daadwerkelijke snelheid in bijvoorbeeld Power BI is maximaal het 80-voudige: 8x versnelling door parallelle downloads en 10x versnelling door decompressie.

De downloadsnelheid van de platformen is zonder compressie. De daadwerkelijke snelheid kan ook hier significant hoger liggen doordat bijvoorbeeld losse partities (administraties op Yuki, Exact Online en Twinfield) gelijktijdig benaderd worden en meerdere downloads tegelijk plaatsvinden op een zelfde partitie.

De absolute getallen zeggen in die zin niet alles; een snelheid van 400 KB/sec per stroom gecomprimeerd zoals in onderstaande afbeelding zegt weinig als de daadwerkelijke totale verwerking in Power BI 32 MB/sec is. Echter, variaties langs de tijdsas geven wel trends aan.

Grote pieken rond middernacht geven bijvoorbeeld aan dat relatief snelle en massale downloads dan plaatsvinden:

Deze eerste vier grafieken bevatten uitsluitend metingen over de doorvoersnelheid van Invantive Bridge Online en Invantive App Online, als onderdeel van Invantive Cloud.

Snelheid en betrouwbaarheid Exact Online API’s

De metingen over de Exact Online API’s vallen uiteen in vier onderdelen:

  • de antwoordtijd waarbinnen 95% van alle verzoeken voor een eenvoudige REST API vallen (60 rijen),
  • de antwoordtijd waarbinnen 95% van alle verzoeken voor een volledige pagina (1.000 rijen) van de zogenaamde sync API vallen,
  • de antwoordtijd waarbinnen 95% van alle verzoeken voor mutaties met maximaal 100 rijen op een zogenaamde sync API vallen,
  • de betrouwbaarheid van het ontvangen van een antwoord op een verzoek aan de Exact Online API.

Voor andere kengetallen over de status van Exact Online is er de pagina Hoe vraag ik de status van een Exact Online storing op?.

Alle metingen over de Exact Online-status zijn gebaseerd op geanonimiseerde end-to-end metingen op netwerkdevices die Invantive SQL draaien in combinatie met Exact Online. Dit betreft grote aantallen servers, PC’s, Apple Mac’s en Linux-servers in voornamelijk West-Europa met een brede spreiding qua beschikbare bandbreedte en netwerkvertraging.

95-Percentiel

De eerste drie metingen betreffen het zogenaamde 95-percentiel. Dit is iets anders dan de gemiddelde antwoordtijd. Doordat antwoordtijden niet negatief kunnen zijn, aan de bovenkant beperkt worden door een timeout en er incidenteel grote uitschieters naar boven mogelijk zijn is een gemiddelde en/of standaarddeviatie van de antwoordtijd een minderzeggende waarde.

Vaak wordt in overeenkomsten gekozen om te werken met een limietwaarde waarbinnen een meting moet vallen in een percentage van de gevallen, bijvoorbeeld dat een webpagina in 95% van de gevallen binnen 2,5 seconden opgebouwd is. De 95-percentiel is arbitrair gekozen op basis van ervaring met SLA’s. De Google Core Web Vitals gebruiken bijvoorbeeld weer het 75-percentiel om de waardes te meten.

Antwoordtijd

De 95-percentiel van antwoordtijden zegt in absolute zin niet alles. Als 94% van alle Exact Online API-calls een downloadtijd heeft van 1 ms en de rest van 10 minuten, dan toont de status bij het 95-percentiel 10 minuten. Maar het 95-percentiel is ook 10 minuten als 94% er 9 minuten over doet en de rest 10 minuten. Andere kengetallen kunnen de metingen versterken qua expressiviteit, maar op dit moment is dat niet mogelijk met het gebruikte visualisatietool.

In het algemeen zal een antwoordtijd op een Exact Online API van meer dan 10 seconden onacceptabel lang zijn, vooral als het gaat om gegevens waar een interactieve gebruiker op wacht. En ook hier geldt dat variaties langs de tijdsas trends aangeven.

In onderstaande grafiek is bijvoorbeeld af te lezen in het bovenste plaatje dat het ophalen van een pagina met 1.000 rijen via de Exact Online sync API’s sterk fluctueert qua responsetijden, waarbij pakweg 1 seconde de ondergrens is. Voor deelpagina’s wisselt de situatie in de loop van de dag dramatischer, zoals te zien is aan de relatief hoge piek rond 10 uur:

Betrouwbaarheid

De betrouwbaarheid van het ontvangen van een antwoord op een Exact Online API-verzoek wordt ook in de tijd gemeten.

De betrouwbaarheid varieert sterk, van 10% falende verzoeken tot één op een miljoen. Daarom wordt de betrouwbaarheid uitgedrukt op een logaritmische schaal: een stap omhoog op de betrouwbaarheid betekent een 10x zo kleine kans op een gefaald API-verzoek.

Falen van een Exact Online API-verzoek kan van alles zijn en worden allemaal zwaar gewogen qua status, zoals:

  • een timeout op het netwerk,
  • een foutmelding vanuit de software achter de Exact Online API,
  • een foutmelding van SQL Server software onder Exact Online door het vollopen van de connection pool,
  • een foutmelding door de DNS-server in het bedrijfsnetwerk.

In de onderstaande afbeelding van de status betekent ‘3.9’ dat in de laatste meetperiode 1 op de 8.000 (10^3,9) API-verzoeken faalde (om welke reden dan ook):

Merk op dat de betrouwbaarheid de end-to-end betrouwbaarheid is: vanaf het vragende apparaat via het Internet naar de Exact Online-administraties en volledig terug. De betrouwbaarheid is dus ook afhankelijk van lokale omstandigheden. Als het KPN-Internet 2 minuten down is, dan zullen de meeste gebruikers van Invantive SQL-software dat niet merken door de automatische foutcorrectie, maar het aantal gefaalde API-verzoeken zal door het dak gaan.

Updates

Voor incidenten op componenten is het mogelijk om gratis via de e-mail en SMS op de hoogte te blijven van storingen. Gebruik hiervoor de “Subscribe”-knop.

Het is momenteel niet mogelijk om automatisch geïnformeerd te worden als Invantive Cloud of Exact Online langzaam werkt. Indien dit aanhoudt zal door een Invantive-medewerker dit handmatig beoordeeld moeten worden en omgezet in een incident.