Cachen van OData-cache in Azure Data Factory

svg · 14 februari 2024 om 15:46

Is het mogelijk om de OData-cache in Azure Data Factory te cachen, zodat het aantal API-calls verlaagd kunnen worden?
Dit zal als het goed is de performance verhogen, correct?

Als het mogelijk is, heeft iemand een tutorial over hoe je dit in Azure Data Factory moet doen?

forums · 14 februari 2024 om 16:19

Het lukt niet om de vraag eenduidig te interpreteren.

Is het mogelijk meer context te schetsen en wat het probleem is?

svg · 15 februari 2024 om 07:49

We willen (denk ik) de Verse Duur tijd in Invantive Cloud verlagen (als dit mogelijk is).

In Azure Data Factory merken we ook dat het ophalen van data bij sommige OData endpoints langer zijn dan bij anderen. Zie onderstaand bijvoorbeeld:

Dit willen we graag optimaliseren. Tijdens het Googlen kwam ik het zogenaamde ‘API Caching’ (of OData Data Caching). We spreken namelijk vaker hetzelfde endpoint aan (bij verschillende databases).

Of zit ik helemaal verkeerd te denken en moet ik meer richting metadata-caching denken?

forums · 15 februari 2024 om 09:27

Het lukt niet om te begrijpen wat de context en situatie is.

Is het mogelijk om een uitgebreide situatieschets, probleemomschrijving en gedachte oplossingsrichting te beschrijven?

svg · 15 februari 2024 om 09:55

Ik zal hier later nog op terugkomen. Ik ga wel eerst proberen om het probleem/de context te schetsen.

svg · 15 februari 2024 om 12:12

Ik denk dat ik het probleem kan formuleren:

Tijdens development kan het zijn dat wij op één dag vaker de tabel ExactOnlineREST.Incremental.TransactionLinesIncremental@eol moeten binnenhalen via Azure Data Factory. Deze tabel (ofja, view) is voor veel administraties groot. Iedere keer weer kost dit resources binnen Invantive, als ik het goed heb.

Is het mogelijk om deze tabel op een of andere manier ergens te ‘cachen’, zodat niet alle data/verbindingen bij iedere nieuwe load opnieuw aangevraagd moet worden?

Is dit duidelijker?

svg · 15 februari 2024 om 15:15

Tevens voor het optimaliseren (en voorkomen) van de volgende melding:

forums · 16 februari 2024 om 09:33

Advies is om de standaard caching faciliteiten van PowerBI-platform te gebruiken zoals een shared data set op PowerBI of opslag in een omgeving (bestand, database).

Daarnaast kan het voor development handig zijn om de omvang van de dataset te beperken cq. de frequentie te beperken als een volledig set nodig is.

Tenslotte kan als alternatief een on-premises oplossing gebruikt worden van Invantive.

Hoe groot is de volledige dataset?

svg · 19 februari 2024 om 07:51

De grootte van de totale dataset varieert. Bij sommige administraties zijn het duizenden rijen, bij sommige drie- tot vierhonderdduizend rijen (voor Incremental.TransactionLinesIncremental). Deze worden voornamelijk ook incrementeel in Azure Data Factory ingeladen.

Tijdens het inladen van een nieuwe administratie in Data Factory, wordt bij de eerste load de volledige dataset ingeladen, vervolgens wordt de incrementele datastroom aangezet.

Als op een dag de Incremental.TransactionLinesIncremental tabel vaker moet worden ingeladen, zonder cache, kost dit veel resources. Vandaar de vraag of deze tabel ergens gecacht kan worden, zodat de hoeveelheid resources verlaagd kan worden.

forums · 29 februari 2024 om 14:31

Hoe werkt een “incrementele datastroom” op Azure Data Factory (URL naar documentatie)? Er zijn meerdere variaties denkbaar.

Binnen Invantive Bridge Online wordt van de *Incremental-tabellen altijd een cache vastgehouden, die in combinatie met gemuteerde rijen leidt tot een nieuwe versie.

Het datavolume kan beperkt worden door aantal kolommen te beperken, en door te zorgen dat compressie aanstaat bij het OData-verzoek (standaard HTTP-compressie scheelt tot factor 10 en OData4-compressie met OmitValues=ODataOmitValues.Nulls zoals beschreven in Vermijd time-out fout bij Power BI OData download scheelt tussen de 15% en 98%).

svg · 29 februari 2024 om 15:26

Dus als ik het goed begrijp kan ik met OData query’s de grootte van een dataset verkleinen door specifieke kolommen op te vragen vanuit Azure Data Factory?

Hoelang wordt de cache van een Incremental-tabel vastgehouden in Invantive?

forums · 29 februari 2024 om 16:26

Ja, de grootte van een dataset (tijdens overdracht) kan beperkt worden door:

minder (gevulde) kolommen,
minder rijen,
slimmer transporteren.

De cache van een *Incremental-tabel heeft vanuit de Exact Online-architectuur een levensduur van maximaal een aantal weken.

svg · 1 maart 2024 om 15:27

Top om te lezen!

Minder kolommen en rijen is duidelijk. Wat bedoelen jullie met slimmer transporteren?

forums · 2 maart 2024 om 12:17

“Slimmer transporteren” staat voor reeks van technieken om zonder kwaliteitsverlies of met beperkt kwaliteitsverlies dezelfde informatie van A naar B te krijgen. Bijvoorbeeld JPEG-encoding in plaats van raw voor foto’s of overwegend delta frames in video.

Binnen OData is het laaghangend fruit gebruik van compressie op HTTP en weglaten null values zoals eerder beschreven. Maar ook delta’s kan afhankelijk van de situatie, evenals andere engineering technieken. Op Internet zijn via Google veel voorbeelden te vinden van dergelijke technieken.

system · 9 maart 2024 om 12:17

Dit topic is 7 dagen na het laatste antwoord automatisch gesloten. Nieuwe antwoorden zijn niet meer toegestaan.

Topic		Antwoorden	Weergaven
Differentieer OData4 cachegedrag met Power BI Wiki invantive-cloud , power-bi , odata , power-query	0	1396	6 april 2022
Azure Data Factory Errors met gebruik OData Invantive Vragen exact-online , azure-data-factory	17	33	25 september 2024
Filteren data bij laden in Azure Data Factory Vragen azure-data-factory	4	617	11 april 2024
Sneller data verwerken uit Invantive Cloud op geselecteerde OData-clients Wiki performance , invantive-cloud , power-bi	0	606	4 november 2021
Upload eigen queries via OData of andere connectie naar Azure Data Factory Vragen teamleader-focus , invantive-cloud , azure-data-factory	3	824	11 april 2024

Cachen van OData-cache in Azure Data Factory

Gerelateerde topics