SAP Consultancy

De ervaring van onze medewerkers ligt grotendeels op het gebied van SAP en deze ervaring is opgedaan tijdens intensieve consultancytrajecten bij grote, nationaal en internationaal opererende organisaties.

Hana en het dilemma

Het dilemma
Informatie ligt opgeslagen in de diverse systemen en de huidige technologie stelt ons in staat deze te ontsluiten. Door toename aan informatie, en daaraan gerelateerd de dataopslag, neemt de behoefte naar schijfruimte ook toe. Als voor de groei van de database snelle schijven noodzakelijk zijn, betekent dat dus aanvullende kosten. Het gevolg van groei aan informatie is een toename aan data in de database met als gevolg een toename in de doorlooptijd van de rapportages. Ook vervolgprocessen kunnen nadelig beïnvloed worden.

Globaal gesproken kan de informatie worden verdeeld in twee hoofdgroepen: actieve en passieve data. Actieve data is over het algemeen de meest recente data en wordt gekenmerkt door het veelvuldig bevragen van de opgeslagen informatie. Doordat informatie aangevuld wordt (door het toevoegen van nieuwe cijfers) worden de opgeslagen data op de langere termijn minder relevant. Hierdoor krijgen de opgeslagen data meer en meer het karakter van historische data of passieve data. Passieve data worden dus gekenmerkt door weinig tot niet meer bevragen. Daar deze data wel onderdeel uitmaken van de database, worden bij het uitvoeren van een raadpleging op de database de data opgehaald, maar niet gebruikt. De raadpleegtijd op de database wordt verlengd, waardoor het kan lijken dat het uitvoeren van een rapport langer duurt, terwijl het datadeel (actieve data) wel gelijk is gebleven. Als er voor BW-systemen ook gebruik gemaakt wordt van een accelerator, worden alle data opgeslagen op de accelerato, hetgeen een onnodige belasting op de resources van de accelerator is.

Wat te doen?
Het zorgen voor een fysieke splitsing tussen passieve en actieve data is een strategie om in ieder geval rapportages weer sneller te maken. Het goed opzetten van een splitsing kan ook een positief effect hebben op het gedrag van de accelerator, omdat dan alleen de actieve data naar de accelerator gaan. Als we in staat zijn de passieve data buiten de database te parkeren, heeft dat ook nog een positief effect op de groei van de database. Een nadelig effect ontstaat als we de ‘geparkeerde’ data wel moeten bewaren. Er is dan wel storage, maar er zijn geen dure databaseschijven nodig.

Het buiten de database plaatsen, kan door het zogenaamd archiveren, wat standaard aanwezig is in SAP. Tijdens het archiveren worden bestanden aangemaakt in een directory, waarbij de data uit de database verdwijnen. Voor BW zitten hier wel kanttekeningen aan. Als structuren wijzigen (gebeurt niet vaak), zijn deze wijzigingen niet van toepassing op data die al zijn gearchiveerd. Het raadplegen van deze archieven verloopt dan ook moeizaam of zij kunnen zelfs helemaal niet meer geraadpleegd worden. Een ander nadeel van archiveren kan zijn dat het langer duurt voor de passieve data weer gelezen is, daar de data als bestanden zijn opgeslagen en niet vanuit een database worden geraadpleegd. Vanwege dit soort problemen wordt archiveren in BW bijna niet gedaan.

Een flexibel alternatief door het gebruik van nearline storage
Het concept blijft hetzelfde: maak gebruik van archiveertechnologie die in SAP aanwezig is, maar schrijf deze weg naar een separate database die de gearchiveerde data kan opvangen. Dit is gebaseerd op de kenmerken van de bestaande structuren in de BW-omgeving. Door een RFC-koppeling blijven data gemakkelijk en snel te benaderen. Een goede database is Sybase IQ, die vanwege zijn eigenschappen in staat is de data gecomprimeerd op te slaan. Hierbij wordt ‘terugkomende’ data vervangen door één kenmerk, zodat een reductie tot wel 80 % kan plaatsvinden (afhankelijk van datakenmerk en datavolume). In het geval dat een infocube wordt gewijzigd (toevoegen van kenmerken / velden), kunnen eerst de data worden ingeladen in de oorspronkelijke structuur. Vervolgens kan dan de mutatie worden doorgevoerd en tot slot kan deze weer opnieuw worden gearchiveerd.

Als gevolg van het flexibel kunnen archiveren en het in een nearline storage omgeving beschikbaar hebben van de data, komen de eerder genoemde nadelen te vervallen. Door het verwijderen van de passieve data worden de infocubes in een BWA / BIA ook kleiner, waardoor ook daar weer ruimte en resources gespaard worden. Hierdoor kunnen nu meer infocubes beschikbaar worden gesteld, waardoor het BWA / BIA proces meer mogelijkheden geeft voor andere business functionaliteiten.

SAP Consultancy | Hana en het dilemma | Newitera