Zo schoont u uw cloud-data op

archief

Artikelgereedschap

Gepubliceerd: Donderdag 17 november 2011
Auteur: David Taber

Bij in-house systemen is het niet meer nodig om over disk space te denken. In de cloud is dat een heel ander verhaal.

Jaar na jaar zijn de kosten voor diskruimte gedaald. Nu u voor een paar tientjes een terabyte kunt aanschaffen, lijkt het niet langer nodig om voorzichtig te zijn met storage.

Maar in de cloud zijn de regels anders. Als u te veel laagwaardige data heeft of te veel kopieën van dezelfde bestanden, kan u dat op twee manieren geld kosten.

In de eerste plaats zijn er de maandelijkse storage-kosten. En in de tweede plaats gaat onnodige data ten koste van de performance, bijvoorbeeld bij zoekopdrachten en updates. In de cloud loont het dus nog de moeite om uw dataset schoon te houden.

Documenten

Wilt u de data in de cloud opschonen, dan moet u eerst vaststellen om wat voor data het gaat. Documenten zijn bijvoorbeeld gekoppeld aan records (zoals een pdf van een ondertekend contract aan de relevanter gebeurtenis). Dat betekent dat gebruikers ze vaak niet makkelijk kunnen vinden. Ook zijn documenten vaak aan verschillende records gekoppeld.

Daarnaast loont het de moeite om te kijken naar opgeslagen versies van documenten. Sommige mensen slaan alle versies van een snel veranderend document elke keer op.

Het eerste wat u moet doen is dus een export maken van de lijst van opgeslagen documenten in het systeem. Kijk naar mogelijke duplicaten met behulp van spreadsheet filters en duplicate file detection tools.

Table data

Voor table data geldt weer een heel ander verhaal. Er zijn verschillende oplossingen voor verschillende soorten clouds. Dat gezegd hebbende moet u ongeveer aan de volgende workflow denken:

- Stel vast welke cloud-systemen een storage-probleem hebben. Sommige systemen (zoals van accounting) kunnen niet echt opgeschoond worden, omdat de data voor langere tijd bewaard moeten blijven. Andere systemen (marketing, log analytics) kunnen heel snel vollopen met enorme hoeveelheden details die het systeem vertragen.

- Stel vast welke tables meer dan 20 procent van de totale storage consumeren en focus daarop.

- Bekijk de waarde voor elke table. Sommige tables (accounts of contracten) moeten ongeschonden blijven, terwijl andere tables (anonieme leads in een marketing-systeem) makkelijk weg kunnen.

- Maak wel eerst een backup van alle cloud-data. Dit is niet optioneel maar verplicht.

- Bij de tables die kunnen worden opgeschoond, moet u kijken naar de 'signal to noise ratio'. Moeten we echt opslaan welke anonieme bezoeker al zes maanden niet meer op de site is geweest? Heeft het zin om leads met een score lager dan 0 te bewaren? Zorg wel dat degenen die gebruikmaken van de data, akkoord zijn met uw opschoonactie.

- Sommige tables kunnen in hoog tempo duplicaten verzamelen. Gebruik een voor uw cloud geschikte tool om die duplicaten te verwijderen.

Reacties

blog comments powered by Disqus

Masterclass CIO as Strategist, Nyenrode, 20 juni 2012.
Schrijf u nu in!

De zeer succesvol verlopen CIO Summit 2012.

Nieuwsbrief

Blijf altijd op de hoogte van het laatste ICT-nieuws