A deduplikáció a tárolási források étrendje

  • Kövess minket
    • Hírlevél
    • szilícium kb
    • Xing
    • LinkedIn
    • Twitter
    • Facebook
    • RSS csatorna
    • Google Play kioszk
  • Hírlevelek
  • Belépés

A régi történet így hangzik: A növekvő adatmennyiség siránkozása helyett jó lenne, ha a lényegre lehetne csökkenteni. A deduplikáció képes erre.

források

Olyan, mint a fogyókúra. A fontnak le kell mennie, a tömegnek mennie kell. A sikeres fogyókúrás étrendet az étrend fontos és felesleges összetevőinek hozzáadása jellemzi. Amire a testnek szüksége van, az megkapja, de semmi több. Csak így lehet fogyni, az eredmény pedig kevesebb teltség. Az adatközpontban alapvetően nincs ez másként. A különféle forrásokból származó adatok robbanó tömege megduzzasztja a tárolási területet. Új ételeket adunk hozzá minden nap bitek és bájtok formájában. Kisebb költségvetés idején az adminisztrátornak nem először nagyobb kapacitásokra kell gondolnia, hanem hatékonyabb tárolási módszerekre.

A nagy mennyiségű információ a mentést is hangsúlyozza. A napi vagy akár óránkénti adatmentés időkerete kicsi, és mégis egyre több információt kell biztonságos területekre vinni. Ezt aligha lehet kibékíteni. A következő lépésben az adminisztrátor emlékezik az archívumra is, amely menthetetlenül duzzad, és az adatáradat csökkentését is felhasználhatja.

Tehát annak, aminek történnie kell, végső soron nagyon egyszerű - elméletileg: Ha a termelésben lévő adatok mennyiségét nem lehet csökkenteni, akkor legalább a biztonsági másolatok és archívumok mennyiségének csökkentenie kell. Mind a felhasználókat, mind az alkalmazásokat kevesebb adat előállítására lehet kényszeríteni. Nem kell tovább beszélni róla, nem működik, főleg, hogy a vállalatok a hatékonyság érdekében egyre inkább digitálisan kezelik az üzleti folyamatokat. Egy ideje, és legutóbb az Avamar ‘Dedupe’ szakorvosának az EMC általi átvételekor az egyik módszer legalább enyhítést nyújtott: deduplikáció.

A redundáns adatok átesnek a repedéseken

Egyszerűen fogalmazva, a deduplikáció olyan technológia, amely soha nem tárolja az adatokat kétszer. A módszer összehasonlítja a menteni kívánt adatkészletet, fájlokat vagy adattömböket a már tárolt információkkal. Redundáns fájlok vagy adatblokkok azonosítása esetén a Dedupe megoldás az újonnan kapott adatrekordot úgynevezett referenciamutatókkal látja el a duplikálás helyén. A már elmentett sorrendre hivatkoznak, és kevesebb helyet foglalnak, mint az eredeti adatok. Az újonnan hozzáadott adatrekord ennélfogva kisebb, mivel kevesebb információt kell újból elmenteni.

Példa: deduplikáció nélkül a következő dalt újra és újra el kell menteni minden versnél:

A falon, a kilátón, ül egy kis hiba.
Vessen egy pillantást a hibára, mintha a hiba táncolni tudna.
A falon, a kilátón, ül egy kis hiba.

Mint ismeretes, az énekesnő a „Wanze” és a Tanz, tehát a Wanz ’, a Wan’, a tánc ’, a„ tan ”stb. Szavakból minden versével egy levelet hagy ki. Deduplikációval a dal fő része már el van tárolva, csak az új, megváltozott feltételek kerülnek hozzáadásra. Ha egy alkalmazás vagy egy felhasználó meghatározott adatkészletet igényel, akkor azt először a megfelelő szoftver állítja össze és teljes készletként szállítja.

Ez kissé úgy hangzik, mint az adatok tömörítése. Az összehasonlítás megengedett, de a tömörítési technikák nem képesek lépést tartani a deduplikációval. A legtöbb esetben a tömörítési arány 2: 1, ami azt jelenti, hogy az adatbázis körülbelül felére csökkenthető. Az Adic - a gyártót a Quantum vette át - azt mondja, hogy deduplikációval akár 40-szer több tárhely áll rendelkezésre a lemez biztonsági mentéséhez. „Korábban csak néhány napos adatokat tudott lemezre helyezni. Most a hónapok beleférnek ”- mondta Steve Mackey, a Quantum EMEA termékmarketing-igazgatója a Dedupe Dxi-sorozat termékpalettájának bemutatóján. Az Avamar még a 300: 1 arány csökkenéséről is beszél. A gyártó szerint a számítás azon adatok mennyiségén alapul, amelyeket naponta tárolnak "teljes biztonsági mentésként".

Dedupe a forrásnál vagy a rendeltetési helyen?

Több gyártó, többféle megközelítés. Egyszerre nem térnek el a vélemények arról, hogy mi a deduplikáció. Ahol azonban a folyamatnak meg kell történnie, a különböző megközelítések gyártói megvannak a saját érveik, amelyeket meg kell erősíteni.