Odhalenie výkonu: Oracle Exadata a hybridná stĺpcová kompresia
14.04.2012 15:37Hybridná stĺpcová kompresia (HCC) v Oracle Exadata Machine je kompresná technológia poskytujúca obrovské úspory úložnej kapacity. Okrem toho prináša v dôsledku zníženia počtu I/O operácií revolučnú akceleráciu výkonu.
HCC je optimalizovaná pre databázy aj úložný priestor. Priemerné úspory sa môžu pohybovať v 10-násobkoch v závislosti od stupňa kompresie. Reálne úspory zákazníkov využívajúcich HCC sa však pohybujú až v 100-násobkoch. Už s priemernými 10-násobnými úsporami môžu IT manažéri na niekoľko rokov výrazne znížiť alebo eliminovať potrebu nákupu nových dátových úložísk.
Napr. 100 TB databázu možno zmenšiť iba na 10 TB fyzickej pamäte. 90 TB voľného miesta možno využiť na uloženie ďalších 9-tich databáz, alebo na oddialenie potreby nákupu nových dátových úložísk. Hybridná stĺpcová kompresia je technológiou umožňujúcou ako kompresiu dátových skladov tak aj archívnu kompresiu.
Hybridná stĺpcová kompresia
Dáta sú tradične organizované v rámci databázových blokov v rade. Všetky dáta jedného stĺpca a zodpovedajúceho riadku sa ukladajú sekvenčne do takýchto databázových blokov. Ak sú dáta komprimované a uložené v stĺpcovom formáte, možno výrazne šetriť úložným priestorom. Ukladanie dát takýmto spôsobom však môže negatívne ovplyvniť výkon databázy a to najmä v príp. ak sa pristupuje k viac ako jednému alebo dvom stĺpcom.
Hybridná stĺpcová kompresná technológia predstavuje novú metódu pre usporiadanie dát v databázovom bloku. Ako názov napovedá, táto technológia využíva kombináciu oboch, riadkovej a stĺpcovej metódy pre ukladanie dát. Týmto hybridným prístupom možno dosiahnuť kompresných výhod stĺpcového ukladania dát bez funkčných nedostatkov jej vl astných. Princíp fungovania Hybridnej stĺpcovej kompresie objasňuje nasledovné video:
Logická konštrukcia nazývaná tiež kompresná jednotka sa používa na uloženie súboru hybridných komprimovaných stĺpcových riadkov. Pri načítaní dát, sa zoskupia hodnoty obsiahnuté v stĺpcoch a skomprimujú sa. Následne sa uložia v kompresnej jednotke. Údaje zaslané späť na databázový server sú obvykle skomprimované (a predstavujú oveľa menšie dáta, ako v príp. čítania z disku). Takto skomprimované dáta sú následne spracované databázovým serverom. Treba mať na pamäti, že dáta ostávajú komprimované nielen na disku, ale tiež vo vyrovnávacej pamäti Smart Flash Cache. Hybridná stĺpcová kompresia je vítanou pomocou najmä v príp. dátových skladov, kedy majú tabuľky stovky stĺpcov.
Kompresia dátových skladov
Dátové sklady získali vo firmách s postupom času na svojej dôležitosti.
Sú potrebné na ukladanie obrovského množstvo dát, pričom tie následne transformujú do podoby strategických informácií. Ako sa význam dátových skladov zväčšoval, o to viac sa zväčšilo aj množstvo spracovávaných dát. Objemy dát sa často krát zdvojnásobujú každé dva roky a IT manažéri sa neraz stretávajú so značnými problémami. Pýtajú sa, ako možno udržať náklady na skladovanie a aplikačný výkon dopytov na dobrej úrovni? Riešenie pre oba problémy poskytuje práve kompresia dátových skladov. Mnohé aplikácie dátových skladov sú výkonovo obmedzované z dôvodu nárastu objemu dát. Analytické dopyty skenujú stovky gigabajtov ak nie terabajtov dát. Tie sú súčasťou úložného systému, ktorý je zasa limitujúcim faktorom pre výkon a škálovateľnosť.
Kým dátová kompresia je funkciou pre úsporu, implementácia Hybridnej stĺpcovej kompresie znamená optimalizáciu I / O výkonu v dátových skladoch. I / O výkon sa väčšinou znižuje s pribúdajúcou kompresiou. Ak sa pristupuje k tabuľke s kompresným pomerom 10:1 zníži sa tým pravdepodobne I / O priepustnosť až
10x. Celkový výkon dopytov možno síce zlepšiť, ale to bude závisieť najmä od dostupných prostriedkov CPU.
Exadata Smart Scan technológia
Celkový výkon SQL dopytov závisí v nemalej miere na výkonnosti a dostupných prostriedkoch CPU. Ďalšie zvýšenie výkonu poskytuje Exadata Smart Scan technológia, ktorá výrazne znižuje množstvo dát poslaných z diskov do databázového servera spôsobom offloadu mnohých skenovacích aktivít. Exadata Smart Scan pristupuje priamo na hybridné stĺpcovo skomprimované dáta. Princíp fungovania Exadata Smart Scan technológie objasňuje nasledovné video:
Kompresia dátových skladov umožňuje dva druhy kompresie: LOW a HIGH. HIGH umožňuje 10x úsporu, pričom LOW umožňuje 6x úsporu. Oba druhy kompresie sú optimalizované s Hybridnou stĺpcovou kompresiou. Pre maximalizáciu úložného miesta a výkonu dotazov je vhodná kompresia dátových skladov s predvolenou úrovňou HIGH. Zvýšenie úspor úložného miesta môže spôsobiť že rýchlosť načítania dát sa mierne spomalí. Z toho dôvodu by mala byť nastavená hodnota LOW, a to najmä v takom prostredí, kde sú časové odozvy oveľa kritickejšie ako výkon dopytov.
Archívna kompresia
Jednou z najväčších výziev, ktorým čelia IT správcovia sú náklady, zložitosť a komplexnosť historických dát. IT manažéri sú často krát nútení znižovať náklady, čo je však v rozpore s obchodnými požiadavkami. Tie vyžadujú, aby boli archívne dáta k dispozícii veľmi dlhú dobu. Organizácie vyvinuli Information Lifecycle Management (ILM) stratégie, ktoré pomáhajú zmierniť náklady na ukladanie takýchto dát. Ako dáta starnú, presúvajú sa na lacnejšie úložiská, vrátane lacnejších diskov a často sa krát sa archivujú aj na pásky. V dôsledku toho sú drahšie a výkonnejšie disky určené výlučne pre najnovšie dáta a také dáta, ku ktorým sa častejšie pristupuje.
15-násobné úspory úložného priestoru
Aj archívna kompresia prináša významné úspory vďaka využitiu technológie Hybridnej stĺpcovej kompresie. Archívna kompresia je optimalizovaná pre ukladanie dát, maximalizáciu úspor a typicky dosahuje kompresný pomer 15:1 (15x).
To znamená, že nekomprimované tabuľky oddielov by vyžadovali 15-násť násobne viac úložného priestoru ako tabuľky alebo oddiely komprimované archívnou kompresiou. Na rozdiel od kompresie dátových skladov, predstavuje archívna kompresia technológiou umožňujúcu šetriť miestom. V príp. jej nasadenia však môže dôjsť zníženiu výkonu a to najmä z dôvodu, že kompresný algoritmus je optimalizovaný pre max. úspory úložného priestoru. Preto je archívna kompresia určená najmä pre tabuľky, oddiely a dáta ku ktorým sa pristupuje iba zriedka.
V mnohých aplikáciách spotrebúvajú historické dáta až 80% vyhradeného úložného miesta. Nemožno sa preto čudovať, že IT administrátori implementujú ILM stratégie a uchovávajú historické dáta na páskach. Avšak takýto prístup má niekoľko nedostatkov. Ako náhle sú dáta archivované na páske, aplikácia už nemôže k takýmto dátam pristupovať priamo. Pre prístup k archivovaným údajom musia IT správcovia najskôr obnoviť dáta z pásky a vložiť späť do databázy. To môže trvať obrovské množstvo času. Údaje archivované na páske a znovu nahrávané do databázy obsahujú štrukturálne zmeny schémy databázy, ako je napr. pridanie stĺpcov a iných obmedzení. Preto obnovenie takýchto dát späť do databázy vyžaduje nielen značné množstvo času, ale aj nezanedbateľné množstvo prostriedkov na ich správnu obnovu.
Jednoducho dostupné archívne dáta
Archívna kompresia poskytuje úsporu úložného priestoru tak ako je to v príp. zálohy na pásku s tým rozdielom, že dáta sú neustále dostupné on-line a možno k nim teda kedykoľvek pristupovať. Ďalej, ako sa aplikácie vyvíjajú, všetky historické údaje sa vyvíjajú spolu so zmenami databázových schém. Preto, keď užívateľ aplikácie potrebuje prístup k historickým dátam, môže tak spraviť okamžite a bez toho aby kontaktoval IT správcov.
Záver
S narastajúcim objemom dát v dátových skladov ako aj OLTP aplikáciách potrebujú IT manažéri nástroje, ktoré by im pomohli zefektívniť IT infraštruktúru a zároveň mať plne pod kontrolou náklady a udržať, alebo zlepšiť výkon. Hybridná stĺpcová kompresia v databázovom servery Oracle Exadata poskytuje IT manažérom robustnú sadu kompresných funkcií, ktoré výrazne znižujú náklady na infraštruktúru pri súčasnom zlepšovaní výkonu aplikácií.
———
Späť