Rozdiel medzi dolovaním údajov a skladovaním údajov

Autor: Laura McKinney
Dátum Stvorenia: 2 Apríl 2021
Dátum Aktualizácie: 15 Smieť 2024
Anonim
Rozdiel medzi dolovaním údajov a skladovaním údajov - Technológie
Rozdiel medzi dolovaním údajov a skladovaním údajov - Technológie

Obsah


Dolovanie a ukladanie údajov sa používajú na uchovávanie obchodných informácií a na umožnenie rozhodovania. Ťažba údajov a skladovanie údajov majú rôzne aspekty fungovania podnikových údajov. Na jednej strane dátový sklad je prostredie, v ktorom sa údaje podniku zhromažďujú a ukladajú súhrnne a súhrnne. Na druhej strane, dolovanie dát je proces; ktoré používajú algoritmy na extrahovanie poznatkov z údajov, o ktorých ani neviete, že existujú v databáze.

Pozrime sa na rozdiel medzi dolovaním a ukladaním údajov pomocou porovnávacej tabuľky uvedenej nižšie.

  1. Porovnávacia tabuľka
  2. definícia
  3. Kľúčové rozdiely
  4. záver

Porovnávacia tabuľka

Základ pre porovnanieŤažba dátSkladovanie údajov
základné Dolovanie údajov je proces získavania alebo extrahovania zmysluplných údajov z databázy / dátového skladu.Dátový sklad je úložisko, v ktorom sú informácie z viacerých zdrojov uložené pod jednou schémou.


Definícia ťažby údajov

Ťažba údajov je proces, ktorý objavovať vedomosti, ktoré vy nikdy neočakával na vo vašej databáze, Pomocou tradičného dotazovacieho nástroja môžete z údajov získať iba známe informácie. Dolovanie dát vám však ponúka cestu načítať skryté informácie z údajov, Dolovanie údajov extrahuje z databázy zmysluplné informácie, ktoré je možné použiť rozhodovanie.

Zisťovanie poznatkov v databázach, uvádzané ako KDD, exponáty súvislosť a vzor, Vzťah môže byť medzi dvoma alebo viacerými rôznymi objektmi, medzi atribútmi toho istého objektu. Vzor je ďalším výsledkom získavania údajov, ktorý ukazuje pravidelnú a zrozumiteľnú postupnosť informácií, ktoré pomáhajú pri rozhodovaní.


Kroky zahrnuté v KDD, t. J. Získavanie znalostí v databázach, je možné zhrnúť ako prvé, výber súboru údajov, na ktorých sa musí vykonať dolovanie údajov. Ďalej je predspracovania ktoré zahŕňajú odstránenie nekonzistentných údajov. Potom príde transformácia dát kde sa údaje transformujú do formy vhodnej na získavanie údajov. Ďalej je dolovanie dát, tu sa na údaje použijú algoritmy získavania údajov. A nakoniec, interpretácia a hodnotenie ktoré zahŕňajú extrahovanie vzťahu alebo vzoru medzi údajmi.

Dolovanie údajov dobre zapadá do prostredia dátového skladu, ktorý ukladá údaje agregovaným a súhrnným spôsobom. Ako je ľahké ťažiť dáta v dátovom sklade

Definovanie skladovania dát

Dátový sklad je centrálne miesto, kde sú informácie zhromaždené z viacerých zdrojov sú uložené v rámci jednej zjednotenej schémy, Dáta sa spočiatku zhromažďujú, rôzne zdroje podniku sa potom vyčistia, transformujú a uložia do dátového skladu. Akonáhle sú dáta vložené do dátového skladu, zostanú tam po dlhú dobu a môžu sa k nim pristupovať niekedy.

Dátový sklad je perfektnou zmesou technológií ako modelovanie údajov, získavanie údajov, správa údajov, správa metadát, vývojové nástroje pre správu obchodov, Všetky tieto technológie podporujú funkcie ako extrakcia údajov, transformácia údajov, ukladanie údajov, poskytovanie užívateľských rozhraní pre prístup k údajom.

Dátový sklad nie je produktom alebo softvérom, je to informačné prostredie, ktoré poskytuje informácie ako integrovaný pohľad na podnik. Máte prístup k aktuálnym a historickým údajom podniku, čo pomáha pri rozhodovaní. Podporuje transakcie uskutočňované na účely rozhodovania bez ovplyvnenia operačných systémov. Je to flexibilný zdroj na získavanie strategických informácií.

  1. Existuje zásadný rozdiel, ktorý oddeľuje ťažbu údajov od skladovania údajov, čo znamená, že ťažba údajov je proces získavania zmysluplných údajov z veľkej databázy alebo skladu údajov. Dátový sklad však poskytuje prostredie, v ktorom sú dáta uložené v integrovanej forme, ktorá uľahčuje ťažbu údajov na efektívnejšie extrahovanie údajov.

záver:

Dolovanie údajov je možné vykonať iba vtedy, keď existuje dobre integrovaná veľká databáza, t. J. Dátový sklad. Preto musí byť dátový sklad dokončený pred ťažbou údajov. Dátový sklad musí mať informácie v dobre integrovanej forme, aby bolo možné získavať údaje účinným spôsobom.