I enkle ord er en data mart et datalager som er begrenset i omfang, og hvis data kan oppnås ved å oppsummere og velge data fra datalageret eller ved hjelp av distinkt ekstrakt, transformere og laste prosesser fra kildedatasystemet.
Sammenligningstabel
Grunnlag for sammenligning | Datavarehus | Databutikk |
---|---|---|
grunn~~POS=TRUNC | Datavarehus er applikasjonsuavhengig. | Data mart er spesifikk for beslutningsstøttesystemapplikasjon. |
Type system | sentralisert | desentralisert |
Dataform | Detaljert | oppsummert |
Bruk av denormalisering | Dataene er litt deformaliserte. | Dataene er sterkt denormaliserte. |
Datamodell | Top-down | Opp ned |
Natur | Fleksibel, dataorientert og langt liv. | Begrensende, prosjektorientert og kortt liv. |
Type skjema som brukes | Fakta konstellasjon | Stjerne og snøfnugg |
Lett å bygge | Vanskelig å bygge | Enkel å bygge |
Definisjon av Data Warehouse
Begrepet datalager betyr en tidsvariant, emneorientert, ikke-flyktig, og en integrert gruppe data som bistår i beslutningsprosessen av ledelsen. Alternativt er det et lager av informasjon samlet fra flere kilder, lagret i et enhetlig skjema, på et eneste nettsted som tillater integrering av en rekke applikasjonssystemer. Når disse dataene er samlet, lagres det i lang tid, og har derfor et langt liv og tillater tilgang til historisk informasjon.
Datamagasinet gir derfor brukeren et enkelt integrert grensesnitt til dataene som brukeren enkelt kan skrive spørsmål om vedtaksstøtte. Data warehouse hjelper i å omdanne dataene til informasjon. Utforming av et datalager inkluderer topp-ned tilnærming.
Den samler informasjon om emner som spenner over hele organisasjonen, for eksempel kunder, salg, eiendeler, gjenstander, og derfor er spekteret bredt over hele bedriften. Faktisk konstellasjonsskjema er vanligvis brukt i det, som dekker et bredt spekter av fag. Et datalager er ikke en statisk struktur, og den utvikler seg kontinuerlig.
Definisjon av Data Mart
En data mart kan kalles som en delmengde av et datalager eller en undergruppe av bedriftens brede data som tilsvarer et bestemt sett med brukere. Datavarehus innebærer flere avdelinger og logiske data mars som må være vedvarende i deres dataleksjon for å sikre robustheten i et datalager. En data mart er et sett med tabeller som konsentrerer seg om en enkelt oppgave, disse er utformet ved hjelp av en bottom-up tilnærming.
Som stjerne- og snøfnuggskjema drives mot enkeltfagsmodellering, derfor er disse ofte brukt i data mart. Selv om stjerneskjemaet er mer populært enn snøfnuggskjema. Avhengig av datakilden kan dataarken klassifiseres i to typer: avhengig og uavhengig data mars.
Viktige forskjeller mellom datavarehus og datastart
- Data warehouse er applikasjon uavhengig mens data mart er spesifikk for beslutningstøtte system applikasjon.
- Dataene lagres i et enkelt, sentralisert lager i et datalager. Imidlertid lagrer data mart data desentralt i brukerområdet.
- Datavarehus inneholder en detaljert dataform. I kontrast inneholder data mart oppsummerte og valgte data.
- Dataene i et datalager er litt deformaliserte, mens i tilfelle Data mart det er svært denormalisert.
- Byggingen av datalagring innebærer topp-ned tilnærming. Omvendt, mens du bygger en data mart, benyttes bunnen opp tilnærming.
- Datavarehus er fleksibelt, informasjonsorientert og langvarig eksisterende natur. Tvert imot er en data mart restriktiv, prosjektorientert og har en kortere eksistens.
- Faktorkonstellasjonskjema brukes vanligvis til modellering av et datalager, mens data mart-stjerneskjema er mer populært.
Konklusjon
Data warehouse gir enterprise view, enkelt og sentralisert lagringssystem, inneboende arkitektur og applikasjonsuafhængighet mens Data mart er en delmengde av et datalager som gir avdelingsvisning, desentralisert lagring. Siden datalagret er veldig stort og integrert, har det stor risiko for feil og vanskeligheter med å bygge den. På den annen side er data mart lett å bygge og tilhørende sviktrisiko er også mindre, men data mart kan oppleve fragmentering.