La oss se på forskjellen mellom datautvinning og datalagring ved hjelp av et sammenligningsdiagram som er vist nedenfor.
Sammenligningstabel
Grunnlag for sammenligning | Data Mining | Datavarehus |
---|---|---|
grunn~~POS=TRUNC | Data mining er en prosess for å hente eller trekke ut meningsfylte data fra database / datalager. | Datavarehus er et lager der informasjonen fra flere kilder er lagret under et enkelt skjema. |
Definisjon av Data Mining
Data Mining er en prosess for å oppdage Kunnskap, som du aldri forventet å eksistere i databasen din . Ved hjelp av tradisjonelle søkeverktøy kan du bare hente den kjente informasjonen fra dataene. Men Data mining gir deg muligheten til å hente skjult informasjon ut av dataene . Data mining utdrager meningsfull informasjon fra databasen som kan brukes til beslutningstaking .
Kunnskapsoppdagelsen i databaser, referert til som KDD, viser forhold og mønster . Forholdet kan være mellom to eller flere forskjellige objekter, mellom attributter av samme objekt. Mønster er et annet utfall av data mining som viser den vanlige og forståelige sekvensen av informasjon som bidrar til beslutningstaking.
Trinnene involvert i KDD dvs. Knowledge Discovery i databaser kan oppsummeres som først, utvalg av datasett som datautvinning skal utføres. Neste er forbehandling som innebærer fjerning av inkonsekvente data. Deretter kommer datatransformasjon der dataene blir transformert til skjemaet som er egnet for data mining. Neste er datautvinning, her brukes data mining algoritmer til dataene. Og til slutt, tolkning og evaluering som involverer å trekke sammen forholdet eller mønsteret mellom dataene.
Data mining passer godt i datalagringsmiljøet som har lagret data på en aggregert og oppsummert måte. Som det blir enkelt å minne dataene i datalageret
Definering av datalagring
Data Warehouse er en sentral plassering der informasjon samlet fra flere kilder lagres under et enkelt enhetlig skjema . Dataene samles inn i utgangspunktet, ulike kilder til bedriften, og deretter rengjøres og transformeres og lagres i et datalager. Når data er lagt inn i et datalager, forblir det lenge der og kan åpnes over tid.
Data Warehouse er en perfekt blanding av teknologier som datamodellering, datainnsamling, datahåndtering, metadatahåndtering, utviklingsverktøy for lagringsledelse . Alle disse teknologiene støtter funksjoner som datautvinning, datatransformering, datalagring, som gir brukergrensesnitt for tilgang til dataene .
Datavarehus er ikke et produkt eller programvare, det er et informasjonsmiljø som gir informasjon som en integrert visning av et foretak. Du kan få tilgang til bedriftens nåværende og historiske data som bidrar til beslutningsprosessen. Den støtter transaksjoner som gjøres for beslutningstaking uten å påvirke operasjonelle systemer. Det er en fleksibel ressurs for å oppnå strategisk informasjon.
Viktige forskjeller mellom data mining og datalagring
- Det er en grunnleggende forskjell som skiller data mining og datalagring som er datautvinning, er en prosess for å utvinne meningsfylte data fra den store databasen eller datalageret. Datamagasinet gir imidlertid et miljø der dataene lagres i en integrert form som gjør det enklere for datautvinning å utvinne data mer effektivt.
Konklusjon:
Data Mining kan kun gjøres når det er en godt integrert stor database, dvs. datalager. Så data warehouse må være ferdig før data mining. Datavarehus må ha informasjon i godt integrert form slik at datautvinning kan trekke kunnskapen på en effektiv måte.