Suurandmed vs. andmelaod. Mis on erinevus?

Tehnoloogia areneb tempos, milles pole võimatu sammu pidada, ja vananevad tehnoloogiajuhid leiavad peagi, et kõik need bakalaureuseõppe tehnoloogiaklassid on kiiresti vananemas. Kui olete suurettevõtte tehnoloogiadirektor (CTO), pole teil palju aega uute tehnoloogiate tundmaõppimiseks, kuna olete liiga hõivatud tulekahjudega ja veenduge, et näeksite hea välja järgmisel juhatuse koosolekul kõigi teiste ees, kes üritavad sama asja teha. Teatud ajahetkel võite end küsida: mis vahe on suurandmete ja andmeladude vahel?

Iga tehnoloogiaprofessionaal on kursis sellega, mis on andmebaas. See on lihtsalt andmete kogum, mis aja jooksul kasvab ja millelt saate päringute teel huvitavaid asju teada. Siis on olemas andmelao mõiste, mida nimi viitab. Ärgem süvenegem kogu vestlusesse „Kimball vs. Inmon“ ja pidagem seda lihtsat.

Andmeladu on organisatsioonis arvukalt erinevaid andmebaase, mida saab ühise võtmega ühendada. Näiteks võime ühendada kirjed mitme andmebaasi vahel, kasutades ainulaadset välja CUSTOMER_ID. Siin on andmebaasid erinevates osakondades, kus on olemas kirjed, mida võiksime linkida CUSTOMER_ID abil:

Kasutades CUSTOMER_ID, saate selle hõlpsalt ühele lehele välja printida, arve kõigi maksmata arvete kohta ja loendi 10 kõige uuemast teenusetaotlusest, mille müügipersonal võib seejärel müügikohtumisele kaasa võtta. Muidugi, täna kasutame kõige selle jaoks lihtsalt Salesforce'i, kuid see lihtne näide annab teile idee, kui kasulik võib olla erinevate andmeallikate ühendamine. Just see seisneb andmeladudes, välja arvatud juhul, kui nad astuvad sammu kaugemale ja kasutavad ühendatud andmeid otsuste tegemiseks väga kõrgel tasemel. Andmelao ehitamisel teate tavaliselt, millistele küsimustele võiksite vastata, kuna mõni C-taseme inimene nõuab teatud jõudluse põhinäitajate (KPI) mõõtmist. Te ei pea andmete ehitamiseks lihtsalt andmebaase ehitama, sest see on kallis ülesanne. Räägime nüüd suurandmetest ja andmeladudest.

Esimene asi, mida peame määratlema, on mõiste „suurandmed”, mis määratleb ennast üsna suuresti. Olete ilmselt kuulnud sageli viidatud statistikast, et 98% kõigist andmetest on loodud viimase 2 aasta jooksul. See on suur teave. Kõiki praegu genereeritavaid hiiglaslikke andmeväljenduskomplekte saab teadmiste saamiseks kaevandada (kas mäletate andmete kaevandamist?). Tänapäeva kõrgtehnoloogia maailmas võiksime soovida luua teadmisi, mida me ei tea, et meil olemas on. Donald Rumsfeld nimetas neid nutikalt kui “tundmatuid tundmatuid” asju, mida me ei tea, millest me ei tea. Psühholoogia maailmas nimetatakse seda mõistet Johari aknaks. Kas teate seda müügiinimest, kes pole teadlik tõsiasjast, et nende pelk eksistents paneb kõik ümberkaudsete inimeste tahtma Peeter Paani lähimast kõrghoonest maha tõmmata? See, et inimene pole teadlik, kui tüütud nad on, ja asjaolu, et selle inimese ümber olevad inimesed ei saa täpselt näpuga ajada, miks see on, on "tundmatu tundmatu", kuna keegi ei tea, miks Rob müügis on lihtsalt suur , rasv, ebameeldiv torkimine. Igatahes, liikudes edasi.

Postitatud 7wData.be.