Erinevus Hadoopi suurandmete, Cassandra ja MongoDB vahel?

Hadoop saab suure osa suurest krediidiskoorist, kuid tõsi on see, et NoSQL-i andmeallikat rakendatakse palju üldisemalt - ja palju üldisemalt. Ehkki Hadoopi allika jaoks ostmine on suhteliselt keeruline, on NoSQL-i andmeallika valimine kõike muud. Lõppude lõpuks on enam kui 100 NoSQL-i andmeallikat, nagu andmebaasi DB-Engines andmebaasi maine positsioon näitab.

Rikutud valiku pärast

Sest vali, peate olema nii vinge, kui võib olla elada rahuldatud nn polügloti määramise utoopias, “kus igal korraliku suurusega ettevõttel on mitmesuguseid erinevaid salvestusruumi tehnoloogilisi uuendusi eri tüüpi teabe jaoks”, nagu Martin Fowler väidab, et tõsi on see, et te ei saa kulutada rohkem kui mõne õppimisele.

Õnneks muutuvad valikud lihtsamaks, kui majandusharu koondub kolme silmapaistva NoSQL-i andmebaasi ümber: MongoDB (minu endise tööandja toetusel), Cassandra (peamiselt DataStaxi kujundatud, ehkki sündinud Facebookis) ja HBase (tihedalt Hadoopiga korraldatud ja sama disainitud) kogukond).

See on Linkedini teave. Täiuslikum perspektiiv on DB-Engines ”, mis koondab ülesanded, otsingu ja muu teabe andmebaasi maine mõistmiseks. Kui Oracle, SQL Server ja MySQL on reeglitest paremad, pakuvad MongoDB (nr 5), Cassandra (nr 9) ja HBase (nr 15) neile raha.

Ehkki igale muule NoSQL-i andmebaasile on liiga vara helistada ümardamisveaks, jõuame selle punkti kiiresti, täpselt nagu relatsiooniandmebaaside tööstuses juhtus.

Maakera, mis on loodud struktureerimata andmetega

Me elame järk-järgult maailmas, kus teave ei sobi ideaalselt RDBMS-i puhta seeria ja sisuga. Mobiilside, avalik ja arutluskäikude töötlemine on tekitanud suure teabeülevoolu. Mitmete aruannete kohaselt oli 90% kogu maailma teabest loodud kahe viimase aasta jooksul. Gartner seostas 80% kogu äriteabest struktureerimata kujul. Veelgi enam, struktureerimata teave kasvab jätkuvalt kaks korda kiiremini kui korraldatud teave.

Kuna kogu maakera muutub, ületavad teabe juhtimise spetsifikatsioonid tavapäraste relatsiooniliste andmeallikate tõhusat võimalust. Esimesed ettevõtted, kes märkasid vajadust alternatiivsete alternatiivide järele, olid veebijuhid, valitsusosakonnad ja ettevõtted, kes on infoteenuste eksperdid.

Järjest enam soovivad kõigi valdkondade ettevõtted kasutada ära selliste alternatiivide eeliseid nagu NoSQL ja Hadoop: NoSQL töötab välja funktsionaalseid programme, mis loovad nende äri kaasamistehnikate abil, ja Hadoop, et töötada välja programme, mis hindavad nende teavet tagasiulatuvalt ja aitavad pakkuda väga tõhusaid ideesid. .

MongoDB: disaineritest, arendajatele

NoSQL-i valikutest, mida MongoDB Stirman arvesse võtab, on MongoDB olnud suunatud tervislikule strateegiale, mis on loodud paljudele programmidele. Ehkki jõudlus on lähedane tavapärase relatsioonilise andmeallika omale, võimaldab MongoDB klientidel kasutada argumenteerimisvõimaluste eeliseid oma horisontaalses mastaapsuses ja hõlpsasti töötada koos erineva teabega, mida tänapäeval kasutama hakatakse tänu oma mitmekülgsele teabekujundusele.

Cassandra: sõitke kindlalt mastaabis

Andmeallika lihtsust on vähemalt kahte tüüpi: kasvu mugavus ja funktsionaalne mugavus. Ehkki MongoDB saab krediidiskoori lihtsa välimise kogemuse eest, genereerib Cassandra täielikud esindatused, kuna seda on hõlpsasti käsitsetav.

Nagu DataStaxi McFadin ütles, liiguvad kliendid Cassandrasse tavaliselt seda enam, et nad lükkavad pead, kuna pole võimalik muuta relatsiooniandmebaasi kiiremaks ja tõhusamaks, eriti tööpiirkonnas. Endine Oracle DBA esindaja McFadin avastas rahuloluga, et Cassandra puhul on "replikatsioon ja sirgjooneline ronimine primitiivne" ning valikud olid "algusest peale peamine projekteerimiseesmärk".

HBase: Bosomi sõbrad Hadoopiga

HBase, nagu Cassandra veerupõhine võtmeväärtusega pood, saab palju kasutada suuresti tänu sellele, et tal on Hadoopiga ühine maine. Tõepoolest, nagu Cloudera's Kestelyn ütles: "HBase pakub rekordipõhist salvestusruumi osa, mis võimaldab kiireid, ainulaadseid vooge ja loob teavet, sobitades Hadoopi, keskendudes suure läbilaskevõimega madala latentsusega I / O probleemidele."