Mondrian vs Elasticsearch: mida valida

Ettevõtte rakenduse jaoks analüütilise taustamootori leidmine on väljakutse arendajatele ja andmelaoarhitektidele.

Teie valik sõltub alati paljudest äri-, rakendusspetsiifilistest ja riistvaranõuetest, mida tuleb tarkvara arendamise elutsükli algfaasis arvestada.

Teie projekti kaugeleulatuvatele eesmärkidele vastava lahenduse õige valiku valimisel otsustasime tuua tähelepanu keskpunkti kaks võimsat (olemuselt siiski erinevat) tööriista - Elasticsearch ja Mondrian, mis kajastavad lühidalt nende kõrgeid taseme funktsioone ning uurima otsimootori ja OLAP-serveri põhieesmärke.

Elastikotsing

Maailma suurimad ettevõtted annavad oma eelistused Elasticsearchile. See pole üllatav - Elasticsearch kehastab dokumendile orienteeritud andmesalvestuse, mitme üürniku otsingu ja analüütilise mootori parimaid omadusi. Optimeeritud otsinguks ja otsimiseks annab see rakendustele kaasaegseima otsingufunktsiooni. Selle mitmekordne rentimine annab teile võimaluse omada klastris nii palju indekseid, kui vaja.

Lisaks otsimisvõimalustele toetab see ka analüütikat ja pakub tõhusat liitmist, mis aitab teie andmetest väärtust eraldada.

Mis on kapoti all?

Elasticsearchi keskmes on Apache Lucene - üks armastatumaid teabeotsingu raamatukogusid, mis on tuntud oma jõudluse, mastaapsuse ja asjakohasuse poolest.

Ligi reaalajas

Elasticsearch-i nimetatakse peaaegu reaalajas otsinguplatvormiks, kuna see kasutab uute dokumentide otsitavaks muutmiseks kerget protsessi, värskendades iga kihti kord sekundis.

Kasutuselevõtt

Elasticsearchi lisamine oma arhitektuurikujundusse on reeglina valutu protsess - saate seda käivitada kas kohapeal või pilves. Rakendamine nõuab minimaalseid jõupingutusi, kuid annab pikas perspektiivis maksimaalse tulemuse.

Toimivus ja mastaapsus

Skaleeritavus on alati probleem, kuid Elasticsearch on hajutatud olemusega, mis tagab otsingu üldise toimivuse. See jaotub kergesti iga indeksi mitmeks kihiks jagamise tõttu. Varjestamine võimaldab teil paralleelselt toimida kilpide vahel ja indeksi kildade kopeerimine tagab kättesaadavuse ühe või mitme sõlme tõrke korral. Lisaks saate pärast indeksi loomist dünaamiliselt kontrollida koopiate arvu, kuid kihtide arv tuleb indeksi loomise ajal määratleda.

Paindlikkus

Elasticsearchi üks põhilisi eripärasid on see, et ei ole vaja skeemi täpsustada. Elasticsearch võtab ise dokumentide indekseerimise ja automaatselt järeldab nende tüübid ja väljad. Nii aitab see teil oma andmeid võimalikult kiiresti uurida.

Turvalisus

X-Packi abil saate oma klastrisse rakendada mitmesuguseid turvameetmeid - Elastne korstna laiendus (mis pakub ka häire-, seire-, aruandlus-, masinõppefunktsioone).

Tavaliselt hõlmavad sellised meetmed privaatsete andmete paljastamise ja kallite taotluste või välise koodi täitmise takistamist dünaamiliste skriptide kaudu. Samuti võite kehtestada õiguste värskendamise piirangud.

API

Kõik Elasticsearchi omadused kuvatakse liidese RESTful kaudu.

Lisaks saate Elasticsearchiga suhelda mis tahes teie valitud keeles. Keelte tugi on lai - Java, Python, Curl, PHP, SQL, JavaScript, Ruby ja teised.

Kogukond

Kuna tegemist on avatud lähtekoodiga tootega, toetavad Elasticsearchi arendajad kogu maailmast.

Proovige külastada Elastist Foorumit - see annab teile võrreldamatu rahvusvahelise kogukonna kuuluvuse tunde.

Dokumentatsioon, väljaanded ja värskendused

Esimene asi, mis silma tõmbab, on see, kuidas Elasticsearchi dokumentatsioon on hästi korraldatud ja ajakohane.

Teine asi, mis teile võib meeldida, on kasutusjuhtude jaotis, mis aitab avastada, kuidas erinevad organisatsioonid lahendavad otsingu ja analüüsi väljakutseid Elasticsearchi ja muude ELK-i virna toodete abil.

Väiksemaid väljalaskeid ja parandusi tehakse sageli. Suured heited on samuti sagedased - kord kahe või nelja kuu jooksul.

Kas see on tasuta?

Jah, see on tasuta otsimootor, mis väljastatakse avatud lähtekoodina Apache 2.0 litsentsi all.

Mida me arvame

Elasticsearch on seotud kiiruse ja paindlikkusega. Kui peate haldama keerulisi andmevooge, on see parim valik. See muudab otsimisprotsessi valutuks ja tõhusaks.

Elasticsearchi saate kasutada nii esmase kaupluse kui ka otsimootorina. Parim tava on kasutada Elasticsearchi lisaks olemasolevale andmebaasile.

Ja ärirakenduse võimaldamiseks oma rakenduse abil saate proovida Flexmonsterit - see aitab muuta teie indeksi andmed võimsate filtreerimis-, koondamis- ja sortimisfunktsioonide abil ülevaateks.

Et praktikas õppida Elasticsearchi indeksi andmete põhjal aruande koostamist, lugege artiklit Ühendamine Elasticsearchiga.

Vaatame nüüd Mondria ülevaadet.

Mondrian

Mondrian on avatud lähtekoodiga OLAP-mootor, mis ilmus 2002. aastal. Selle loomist inspireeris peamiselt SSAS ja soov lahendada aeganõudva aruande loomise protsessi probleem.

Kuidas see töötab?

Pentaho arhitektid ühendasid ROLAP-i (relatsiooniline online-analüütiline töötlus) parimad omadused, selle lihtsustatud ülesehituse ja MOLAP-i (mitmemõõtmeline veebianalüütiline töötlemine) toimimise.

Tehniliselt on see vahendaja andmelao ja analüüsitööriistade vahel. Andmete loogiliste kirjelduste ja JDBC abil tõmbab ta andmed andmebaasist, teisendab MDX päringud SQL päringuteks ja saadab vastusena aruandlustööriistale OLAP-kuubikud. Mondriani peamine funktsioon on see, et see kogub mällu kuubikuid, et oleks võimalik kiiresti küsimustele vastata.

Samuti on oluline mõista Mondri skeemi konstruktsioone. Kuup on mõõtmete ja mõõtmete kogum. Mõõtmed tähistavad atribuute, mille järgi tuleks mõõtmed jagada kategooriatesse. Need mõõtmed ja hierarhiad kaardistatakse skeemi kaudu teie andmebaasi tabelitele.

Ligi reaalajas

Saate Mondrianiga saavutada peaaegu reaalajas kogemuse, kuna ROLAP-mootorid ei arvuta eelnevalt mõõtmete ristmikke, see tähendab, et andmed on lõppkasutajatele kättesaadavad kohe, kui neid andmebaasis värskendatakse.

Just see teeb Mondrianist hea valiku reaalajasüsteemide jaoks - pidevalt muutuvas andmebaasis saate käitada mitmemõõtmelisi päringuid. Selleks saate kasutada selle vahemälu kontrolli API-d.

Kasutuselevõtt

Saate Mondrianit käivitada veebikonteineris (Tomcat või JBoss) või manustada oma rakenduse osana.

Toimivus ja mastaapsus

Mondrian kasutab kiiruse suurendamiseks arvutuste mälusisest salvestust. Vaatamata Mondriani enda efektiivsusele võib see teie rakendust aeglustada, kui teie SQL päringuid ei ole optimeeritud või skeem on halvasti kavandatud. Lisaks võib OLAP-kuubikute seadistamine, hooldamine ja ümberkorraldamine maksta teile palju, arvestades arendaja aega, mis on sageli kallim ressurss kui jõud ja mälu. Õigete konfiguratsioonide abil saate siiski Mondrianit sadade või tuhandete kasutajate jaoks laiendada.

Paindlikkus

See on paindlik selles mõttes, et seda saab manustada mitmekesisesse keskkonda ja integreerida kolmanda osapoole tööriistadega. Kuid Mondria skeemikeel seab teatud piirangud, millest saab üle rakendusele kohandatud pistikprogrammide lisamisega.

Turvalisus

Juurdepääsu piiramiseks OLAP-kuubi teatud osadele saate määratleda kasutajarollid skeemi määratluses, kasutades BA-serveri rollide kaardistamist.

API

Mondrian ei paku REST API-t, kuid võite kasutada Mondrian raamatukogu ümber pakitud kolmanda osapoole REST API-sid.

Kogukond

Mondrian on ka avatud lähtekoodiga projekt, millele igaüks saab kaasa aidata. Ametlik Pentaho foorum on teie teenistuses juhuks, kui peate esitama küsimuse, mis on seotud Mondriani funktsionaalsusega. Kuid tundub, et seda ei kasutata aktiivselt.

Dokumentatsioon, väljaanded ja värskendused

Dokumentatsioon on põhjalik, kuid mitte piisavalt skimbleeritav. Kahjuks jätab see mulje ühest pikast dokumendist, mida kerite alla, kuni leiate vajaliku teabe.

Viimane ametlik stabiilne versioon 3.0 ilmus 2008. aastal. Sellest ajast alates toetavad ja uuendavad Mondrianit peamiselt arendajad.

Kas see on tasuta?

Jah, Mondrian on tasuta ja avatud lähtekoodiga. Sellel on ETL-i litsents.

Mida me arvame

Kokkuvõttes on Mondrian hea valik, kui teil on salvestuskihina üks relatsiooniline andmebaas, mis ei vasta täielikult vajadustele otsingutulemuste kiireks toomiseks päringute kaudu. See laiendab relatsioonandmebaasi funktsionaalsust, pakkudes andmete, vahemällu salvestamise ja kõrgema taseme arvutuste mõõtmelist vaadet.

Kui otsustasite seda kasutada, vajate kindlasti täiustatud esiotstarbelist tööriista kuubikute andmete kuvamiseks ja analüüsimiseks. See on see, mille jaoks Flexmonster on loodud. Mondrianiga saate ühenduse luua XMLA või Flexmonster Acceleratori abil (spetsiaalne serveripoolne utiliit kiireks andmeedastuseks) ja hakata uurima OLAP-i andmeid. Lisateabe saamiseks lugege artiklit Ühendamine Pentaho Mondrianiga.

Pannes selle kõik kokku

Nii Mondrianit kui ka Elasticsearchi saab kasutada eelkogustatud andmete tõhusaks pärimiseks ja nende analüüsimiseks peaaegu reaalajas, kuigi nad kasutavad sisuliselt erinevaid tehnoloogiaid. Siiski näib, et endine sai lõpuks IT-turul avatud lähtekoodiga tööriistade konkurentsi tõttu aegunud ja vähem populaarseks lahenduseks. Pealegi nõuab Mondria skeemide kirjutamine kõrgemat õppimiskõverat ja see võib olla tüütu protsess.

Elasticsearchi võtab rohkem vastu arendajate kogukond (eriti DevOpsi inseneride poolt) ja see ulatub Mondrianini mitmete aspektide osas: toetatud andmetüüpide laiem valik, mastaapsus, REST-liidese kaudu suhelda ja tugev kogukonna tugi. Lisaks on see suurepärane logide analüüsimiseks. Muud peamised funktsioonid on peaaegu reaalajas otsing ja skeemivaba arhitektuur. Soovitame saada praktilisi kogemusi, et veenduda, et Elasticsearch on loodud andmete hõlpsaks integreerimiseks ja silmas pidades suurepärast jõudlust.

Võrreldes populaarsust

Meie järeldused Elasticsearchi ja Mondri populaarsuse kohta põhinevad otsingupäringute analüüsil Google Trendsi kaudu. See näitas, kuidas huvi mõlema lahenduse vastu viimase kümne aasta jooksul on muutunud. Trendijoone graafikul võite märgata, et Mondrian oli nõudluse esitamisel pärast tootmist esimese 10 aasta jooksul, kuid selle populaarsuse langus 2014. aastal langes kokku Elasticsearchi populaarsuse kasvuga, mis järgnes varsti pärast selle olulisi värskendusi.

Lõplikud mõtted

Loodame, et nüüd olete valmis tegema teadliku otsuse oma projekti analüütilise taustamootori kohta.

Ükskõik, millise lahenduse valite, võite alati loota Flexmonsterile. See toimib teie andmete äriteabe tööriistana ja avab hulgaliselt võimalusi - saate luua ühenduse kas Elasticsearchi või Mondrianiga, hankida kokkuvõtlikke andmeid indeksist või OLAP-kuubikust ja alustada oma mõttekiiruse analüüsi. Pole tähtis, kui suur on teie andmekogum - Flexmonster saab sellega hakkama.

Algselt avaldati veebisaidil www.flexmonster.com.