Mitä Impala on big datassa?
Mitä Impala on big datassa?

Video: Mitä Impala on big datassa?

Video: Mitä Impala on big datassa?
Video: Tame Impala Live @ Melt Festival 2016 2024, Saattaa
Anonim

Impala on avoimen lähdekoodin massiivisesti rinnakkainen kyselymoottori klusteroitujen järjestelmien, kuten Apache Hadoopin, päällä. Se luotiin Googlen Dremel-paperin perusteella. Se on interaktiivinen SQL:n kaltainen kyselymoottori, joka toimii Hadoop Distributed File System (HDFS) -järjestelmän päällä. Impala käyttää HDFS:ää taustana.

Mitä tähän liittyen on Impala ja hive?

Apache Pesä on tehokas standardi SQL-in-Hadoopille. Impala on avoimen lähdekoodin SQL-kyselymoottori, joka on kehitetty Google Dremelin jälkeen. Cloudera Impala on SQL-moottori HBaseen ja HDFS:ään tallennettujen tietojen käsittelemiseen. Impala käyttää Pesä megastore ja voi tiedustella Pesä taulukoita suoraan.

Lisäksi kumpi on parempi pesä vai Impala? Apache Pesä ei ehkä ole ihanteellinen interaktiiviseen tietojenkäsittelyyn Impala on tarkoitettu interaktiiviseen laskemiseen. Pesä on eräpohjainen Hadoop MapReduce taas Impala On lisää kuten MPP-tietokanta. Pesä tukee monimutkaisia tyyppejä, mutta Impala ei. Apache Pesä on vikasietoinen, kun taas Impala ei tue vikasietoisuutta.

Kysyttiin myös, miksi käytämme Impalaa?

Impala tukee muistin sisäistä tietojenkäsittelyä, eli se hakee/analysoi tietoja, jotka On tallennettu Hadoop-datasolmuihin ilman tiedonsiirtoa. Sinä pystyt käyttää tietoja käyttäen Impalaa käyttäen SQL:n kaltaiset kyselyt. Impala tarjoaa nopeamman pääsyn HDFS-tietoihin verrattuna muihin SQL-moottoreihin.

Mikä on hive big datassa?

Apache Pesä on tiedot varastojärjestelmä tiedot yhteenvetoon ja analysointiin sekä suurten kyselyiden tekemiseen tiedot järjestelmät avoimen lähdekoodin Hadoop-alustalla. Se muuntaa SQL:n kaltaiset kyselyt MapReduce-töiksi erittäin suurten määrien suorittamiseksi ja käsittelemiseksi. tiedot.

Suositeltava: