Mikä on parkettitietomuoto?
Mikä on parkettitietomuoto?

Video: Mikä on parkettitietomuoto?

Video: Mikä on parkettitietomuoto?
Video: Mikä on 2024, Huhtikuu
Anonim

Apache Parketti on ilmainen ja avoimen lähdekoodin sarakesuuntautunut tiedot varastointi muoto Apache Hadoop -ekosysteemistä. Se on yhteensopiva useimpien tiedot käsittelykehykset Hadoop-ympäristössä. Se tarjoaa tehokkaan tiedot pakkaus- ja koodausjärjestelmiä, joissa on parannettu suorituskyky monimutkaisten asioiden käsittelemiseksi tiedot irtotavarana.

Yksinkertaisesti sanottuna, mikä on parkettitiedostomuoto?

Parketti , avoin lähdekoodi tiedosto muoto Hadoopille. Parketti tallentaa sisäkkäiset tietorakenteet tasaiseen sarakkeeseen muoto . Verrattuna perinteiseen lähestymistapaan, jossa tiedot tallennetaan rivilähtöisessä lähestymistavassa, parketti on tehokkaampi varastoinnin ja suorituskyvyn suhteen.

Lisäksi mihin parkettia käytetään? Parketti on avoimen lähdekoodin tiedostomuoto, joka on käytettävissä kaikissa Hadoop-ekosysteemin projekteissa. Apache Parketti on suunniteltu tehokkaaseen ja suorituskykyiseen tasaiseen sarakemuotoiseen tietojen tallennusmuotoon verrattuna rivipohjaisiin tiedostoihin, kuten CSV- tai TSV-tiedostoihin.

Lisäksi, miten parkettimuoto tallentaa tietoja?

TIEDOT BLOCK Jokainen lohko parketti tiedosto on tallennettu riviryhmien muodossa. Niin, tiedot jonkin sisällä parketti tiedosto on jaettu useisiin riviryhmiin. Nämä riviryhmät puolestaan koostuvat yhdestä tai useammasta sarakepalasta, joka vastaa saraketta tiedot aseta. The tiedot jokaiselle sarakepalalle, joka on kirjoitettu sivujen muodossa.

Onko parketti ihmisten luettavissa?

ORC, Parketti ja Avro ovat myös kone- luettavissa binäärimuodoissa, mikä tarkoittaa, että tiedostot näyttävät hölynpölyltä ihmisiä . Jos tarvitset ihminen - luettavissa muodossa, kuten JSON tai XML, sinun pitäisi luultavasti harkita uudelleen, miksi käytät Hadoopia alun perin.

Suositeltava: