Miten tietojen lokalisointi saavutetaan Hadoopissa?
Miten tietojen lokalisointi saavutetaan Hadoopissa?

Video: Miten tietojen lokalisointi saavutetaan Hadoopissa?

Video: Miten tietojen lokalisointi saavutetaan Hadoopissa?
Video: Kanta kouluttaa: Sote-uudistuksen ja asiakastietolain vaikutukset tietojen käsittelyyn 2024, Marraskuu
Anonim

Tietojen lokalisointi sisään Hadoop . Otetaan esimerkki Wordcount-esimerkistä, jossa suurin osa sanoista on toistettu vähintään 5 Lacsia kertaa. Siinä tapauksessa Mapper-vaiheen jälkeen jokaisessa kartoitustulosteessa on sanoja alueella 5 Lacia. Tätä täydellistä Mapper-tulosteen tallentamista LFS:ään kutsutaan nimellä Tietojen lokalisointi.

Kun tämä pidetään mielessä, mitä on tietojen lokalisointi Hadoopissa?

Käsite Data paikkakunta sisään Hadoop Data paikkakunta sisään MapReduce viittaa kykyyn siirtää laskentaa lähelle todellista paikkaa tiedot sijaitsee solmussa sen sijaan, että liikkuisi suurena tiedot laskemiseen. Tämä minimoi verkon ruuhkautumisen ja lisää järjestelmän kokonaiskapasiteettia.

Ja kuinka iso data tallennetaan? Useimmat ihmiset yhdistävät HDFS:n tai Hadoop Distributed File Systemin automaattisesti Hadooppiin tiedot varastot. HDFS tallentaa tiedot klustereihin, jotka koostuvat pienemmistä lohkoista. Nämä lohkot ovat tallennettu paikan päällä fyysisesti varastointi yksiköt, kuten sisäiset levyasemat.

Niin, kuinka tiedot tallennetaan Hadoopissa?

On a Hadoop klusteri, tiedot HDFS ja MapReduce-järjestelmä sijaitsevat jokaisessa klusterin koneessa. Data On tallennettu sisään tiedot lohkoja DataNodesissa. HDFS kopioi ne tiedot lohkoja, yleensä kooltaan 128 megatavua, ja jakaa ne niin, että ne replikoidaan useissa klusterin solmuissa.

Miten tiedostot tallennetaan HDFS:ään?

HDFS paljastaa a tiedosto järjestelmän nimiavaruus ja sallii käyttäjätietojen käytön tallennettu sisään tiedostot . Sisäisesti a tiedosto on jaettu yhdeksi tai useammaksi lohkoksi ja nämä lohkot ovat tallennettu DataNode-joukossa. NameNode suoritetaan tiedosto järjestelmän nimitilan toiminnot, kuten avaaminen, sulkeminen ja uudelleennimeäminen tiedostot ja hakemistoja.

Suositeltava: