Mikä on DistCp Hadoopissa?
Mikä on DistCp Hadoopissa?

Video: Mikä on DistCp Hadoopissa?

Video: Mikä on DistCp Hadoopissa?
Video: Hadoop Rack Awareness 2024, Marraskuu
Anonim

DistCp (jaettu kopio) on työkalu, jota käytetään suuriin klustereiden väliseen kopiointiin. Se käyttää MapReduce suorittaa sen jakelun, virheiden käsittelyn ja palauttamisen sekä raportoinnin. Se laajentaa tiedostojen ja hakemistojen luettelon syötteiksi kartoittamaan tehtäviä, joista jokainen kopioi osion lähdeluettelossa määritetyistä tiedostoista.

Samalla tavalla voidaan kysyä, korvaako Distcp?

Minun pitäisi myös tarkentaa ja selittää se distcp - päälle tahtoa päälle tiedosto riippumatta siitä, vastaako koko vai ei. Tämä päivittää kaikki tiedostot hdfs-nn2:ssa, joiden koko ei vastaa hdfs-nn1:tä, sekä poistaa kaikki ylimääräiset tiedostot.

Samoin mikä on Hadoop FS -komento? Tiedostojärjestelmä ( FS ) -kuori sisältää erilaisia kuorimaisia komentoja jotka ovat suoraan vuorovaikutuksessa Hadoop Hajautettu tiedostojärjestelmä ( HDFS ) sekä muut tiedostojärjestelmät, jotka Hadoop tuet, kuten paikalliset FS , HFTP FS , S3 FS , ja muut.

Kuinka siirrän tällä tavalla tietoja yhdestä HDf:stä toiseen?

Hadoop fs cp – Helpoin tapa kopioida tietoja yhdestä lähdehakemistoon toinen . Käytä hadoop fs -cp [lähde] [kohde]. Hadoop fs copyFromLocal – Tarve kopioida tiedot paikallisesta tiedostojärjestelmästä sisään HDFS ? Käytä hadoop fs -copyFromLocal [lähde] [kohde].

Kuinka kopioin klusterin klusterista toiseen?

Tiedostojen kopioiminen välillä klustereita . Sinä pystyt kopioida tiedostoja tai hakemistoja eri välillä klustereita käyttämällä hadoop distcp -komentoa. Sinun on liitettävä tunnistetiedot tiedosto sinun kopio pyydä niin lähdettä klusterin voi vahvistaa, että olet todennettu lähteelle klusterin ja kohde klusterin.

Suositeltava: