Mikä on AWS MapReduce?
Mikä on AWS MapReduce?

Video: Mikä on AWS MapReduce?

Video: Mikä on AWS MapReduce?
Video: Hadoop in AWS, Azure and Google Cloud 2024, Huhtikuu
Anonim

Amazon elastinen MapReduce (EMR) on Amazon Web Services ( AWS ) työkalu suuren datan käsittelyyn ja analysointiin. Amazon EMR käsittelee suurdataa Hadoop-virtuaalipalvelinklusterissa Amazon Elastic Compute Cloudissa (EC2) ja Amazon Simple Storage Servicessä (S3).

Kuinka AWS EMR toimii tällä tavalla?

Palvelu käynnistää asiakkaan määrittämän määrän Amazon EC2 -esiintymiä, jotka koostuvat yhdestä isännästä ja useista muista solmuista. Amazon EMR käyttää Hadoop-ohjelmistoa näissä tapauksissa. Pääsolmu jakaa syötetiedot lohkoihin ja jakaa lohkojen käsittelyn muille solmuille.

Yllä olevan lisäksi, mitä eroa on ec2:lla ja EMR:llä? Toisin kuin EMR , EC2 ei luokittele orjasolmuja ydin- ja tehtäväsolmuihin. Tämä lisää HDFS-tietojen menettämisen riskiä, jos solmu poistetaan tai katoaa. EC2 käyttää Apache-kirjastoja (s3a) päästäkseen s3:n tietoihin. Toisaalta, EMR käyttää AWS:n omaa koodia päästäkseen nopeammin s3:een.

Sitä paitsi, onko AWS EMR täysin hallittavissa?

Amazon Elastinen MapReduce ( EMR ) on täysin hallinnassa Hadoop ja Spark alusta alkaen Amazon Verkkopalvelu ( AWS ). Kanssa EMR , AWS asiakkaat voivat nopeasti muodostaa monisolmuisia Hadoop-klustereita käsitelläkseen suuria datatyökuormia.

Käyttääkö AWS Hadoopia?

Amazon Web palvelut käyttää avoimen lähdekoodin Apache Hadoop hajautettu laskentatekniikka helpottaa suurten laskentatehomäärien käyttöä dataintensiivisten tehtävien suorittamiseen. Hadoop , Googlen MapReducen avoimen lähdekoodin versio, on jo Yahoo ja Facebookin kaltaisten yritysten käytössä.

Suositeltava: