Mitä vähennetään avaimella?
Mitä vähennetään avaimella?

Video: Mitä vähennetään avaimella?

Video: Mitä vähennetään avaimella?
Video: KUKA LÖYTÄÄ AVAIMEN VOLTTIMONTUSTA, SAA KASSAKAAPIN SISÄLLÖN 2024, Saattaa
Anonim

Spark RDD reductionByKey -toiminto yhdistää kunkin arvot avain käyttämällä assosiatiivista vähentää toiminto. Tämä tarkoittaa intuitiivisesti, että tämä toiminto tuottaa saman tuloksen, kun sitä käytetään toistuvasti samalle RDD-datajoukolle useilla osioilla riippumatta elementtien järjestyksestä.

Mitä eroa sitten on groupByKey:n ja ReductionByKeyn välillä?

groupByKey () on vain ryhmitellä tietojoukkosi avaimen perusteella. vähennäByKey () on jotain kuin ryhmittely + yhdistäminen. vähennäByKey voidaan käyttää, kun käytämme suuria tietojoukkoja. aggregateByKey() on loogisesti sama kuin vähennäByKey () mutta sen avulla voit palauttaa tuloksen eri tyyppi.

Tiedä myös, miksi vähentää toimintaa kipinässä? Vähennä kipinöitä operaatio on an toiminta eräänlainen operaatio ja se laukaisee täyden DAG-suorituksen kaikille laiskaille ohjeille. Kipinä RDD vähentää toiminto vähentää tämän RDD:n elementtejä käyttämällä määritettyä kommutatiivista ja assosiatiivista binaarioperaattoria. Vähennä kipinöitä toiminta on lähes samanlainen kuin vähentää menetelmä Scalassa.

Yllä olevan lisäksi mikä on Pairrdd?

Spark tarjoaa erikoistoimintoja RDD:ille, jotka sisältävät avain/arvo-pareja. Näitä RDD:itä kutsutaan pari-RDD:iksi. Pari-RDD:t ovat hyödyllinen rakennuspalikka monissa ohjelmissa, koska ne paljastavat toiminnot, joiden avulla voit toimia jokaisella avaimella rinnakkain tai ryhmitellä tietoja uudelleen verkon yli. PariRDD ovat AVAIN/ARVO-pareja.

Onko reductionByKey toiminta?

Reduction() tulostaa kokoelman, joka ei lisää suunnattua asyklistä kuvaajaa (DAG), joten se toteutetaan toiminta . Kuitenkin, vähennäByKey () palauttaa RDD:n, joka on vain toinen taso/tila DAG:ssa, joten se on muunnos.

Suositeltava: