Sisällysluettelo:

Miten käsittelet R:n NA-arvoja?
Miten käsittelet R:n NA-arvoja?

Video: Miten käsittelet R:n NA-arvoja?

Video: Miten käsittelet R:n NA-arvoja?
Video: НОЧЬ С ДЕМОНОМ В КВАРТИРЕ ЧАСТЬ 2 2024, Joulukuu
Anonim

Kun tuot tietojoukon muista tilastosovelluksista, puuttuvat arvot voidaan koodata numerolla, esimerkiksi 99. Antaakseen R tiedä, että se on a puuttuva arvo sinun täytyy koodata se uudelleen. Toinen hyödyllinen toiminto R to käsitellä puuttuvia arvoja On na . omit(), joka poistaa epätäydelliset havainnot.

Niin, miten käsittelet NA:ta R:ssä?

NA-vaihtoehdot R:ssä

  1. jättää väliin ja ei. poissulkeminen: palauttaa objektin havainnoista poistettuina, jos ne sisältävät puuttuvia arvoja; eroja NA:iden pois jättämisen ja poissulkemisen välillä voidaan nähdä joissakin ennuste- ja jäännösfunktioissa.
  2. pass: palauttaa objektin muuttumattomana.
  3. epäonnistua: palauttaa objektin vain, jos se ei sisällä puuttuvia arvoja.

Samoin, kuinka käsittelet puuttuvat kategoriset tiedot R:stä? Kategoristen tapojen puuttuvia arvoja voidaan käsitellä useilla eri tavoilla.

  1. Jätä huomiotta puuttuvien arvojen havainnot, jos käsittelemme suuria tietojoukkoja ja pienemmällä määrällä tietueita puuttuu arvoja.
  2. Ohita muuttuja, jos se ei ole merkitsevä.
  3. Kehitä malli puuttuvien arvojen ennustamiseksi.
  4. Käsittele puuttuvia tietoja pelkkänä luokkana.

Samalla tavalla voidaan kysyä, kuinka asetat puuttuvat arvot R:ssä?

Sisään R , puuttuvat arvot niitä edustaa symboli NA (ei saatavilla). Mahdotonta arvot (esim. jakaminen nollalla) esitetään symbolilla NaN (ei numerolla). Toisin kuin SAS, R käyttää samaa symbolia merkeille ja numeroille tiedot . Lisää harjoittelua työskentelyyn puuttuvat tiedot , kokeile tätä siivouskurssia tiedot kirjassa R.

Mitä Na Rm tarkoittaa R:ssä?

Dataframe-funktiota käytettäessä na . rm sisään r viittaa loogiseen parametriin, joka kertoo funktiolle, poistetaanko se vai ei NA arvot laskelmasta. Se kirjaimellisesti tarkoittaa NA Poista. Se ei ole toiminto eikä operaatio. Se on yksinkertaisesti useiden tietokehysfunktioiden käyttämä parametri.

Suositeltava: