Sisällysluettelo:

Mitä ovat poikkeamat data-analyysissä?
Mitä ovat poikkeamat data-analyysissä?

Video: Mitä ovat poikkeamat data-analyysissä?

Video: Mitä ovat poikkeamat data-analyysissä?
Video: Data-analytiikka laskentatoimessa 2024, Marraskuu
Anonim

Tilastoissa an poikkeama on tiedot kohta, joka eroaa merkittävästi muista havainnoista. An poikkeama voi johtua mittauksen vaihtelusta tai se voi viitata kokeelliseen virheeseen; jälkimmäiset jäävät joskus ulkopuolelle tiedot aseta. An poikkeama voi aiheuttaa vakavia ongelmia Tilastolliset analyysit.

Kun otat tämän huomioon, kuinka löydät poikkeamat tiedoista?

Piste, joka jää ulkopuolelle tiedot sarjan sisäaidat luokitellaan alaikäisiksi poikkeama , kun taas ulompien aitojen ulkopuolelle jäävä luokitellaan suureksi poikkeama . Löytääksesi sisäiset aidat tiedot aseta ensin, kerro interkvartiilialue 1,5:llä. Lisää sitten tulos Q3:een ja vähennä se Q1:stä.

Pitäisikö minun poistaa tiedoistani yllä olevat poikkeamat? varten the suurin osa, jos tietosi nämä ääritapaukset vaikuttavat sinuun voi sidottu the panos historialliseen edustajaan tietosi joka sulkee pois poikkeamat . Päätä tapauskohtaisesti, mitä the vaikutus poikkeamat oli. Ja sen jälkeen päätä, haluatko Poista , muuta tai säilytä outlier arvot.

Miten data-analyysi käsittelee poikkeavia arvoja tässä suhteessa?

Tässä on neljä lähestymistapaa:

  1. Pudota outlier-tietueet. Bill Gatesin tai muun todellisen poikkeavan tapauksessa joskus on parasta poistaa tietue kokonaan tietojoukostasi, jotta kyseinen henkilö tai tapahtuma ei vääristä analyysiäsi.
  2. Rajoita poikkeamien tiedoistasi.
  3. Määritä uusi arvo.
  4. Kokeile muutosta.

Mikä on esimerkki poikkeavasta?

Poikkeama . more Arvo, joka "sitoo" useimpien muiden tietojoukon arvojen ulkopuolella (joka on pienempi tai suurempi kuin). varten esimerkki pisteissä 25, 29, 3, 32, 85, 33, 27, 28 sekä 3 että 85 ovat " poikkeamat ".

Suositeltava: