Elemzési munka előkészülete
A hiányzó értékek kezelésének egyik módja az az őket tartalmazó sorok eltávolítása. Ez a Hiányzó érték csomóponttal valósítható meg. Megvizsgáljuk a változót elemkészletet és eltávolítjuk azokat a mintákat, amelyek hiányzó értéke van erre a változóra.
Mindig szükséges ellenőrizni, hogy a hiányzó érték kezelési mód nem okoz-e nem kívánt változást. Ehhez összehasonlíthatjuk a két hisztogramot, hogy ellenőrizzük az eloszlását a hiányzó értékek eltávolítása előtt és után.
Ezt ellenőriznünk kell annak biztosítása érdekében, hogy a hiányzó értékekkel rendelkező minták eltávolítása ne változtassa meg jelentősen a változó eloszlását.
A Histogram Nézet vizualizációs beállításai lapon kiválaszthatja a Címkék > Az összes elemhez lehetőséget az egyes tárolók pontos sorszámának megtekintéséhez.
A hiányzó értékek kezelésének másik módszere, ha a hiányzó értékeket az oszlop középértékével vagy mediánjával helyettesítjük. Ez ugyanazzal a Hiányzó érték csomóponti folyamattal valósítható meg, mint amilyet már elértünk.
Eddig eltávolítottuk az egyes változók hiányzó értékeit, de eltávolíthatjuk azokat a sorokat is, amelyek bármely változó esetében hiányzó értékkel rendelkeznek. Ezt úgy érheti el, hogy az oszlopbeállítások lapon az Eltávolítás gombra kattintunk.
Megjegyzések
Megjegyzés küldése