Ugrás a fő tartalomra

Knime alapok 3


 Elemzési munka előkészülete


A hiányzó értékek kezelésének egyik módja az az őket tartalmazó sorok eltávolítása. Ez a Hiányzó érték csomóponttal valósítható meg. Megvizsgáljuk a  változót elemkészletet és eltávolítjuk azokat a mintákat, amelyek hiányzó értéke van erre a változóra.


Mindig szükséges ellenőrizni, hogy a hiányzó érték kezelési mód nem okoz-e nem kívánt változást. Ehhez összehasonlíthatjuk a két hisztogramot, hogy ellenőrizzük az eloszlását a hiányzó értékek eltávolítása előtt és után. 


Ezt ellenőriznünk kell annak biztosítása érdekében, hogy a hiányzó értékekkel rendelkező minták eltávolítása ne változtassa meg jelentősen a változó eloszlását.


 A Histogram Nézet vizualizációs beállításai  lapon kiválaszthatja a  Címkék > Az összes elemhez lehetőséget az egyes tárolók pontos sorszámának megtekintéséhez.


A hiányzó értékek kezelésének másik módszere, ha a hiányzó értékeket az oszlop középértékével vagy mediánjával helyettesítjük. Ez ugyanazzal a Hiányzó érték csomóponti folyamattal valósítható meg, mint amilyet már elértünk.


Eddig eltávolítottuk az egyes változók hiányzó értékeit, de eltávolíthatjuk azokat a sorokat is, amelyek bármely változó esetében hiányzó értékkel rendelkeznek. Ezt úgy érheti el, hogy az oszlopbeállítások lapon az Eltávolítás  gombra kattintunk. 



BIRT report használata

Áttérés Birt-be riport szerkesztéshez (kék keretben jelölve)






Visszatérés KNIME-hez (piros keretben)







Kész riport megjelenése HTML formátumban




Knime joinok:





Verzió infó




Telepített csomagok






Link


Megjegyzések