Ugrás a fő tartalomra

KNIME alapok 2

 Knime munkaterület elemek és szerepük




1. KNIME Explorer:  Itt érheti el és rendszerezheti a mentett munkafolyamat-projekteket. Itt a jobb gombbal lehet létrehozni vagy importálni őket, vagy exportálni megosztásra a megosztani kívánt projekt jobboldali kattintásával. Nyissa meg a Példa munkafolyamatot a KNIME Explorerben, ha duplán kattint rá.


2. Munkafolyamat-szerkesztő:  Ez az ablak fő része. Itt húzhat új csomópontokat, hozhat kapcsolatot közöttük, konfigurálhatja és hajthatja végre őket az adatok műveleteinek és elemzésének elvégzéséhez. Állítsa be a ZOOM-ot a nyíllal jelzett legördülő menüvel.


3. Vázlat:  Ez a munkafolyamat széles körű áttekintése. A nagy munkafolyamatok egyszerű navigálásához kattintson és húzza a kék négyzetet.


4. Konzol:  Ez naplózza a csomópontokkal és adatokkal kapcsolatos állapotra, figyelmeztetésekre vagy hibákra vonatkozó releváns információkat, így kijavíthatja az esetleges problémákat. A részletesség a Beállítások>KNIME>KNIME GUI alatt módosítható.





5. Csomópont adattár:  Keresse meg az összes KNIME csomópontot kategóriákba rendezve. Keressen egy adott csomópontot név szerint a keresőmező segítségével. A csomópont használatához kattintson rá a Munkafolyamat-szerkesztőre. Közvetlenül felette van a Workflow Coach, amely opcionális. A közösségi ajánlások alapján javasolhatja a munkafolyamat következő legvalószínűbb csomópontját.


6. Csomópont leírása:  Ha egy csomópontot kiválasztanak, akár a Csomópont-tárházban, akár a Munkafolyamat-szerkesztőben, ez megjeleníti az adott csomópont dokumentációját, valamint a csomópont egyes portjának leírását.












KNIME munkafolyamat indítása

Indítsunk el egy új KNIME munkafolyamatot.

1. A felső menüsorban válassza a Fájl > Új...

2. Az ablakban válassza az Új KNIME munkafolyamat lehetőséget,  majd kattintson a Tovább >

3. Nevezze meg a munkafolyamatot valami leíró jellegűnek, pl. "BevételiÜzeltiTevékenységek"

4. A LOCAL alapértelmezett célállomása elmenti ezt a munkafolyamatot a KNIME-telepítés helyi munkaterületén. 

Kattintson a Befejezésgombra. 

Az új munkafolyamatot a HELYI alatt a KNIME Explorer nézetben tekintheti meg.




Adatkészlet importálása

A munkafolyamat első lépése az adatkészletben való olvasás.
1. Húzza a Fájlolvasó  csomópontot a Munkafolyamat-szerkesztőre. A Fájlolvasó csomópontot a Csomópont tárház keresőmezőjében a "Fájlolvasó" beírásával keresheti meg, vagy az IO alatt találja meg, majd a Csomópont tárházában az Olvasás kategóriában.
2. Kattintson duplán a Konfigurálás párbeszédpanel megnyitásához.
3. Kattintson a Tallózás gombra, és válassza ki a csv adatkészletfájl helyét.
4. A Konfigurálás párbeszédpanel bezárásához kattintson az OK gombra.
5. Kattintson a jobb gombbal a csomópontra, és kattintson a Végrehajtás gombra

Histogram létrehozása

A folyamatos változó eloszlásának vizsgálatára általában histogramot használnak. Az adatokat tárolókra osztja, és az egyes tárolók tartományán belül ábrázolja az előfordulások gyakoriságát.




Lépések:
1. Keresse meg a Histogram-csomópontot,  amely a csomópont-tárház "Nézetek" kategóriájában található, és húzza a munkafolyamat-szerkesztőbe.
2. Csatlakoztassa a Histogram-csomópontot a Fájlolvasó csomóponthoz.
3. Kattintson duplán a Histogram-csomópontra a Konfigurálás párbeszédpanel megnyitásához. Válassza a megfelelő oszlop és az  összesítés oszlop . A tárolok száma bármi lehet, ami értelmet ad az adatoknak. Az alapértelmezett érték 10. Kattintson az  OK  gombra a konfiguráció mentéséhez és a párbeszédpanel bezárásához.
4. Hajtsa végre a munkafolyamatot a tetején található dupla zöld nyílra kattintva.
5. A kész histogram megtekintéséhez kattintson a jobb gombbal a Histogram csomópontra, és válassza a "Nézet: Histogram nézet" lehetőséget. 
Az x tengelyű címkék az egyes tárolók tartományát mutatják, az y tengely pedig az egyes tárolókban lévő minták gyakoriságát. 
Bővítheti az ablakot, hogy jobban láthassák a címkéket.




Munka/ feldolgozó modell alkotás KNIME-ben


A KNIME node / csomópont egyetlen feldolgozó egység a munkafolyamatban. Először is hozzunk létre egy új csomópontot. Győződjön meg arról, hogy a Munkafolyamat-szerkesztő . A Csomóponttárban válassza a Manipuláció > oszlop   >  szűrőkategóriakategóriát, és  húzza  az Oszlopszűrő csomópontot a  Munkafolyamat-szerkesztőre. 

Ezt a csomópontot a zöld téglalap által kiemelt keresősáv segítségével is megtalálhatja. 




Kereshetünk név szerint, például "filter".


A Fájlolvasó csomópont az, ami egy adathalmazban olvasható, és a kimeneti porton keresztül szállítja. Ha a Fájlolvasó csomópont kimenetét az Oszlopszűrő csomópont bemenetéhez szeretné csatlakoztatni, húzza az egérmutatót a Fájlolvasó jobb oldalán lévő fekete nyílról, és húzza az oszlopszűrő bal oldalán lévő fekete nyílra.



 Konfiguráljuk az új csomópontot. Az Oszlopszűrő csomópont konfigurálási ablakát az ikonra duplán kattintva, vagy a jobb gombbal kattintva, valamint a "Konfigurálás... ".

Minden csomóponttípusnak más konfigurálási ablaka van, de az Oszlopszűrő segítségével kiválaszthatja, hogy mely oszlop(ok)ot szeretné kizárni a következő csomópontba vezető folyamatba való átjutásból.

Ezt úgy tehetjük meg, hogy rákattintunk egy oszlop nevére, és kiválasztjuk a ">> hozzáadása" vagy a "<< eltávolítás" gombot. A nodokon beállítás során haladjunk sorrendben végig  az adatfolyam  csővezeték mentén.


Ezután kattintson az ABLAK gombra az ablak alján. Minden alkalommal, amikor módosítja a csomópont konfigurációját, azt fogja mondani, hogy "Figyelmeztetés, állítsa vissza a csomópont(ok)ot." Kattintson az OK gombra.

A módosított adatokat a csomópont jobb oldali kattintva és a nagyító ikon kiválasztásával tekintheti meg.

Végül nevezzük át ezt a csomópontot nekünk tetszőnek, a folyamat könnyebb leolvasása érdekében. Ehhez kattintson duplán az ikon alatti szövegre,  és kezdjen el begépelni valami hasonlót, mint a "Fő adatfolyam", majd kattintson a szövegdobozon kívülre.

Csomópontállapotok:  Figyeljük meg az egyes csomópontok alatti 3 kört. A csomópont állapotát mutatják.





Lépjünk a munkafolyamat végén található Scatter Plot csomópontra, kattintsunk a jobb gombbal a "Végrehajtás" elemre.


Látnunk kell az összes csomópontot, amelyet a Scatter Plot a zöldre váltott, ami azt jelenti, hogy mindegyik sikeresen végrehajtott.


Végül a munkafolyamat mentéséhez válasszuk a Mentés, mentés másként vagy Az összes ikon mentése lehetőséget a felső eszköztáron.




Scatter plot létrehozása

A szórásdiagram a két változó közötti kapcsolatot ábrázoló pontokat jeleníti meg, és a változók közötti korreláció vizuális vizsgálatára használható.



Lépések:

1. Keresse meg a Scatter Plot  csomópontot, amely a Nézetek kategóriában található. Húzza a munkafolyamat-szerkesztőbe, és csatlakoztassa a Fájlolvasó csomóponthoz.

2. Nincs szükség további konfigurációra. Hajtsa végre a munkafolyamatot, tekintse meg a Scatter Plot csomópontot, és tekintse meg az Oszlopkiválasztás lapot, hogy az X oszlop és az Y oszlop  kiválasztáshoz, vagy módosításhoz.


Sávdiagram létrehozása

A sávdiagram egy kategorikus változó eloszlásának megjelenítésére szolgál. Sávdiagram készítéséhez a KNIME-ben a Histogram csomópontot használhatjuk az összesítő oszlop kiválasztása nélkül.



Sávdiagramot fogunk használni a változó eloszlásának megjelenítéséhez.

1. Keresse meg a Numerikus Binner  csomópontot, amely a Manipuláció-Oszlop-Binning kategóriában található. Húzza a munkafolyamat-szerkesztőbe, és csatlakoztassa a Fájlolvasó csomóponthoz.
2. A Numerikus binner-csomópont Konfigurálása párbeszédpanelen jelölje ki a megfelelő oszlopot, és adjon hozzá 5 tárolót.
3. Az első és az utolsó tároló pontosan ugyanaz lesz (A csomópont állapota figyelmeztetést fog mutatni. Ez várható.).
4. Töltse ki az egyes tárolók min és max értékeit
6. Győződjön meg arról, hogy az "Új oszlop hozzáfűzése" ellenőrzésre kerül
7. Keresse meg a Histogram csomópontot  (a Nézetek kategóriában), és húzza a Munkafolyamat-szerkesztőbe. Ezután csatlakoztassa a Numerikus Binner-csomópontot a Histogram-csomóponthoz.
8. A Histogram-csomópont Konfigurálása párbeszédpanelen válassza ki az új oszlopot Binning oszlopként,és győződjön meg arról, hogy az összesítési oszlopok  üresek.
9. Most hajtsa végre a munkafolyamatot, és tekintse meg az eredményt.


Egy komplex elemzési folyamat részlet:



Pár diagram típus:




KNIME források

·        A KNIME honlapja

·        KNIME első lépések

·        KNIME Online Önképzés

·        KNIME gyorstalpaló útmutató

Megjegyzések