2016. október 31., hétfő

SPSS modeler alapok : nodok


Node (műveleti csomopontok) és funkciók:

Nodok listája:













Filter : kimeneti mezo lista szűkítés, átnevezés (mintha a select utánni mező listát módosítanánk)


Műveleti nodok


Filler : kimeneti konkrét mező tisztitása, átdeffiniállásas, kiegészítése, szükítése : feltétel és hatókör mentén




Types  : tipus, szekezet, formázás mezőkre beállítása



SQL (IN) adatbázis sql parncs vagy táblanév megadása






SQL (OUT) adatbázis tábla megadása, merge választásnál a kulcs és adatmezők pontosítása szükséges





var file (IN) : szöveges állomáynmegadás, sor, mező separáció, fejléc tartalmazás, kizárható sorok, kódolás, ... beállítása is kell




Derive : kimeneti mezőlista bővítés, összevonás, új létrehozása (milyen esetbe milyen mező érték jelenjen meg) (Mintha case when szerkezetel új mezőt csinálnánk)



Merge  : táblázat tartalomak egymáshoz kapcsolása innerjoin, outerjoin és a mezők egymás mellet (teljes lista)



Aggregate : Csoportosítás.  : count, Sum, Mean, Min, Max .. miat




Sort : Rendezés  ||  Asc : növekvő, Desc :Csökkenő sorrend



Select : Szűrés || (where tag szerkesztés)




Restructure : Sorokból oszlop kiforgatása valamely számolt érték mező (k) szerint





A szerző nevének kimetszésére

if issubstring("Előzmény",'Short Description')
then trim(substring_between(issubstring(":",'Short Description')+1,issubstring("(",'Short Description')-1,'Short Description'))
else "" endif

A  vélemény

if     'Category_Velemeny/Negativ' = "T" and 'Category_Velemeny/Pozitiv'= "T" then "Vegyes"
elseif 'Category_Velemeny/Negativ' = "T" and 'Category_Velemeny/Pozitiv'= "F" then "Negativ"
elseif 'Category_Velemeny/Pozitiv' = "T" and 'Category_Velemeny/Negativ' ="F" then "Pozitiv" else "Nincs vélemény" endif


A minősített (+/-) vélemény

(-1*Velemeny_Negativ_Record_Count_Sum_arany)+Velemeny_Pozitiv_Record_Count_Sum_arany

 Különleges karakterek cseréje (tisztítás)  || Filler node

replace("ő","ö",
replace("Ő","Ö",
replace("ű","ü",
replace("Ű","Ü",
replace(unicode_char(9)," ",
replace(unicode_char(10)," ",
replace(unicode_char(11)," ",
replace(unicode_char(12)," ",
replace(unicode_char(13)," ", @FIELD)))))))))





Minta reguláris kifejezés:

regexp1=(\+?36)?[/ -]?(20|30|70|31)[/]([/ -]?[0-9]){7}

A szövegmodellben felvett kategoriák jelennek meg

if   issubstring('/2014',Concept1)
 or  issubstring('/2015',Concept1)
 or  issubstring('/2016',Concept1)
 or  issubstring('/2017',Concept1)
  then substring_between(issubstring('/201',Concept1)-7,issubstring('/201',Concept1)-1,Concept1)
elseif length(Concept1) < 20
  then endstring(7,Concept1)
else Concept1

endif

SPSS modeler alapok : TLA macros + regexp

Szöveg minták azonosítására, hasonlóságok összefonására szolgáló szabályleírók.


Használatuk:


[macros]       ## Megj: makro cimkék definiálási kezdő cimke

FORINT=(forint|huf|ft|-fttal|ftot|ft-ot|ft-t|-ft-ot.|ft/hó|ft-ot)  ## Megj: a cimke csupa nagybetű

BIZTOSITOK=(groupamagarancia.hu|allianz.hu|generali.hu|signal.hu|groupamagarancia|cib.hu|aegon.hu|kh.hu]kh.hu)

COUNTRYCODE=(00|06|36|+36)
MOBIL=(20|30|70)

#**************************************************************
# Telefonszam minta kiválasztás reguláris kifejezéssel
#**************************************************************
[phone]  ## Megj : Kisbetű a cimke !!

## Megj :  $ jel és macro névvel hívatkozás
regexp1=[+]?($(COUNTRYCODE))[-/  ]($(MOBIL))[-/ ][0-9]{7}  
regexp2=[+]?($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{7}
regexp3=[+]?($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{4}[-/ ][0-9]{3}
regexp4=[+]?($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{3}[-/ ][0-9]{4}
regexp5=[+]?($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{3}[-/ ][0-9]{2}[-/ ][0-9]{2}
regexp6=[+]?($(COUNTRYCODE))($(MOBIL))[-/ ][0-9]{3}[-/ ][0-9]{2}[-/ ][0-9]{2}
regexp7=($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{7}
regexp8=($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{7}
regexp9=($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{4}[-/ ][0-9]{3}
regexp10=($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{3}[-/ ][0-9]{4}
regexp11=($(COUNTRYCODE))[-/ ]($(MOBIL))[-/ ][0-9]{3}[-/ ][0-9]{2}[-/ ][0-9]{2}
regexp12=($(COUNTRYCODE))($(MOBIL))[-/ ][0-9]{3}[-/ ][0-9]{2}[-/ ][0-9]{2}
regexp13=($(MOBIL))[-/ ][0-9]{7}
regexp14=($(MOBIL))[-/ ][0-9]{7}
regexp15=[+]?($(COUNTRYCODE))($(MOBIL))[0-9]{7}
regexp16=($(COUNTRYCODE))($(MOBIL))[0-9]{7}
regexp17=($(MOBIL))[-/ ][0-9]{4}[-/ ][0-9]{3}
regexp18=($(MOBIL))[-/ ][0-9]{3}[-/ ][0-9]{4}

caseSensitive=0                   ## Megj: Kis- nagy betűérzékenység
accentSensitive=0

---
## Megj: configuration beállítások TAB szeparát 0 és s paraméteres megadás, aktíválás
#name Language Pos
url 0 s
callcenterAid 0 s


MS oktatások

Kicsit fejlesztettem és teszteltem magamat. https://docs.microsoft.com/hu-hu/ Érdemes végig csinálni, vagy legalább kipróbálni. ...