Ugrás a fő tartalomra

BI DWH foglamak

Az üzleti intelligencia fogalma:
Olyan módszerek, fogalmak halmazát jelenti, melyek a döntéshozás folyamatát javítják
adatok és ún. szakterület alapú rendszerek használatával.


A "szakterület rendszer" fogalma a következő alrendszereket foglalja magába:
- Vezetői információrendszerek (Executive Information Systems);
- Döntéstámogató rendszerek (Decision Support Systems, DSS);
- Vállalat irányítási információrendszerek (Enterprise Information Systems);
- Üzleti információ elemző rendszerek (Online Analitical Processing (OLAP));
- Adat és szövegbányászat;
- Adat vizualizáció
- Térinformatikai rendszerek (Geographic Information Systems, GIS).




Előrejelző elemzéseknél egy modell felállítása a cél, mellyel múltbeli adatokból
következtethetünk jövőbeli eredményekre. Ilyen modellel lehetséges pl. egy változó
értékének becslése több változóból úgy, hogy megvizsgáljuk milyen összefüggés volt
a múltban a kulcsváltozó és a többi változó között. A már rendelkezésre álló
adatokra építve tehát felállítható egy előrejelző modell.

A bankok ügyféladatait felhasználva ilyen modellel mérhető fel az egyes ügyfelek hitelkockázati mutatója, mely valamennyi ilyen esetre építve keres kapcsolatot a hitelkockázat és már egyéb
változók – nem, kor, jövedelem, adósság, betétállomány, folyószámla – között.



Előrejelző modellek épülhetnek statisztikai regresszióra vagy osztályozó
(classification) technikákra, mint pl. döntési fa vagy neurális háló, de alkalmazható
az un. memória-alapú következtetés (memory-based reasoning) technikája is. A
regressziós eljárások közül a logisztikus regresszió, az osztályozó technikák közül
mind a döntési fa, mind a neurális háló módszerek alkalmasak nem lineáris
összefüggések felismerésére.


A statisztikai regresszió a független és függő változók közötti összefüggéseket
vizsgálja és a kapcsolatot leíró két-vagy többváltozós függvényt keresi. Egyszerűbb
formája a lineáris regresszió, amikor lineáris kapcsolatot feltételezünk a változók
között, s a folytonos eredményváltozó értéke egy vagy több független változó
lineáris függvényeként alakul ki.

Logisztikus regressziónál ugyanakkor az eredményváltozó mérési szintje bináris vagy ordinális változó, s keresett kapcsolat lehet nemlineáris is. Logisztikus regressziót alkalmaznak bankok, biztosítók
Az ügyfélkockázat-elemzésénél, de az egészségügyben a különböző rizikófaktorok
ismeretében a betegségek kialakulásának valószínűségét is ezzel az eljárással lehet
megállapítani.

A regressziós technikák két csoportba oszthatók a függő és független változók
között fennálló összefüggések milyensége alapján: lineáris és nemlineáris regresszió.

A legelterjedtebb regressziós technika a lineáris regresszió, mely a függő változót
független változók lineáris kombinációjaként becsli

A függő és független változó között azonban előfordulhat, hogy bonyolultabb, nem lineáris összefüggés van.
Ilyen esetben használhatóak a nemlineáris regressziós modellek, mint a paramétereiben
lineáris regresszió vagy a paramétereiben nemlineáris regresszió.

A döntési fa felépítése során az egész adathalmazt bontjuk részekre olyan változók
mentén, amelyek feltehetően szoros kapcsolatban vannak a kulcsváltozónkkal. A fa
ágainak minden elágazásánál egyszerű igen/nem vagy több választást lehetővé tevő
(multiple choice) kérdésekkel bontjuk további részekre a halmazt.
Az így kialakított döntési fa felhasználásával új adatok felvételekor a megfelelő ágat végigkövetve
becslést kaphatunk a kulcsváltozó lehetséges értékére.




Adatbázis anomáliák kiküszöbölése: normálforma
- 1NF: reláció mezői elemi értékek
- 2NF: 1NF és egyik mezőérték meghatározásához összetett kulcs kell, akkor másikhoz is ez kell
- 3NF: 2NF és nem kulcs jellemzői függetlenek egymástól
- BCNF: 3NF és egyetlen nem kulcs sem része egy összetett kulcsnak (nincs kulcstörés)
- 4NF: csak akkor áll fenn A1A2AN › B1B2BN, ha A1A2AN szuperkulcs





Megjegyzések