Ugrás a fő tartalomra

Bejegyzések

Bejegyzések megjelenítése ebből a hónapból: július, 2016

Adatbányászat alapjai

Az adatbányászat a tudás kinyerése az összegyűlt nagyon nagy tömegű adatokból. Érdekes/értékes információ minták kinyerése nagyon nagy adathalmazokból lehetőleg automatikusan és minél hatékonyabban. Tehát olyan tudást keresünk amely nem triviális, implicit, eddig nem ismert és potenciálisan hasznos illetve hasznosítható. Adatbányászat más elnevezései: tudásfeltárás az adatbázisokban (Knowledge discovery in databases) tudáskinyerés (knowledge extraction), adatelemzés, mintaelemzés (data/pattern analysis), információ-betakarítás (information harvesting) üzleti intelligencia (business intelligence). Adatelemzési típusok: jellemzés (karakterizáció), megkülönböztetés (diszkrimináció), kapcsolódás (asszociáció), osztályozás (klasszifikáció), csoportosítás (klaszterezés), trendreilleszkedés/trendtől eltérés, kiugró(outlier) esetek elemzése. Az 5 lépcsős adatbányászati folyamat: Mintavétel: az adatok előkészítése az adattárházból. Feltárás: új összefügg

DWH és DM alapok, építési elvek

Alapfogalmak A Business Intelligence – üzleti intelligencia (BI) célja   az üzleti döntéshozást megkönnyítendő adathalmazok feldolgozása, ezekből kimutatások, statisztikák létrehozása, gyakorlatilag a szervezet összes szintjén az üzleti döntéshozás valós időben való megkönnyítése. Adattárház deffiniciói – I. “A data warehouse is a subject oriented, integrated, nonvolatile, and time variant collection of data in support of management’s decisions.” — “Az adattárház olyan témaspecifikus, integrált, időfüggő, fizikailag is tárolt adatgyűjtemény,  amely a menedzsment döntéshozó folyamataihoz szükséges lehet.” (W. H. Inmon) => Modellje szerint azonnal adattárházat tervezünk, mely azonnal szolgáltatásokat fog nyújtani az vállalat egésze számára. — Adattárház:  A vállalt üzleti folyamatiban integrált, a teljes infrastruktúrát lefedő rendszer. Általában nem felejtő, historikusan tárolt adatokból dolgozik. -II. Data Warehouse: “The conglomeration of an organization