Az ősbetöltés (initial load) az adattárház töltési folyamatának egyik legfontosabb lépése, amely során egy cél adattárházi táblát először töltünk fel teljes adatmennyiséggel. Ez az első betöltés biztosítja az adattárház alapállapotát, amelyre a későbbi incrementális (növekményes) frissítések épülnek.
Mikor van szükség ősbetöltésre?
✅ Új adattárház vagy új adatpiac (Data Mart) létrehozásakor
✅ Új dimenzió- vagy ténytábla bevezetésekor
✅ Rendszermigráció vagy nagyobb architekturális változások után
✅ Adattisztítás és újratöltés esetén (pl. sérült adatok helyreállítása)
✅ Archiválás után történő adatok visszatöltésénél
Ősbetöltés folyamata az adattárházban
Az initial load folyamata több lépésből áll:
1️⃣ Forrásrendszer adatainak kinyerése (Extract)
- Adatok lekérése a forrásrendszerből SQL-lel, ETL eszközzel vagy export/import módszerekkel.
- Példa forrásadatok lekérésére:
2️⃣ Adattisztítás és transzformáció (Transform)
- Duplikációk kezelése, formátumok egységesítése, adattisztítás.
- Példa null értékek kezelésére:
3️⃣ Betöltés az adattárházba (Load)
- Az adatok beillesztése az adattárház cél táblájába.
- Példa INSERT használatával:
Ősbetöltés kivitelezése Oracle-ben
Az adattárház betöltéséhez az alábbi Oracle megoldások használhatók:
INSERT INTO SELECT – Egyszerű betöltés kisebb adatmennyiségre
Ha a forrásadatok közvetlenül elérhetők, az alábbi SQL-lel egyszerűen átmásolhatók:
Hátránya: Nagy adatmennyiségnél rollback és lock problémák léphetnek fel.
Direct Path Insert (INSERT /+ APPEND / SELECT)
Ha több millió rekordot kell betölteni, a DIRECT PATH módszer javasolt, amely gyorsítja a betöltést és minimalizálja az UNDO és REDO terhelést:
Ősbetöltés során figyelembe veendő szempontok
🔸 1. Indexek és Constraint-ek kezelése
- Nagy adatmennyiségnél érdemes először letiltani az indexeket és külső kulcsokat, majd betöltés után újraépíteni.
- Indexek újraépítése
Tranzakciókezelés és teljesítmény
- Nagy betöltések előtt kapcsoljuk ki az
AUTOCOMMIT
-et. - Commit stratégia:
- Kisebb adatmennyiségnél egy végső COMMIT ajánlott.
- Nagyobb adatmennyiségnél batch commit (pl. 10.000 soronként).
Megjegyzések
Megjegyzés küldése