oracle data warehouse
Водич за складиште података Орацле са предностима, архитектуром, ризицима и упоређивањем са системом ОЛТП (мрежна обрада трансакција):
У претходном водичу од Свеобухватан водич за Орацле , сазнали смо о Орацле производима и услугама у различитим доменима као што су апликације, базе података, ОС итд. Овај чланак ће пружити детаљно знање о Орацле складиштењу података. Али пре тога, прво да схватимо концепт пословне интелигенције (БИ).
Пословна интелигенција
Пословна интелигенција је софтверска домена која садржи одређене методе, технологије, алате и апликације која помажу у структурирању, пречишћавању и претварању масовних података у интелигентан и разумљив формат који купци могу користити за генерисање прилагођених извештаја, а такође помаже и у пословању Одлуке.
Различите опције су доступне за задовољење ове потребе, као што је складиштење података, ОЛАП (обрада трансакција на мрежи), рударење података, интеграција података, инжењеринг одлука, прорачунске таблице итд.
Складиштење података о предузећима (ЕДВ) једна је од основних компоненти БИ-а која служи аналитичким потребама предузећа и извештавању. Складиште података је систем релационог управљања базама података (РДБМС) који садржи обједињене податке примљене из више извора за каснију употребу.
питања за орацле интервју и одговори за искусне
Шта ћете научити:
- Преглед складишта података Орацле
- Поређење складишта података ОЛТП против података
- Складиште контрастних података и података Март
- Преглед ЕТЛ процеса
- Архитектура складишта података
- Закључак
Преглед складишта података Орацле
Зашто се назива „складиште података“?
Покушајмо да се подсетимо значења речи „складиште“ како бисмо се повезали са термином „Складиште података“.
Физичко складиште је складиште које се користи за складиштење робе примљене из различитих извора, која се касније може испоручити купцу на основу њихових потреба.
(слика извор )
Слично томе, складиште података је спремиште података примљених из различитих изворних система. Ти извори могу бити било који системи за складиштење података као што су подаци, равне датотеке или било који уређаји за складиштење медија који садрже податке за различите домене предузећа као што су ХР, продаја, операције, управљање ресурсима и маркетинг итд.
Сврха успостављања складишта података
Предузеће је можда чуло за концепт складишта података, али може бити несигурно да ли треба да га укључи у своје предузеће. Ипак, увек би постојала потреба да се подаци из различитих извора избаце на заједничко тло и архивирају тако да се простор за складиштење може ослободити из система трансакција. Овде систем складиштења података постаје пословни захтев.
Да би могао да расте на тржишту, менаџмент треба да буде добар у доношењу одлука, које се могу донети тек након темељног проучавања прошлих трендова организације. Стога се ови архивирани подаци чувају у складишту података у добро организованом и прорачунатом формату, тако да се убудуће могу упутити на пословну анализу.
Предности складиштења података
Складиште података ако се успешно примени могло би бити корисно на следеће начине:
# 1) Поједноставио је послове аналитичара испоруком побољшане верзије решења за пословну интелигенцију. Извлачи податке из више изворних система, трансформише их и складишти, а предузећа могу директно да их питају за анализу.
Такође нуди разне алате који подржавају следеће:
- Генерирање прилагођених пословних извештаја.
- Интерактивне контролне табле које приказују потребне информације.
- Могућност анализирања кроз контролне табле само да бисте сазнали детаље.
- Рударство података и анализа трендова.
#два) Чак и након пријема података из различитих изворних система, подаци у складишту података остају доследни као резултат трансформација које су се догодиле током ЕТЛ процеса. Доследни подаци дају поверење доносиоцу одлуке у погледу тачности.
# 3) Складишта података су такође дефинисана као уштеда времена јер су критични подаци потребни заинтересованим странама за доношење пословних одлука доступни на једном месту и могу се лако доћи.
# 4) Они су дизајнирани да чувају историјске податке и стога се могу питати за проучавање трендова током различитих временских периода. Такође помаже заинтересованим странама да извуку будући пут раста.
Ризици повезани са коришћењем складишта података
Заједно са предностима, свака нова примена укључује и низ ризика о којима треба водити рачуна.
У наставку су наведени неки од ризика:
- Некомпатибилност изворних система са системом складиштења података може на крају обавити много ручног рада.
- Нетачна процена времена ЕТЛ процеса може довести до прекида рада.
- То су врло врхунски системи за складиштење и зато им је потребно велико одржавање. Било који ток посла или пословне промене могу коштати врло високо.
- Постављање складишта података одузима време, јер му је потребно пуно времена да би се разумели пословни токови и идентификовале интеграционе могућности за дизајнирање складишта.
- Сигурност података овде је увек ризик, јер садржи вековне историјске податке који, ако процуре, могу утицати на пословање.
Поређење складишта података ОЛТП против података
Разлике између ОЛТП-а и складишта података могу се разумети из доње табеле.
ОЛТП | Складиштење података |
---|---|
Уметање и ажурирање су главне операције које крајњи корисници изводе на ОЛТП системима. | Складишта података се углавном питају помоћу наредбе СЕЛЕЦТ и могу се ажурирати само помоћу ЕТЛ услуга. |
ОЛТП системи подржавају пословне трансакције. | Дата Варехоусе подржава пословне одлуке донете након анализе завршених пословних трансакција. |
Подаци остају променљиви, тј. Стално се мењају | Подаци се не би требали мењати. |
Садрже најновије податке. | Они садрже историјске податке. |
Чува необрађене податке без икаквих прорачуна. | Садржи сажете и добро прорачунате податке. |
Подаци ће бити нормализовани. | Подаци ће остати денормализовани. |
Величина Орацле базе података може да варира од 50 МБ до 100 ГБ. | Величина Орацле базе података може варирати од 100ГБ до 2ТБ. |
Складиште контрастних података и података Март
Дата Варехоусе и ДатаМарт, нису ли термини слични и изгледа да су повезани са складиштењем података.
Да, повезани су и обојица се користе за чување података. Главна разлика између њих две је способност држања података и та разлика помаже крајњим корисницима да одаберу праву јединицу за складиштење за своје системе.
узорци тест случајева за пријаву осигурања
Дата Март има мањи капацитет за чување података у поређењу са складиштем података и стога се може сматрати његовим подскупом. Ознаке података обично се идентификују за чување ограничених података који могу бити из одређеног одељења или делатности, док се складишта података могу користити за чување обједињених података за све.
Узмимо пример веб странице за е-трговину која има различите категорије за робу попут моде, додатне опреме, предмета за домаћинство, књига и школског прибора, електроничких уређаја итд.
Дакле, Дата Мартс могу бити дизајнирани за паметно складиштење категорије података о производу, док се складишта података могу користити за чување комплетних података са веб локација, укључујући историју, на једном месту.
Марке података су мање величине, могу се створити много брже без много анализе колико је потребно за пројектовање складишта података. Међутим, потребан је велики напор да би се неколико података података синхронизовало како би се одржала доследност података.
Преглед ЕТЛ процеса
ЕТЛ (екстракција, трансформација и учитавање) је процес издвајања података из различитих изворних система, њихове трансформације и учитавања у систем складишта података. То је сложен процес који треба да комуницира са разним изворним системима за издвајање података, а самим тим и технички изазован.
За трансформацију је поново потребно пуно анализе како би се разумео формат изворних система и довели подаци у заједнички формат, тако да се исти подаци могу чувати у складишту података.
ЕТЛ процес је понављајући посао који се може изводити свакодневно, недељно или чак месечно, у зависности од пословних захтева.
Архитектура складишта података
Хајде да разумемо архитектуру складишта података које је углавном дизајнирано за складиштење пречишћених података за унапред дефинисане пословне захтеве. Архитектура се састоји од 5 компоненти са протоком података од врха до дна.
Компоненте су следеће:
- Извори података
- Дата Стагинг
- Складиште података (складиштење података)
- Дата Марцх (складиштење података)
- Презентација података
Хајде да разумемо све фазе наведене једну по једну.
# 1) Извори података
Постоје различити изворни системи који делују као улаз у системе складишта података.
Ови изворни системи могу бити:
- Релационе базе података попут Орацле, ДБ2, МиСКЛ, МС Аццесс итд. Које се могу користити за бележење дневних трансакција било које организације. Те дневне пословне трансакције могу бити повезане са ЕРП-ом, ЦРМ-ом, продајом, финансијама и маркетингом итд.
- Равне датотеке
- веб сервиси
- РСС фидови и слични извори.
# 2) Стагинг података
Једном када извори података буду постављени, следећи корак био би извлачење ових података из изворних система у спремиште складишта.
Будући да су подаци преузимани из различитих система који прате различите формате меморије, потребно је да реструктурирате податке тако да их доведу до уобичајеног формата. Стога се трансформација података одвија као следећи корак.
Током трансформације долази до чишћења података које укључује примену пословних правила, филтрирање података, уклањање вишка, форматирање података, сортирање података итд.
# 3) Складиште података (складиштење података)
Једном када се подаци извуку и трансформишу, учитаће се у вишедимензионално окружење, тј. Складиште података. Сада, ови обрађени подаци могу да се користе за анализу и у друге сврхе од стране крајњих корисника.
# 4) Ознаке података (складиштење података)
Као што је горе поменуто, подаци су сада спремни за употребу од стране крајњих корисника, постоји необавезни поступак креирања података као следећи корак. Ове ознаке података могу се користити за складиштење резимираних података одређеног одељења или делатности за наменску употребу.
На пример, засебне ознаке података могу се додати за одељења као што су продаја, финансије, маркетинг итд. као следећи корак који ће садржавати одређене податке и омогућава аналитичару да изврши детаљне упите за пословне потребе. Такође спречава сваког другог крајњег корисника да приступи комплетном складишту и тиме чини податке сигурним.
# 5) Алати за приступ подацима (презентација података)
10 најбољих шпијунских апликација за ипхоне
Постоји низ предефинисаних алата за пословну интелигенцију које корисници могу користити за приступ складиштима података или мартовима података. Ови фронт-енд алати дизајнирани су на изузетно једноставан начин пружајући корисницима разне могућности за приступ подацима.
Опције су наведене у наставку:
- Применом упита на Орацле или било које друге базе података директно путем СКЛ-а.
- Генерирање извештаја.
- Развој апликације.
- Коришћење алата за рударење података итд.
Неколико популарних складишних алата доступних на тржишту су:
- Аналитик ДС
- Амазон Редсхифт
- Аб Инитио софтвер
- Цоде Футурес
- Холистичко управљање подацима
- Корпорација за информатику
Складиштење података у облаку
Складишта података је прекомерно препозната у свету. Следеће питање које се намеће: Да ли користимо оптимизован приступ за размештање складишта података?
Потом је уведено Цлоуд Дата Варехоусинг, које превладава у Ентерприсе Дата Варехоусинг (ЕДВ). Концепт складишта података заснованих на облаку понудио је разне предности.
То су следећи:
(и) Скалабилност: Подаци на системима у облаку лако се скалирају горе-доле без муке, док троше пуно времена и ресурса за скалирање на традиционалним складиштима података.
(ии) Уштеда трошкова: Складишта података заснована на облаку направила су изузетну разлику у односу на улагање потребно за подешавање складишта. Смањили су главну почетну цену уклањањем трошкова
-
- Одржавање хардверских / серверских соба.
- Особље потребно за одржавање.
- Остали оперативни трошкови.
(иии) Перформансе: Перформансе су још један фактор који је омогућио системима заснованим на облаку да доминирају над традиционалним. Ако је посао глобално проширен и подацима треба приступити из различитих делова света бржим преокретом, складишта заснована на облаку је најбоље користити.
Масивно паралелна обрада (МПП) једна је од метода заједничке обраде коју складишта користе да би постигла исту.
(ив) Повезивање: Као што је горе поменуто, ако је подацима потребно приступити са више географских локација, корисницима је потребна изврсна повезаност са овим складиштима, а складиште засновано на облаку нуди исто.
Закључак
Надамо се да сте сви стекли поштену представу о Орацле систему складиштења података након што сте прочитали горњи чланак. Обавестите нас ако вам је потребан увид у одређену тему око складиштења података како бисмо то могли прикрити у предстојећим водичима.
ПРЕВ Туториал |. | СЛЕДЕЋА Лекција
Препоручено читање
- Шта је језеро података | Складиште података у односу на Дата Лаке
- Водич за тестирање складишта података са примерима | ЕТЛ Водич за тестирање
- 10 најпопуларнијих алата за складиштење података и технологија за тестирање
- Димензионални модел података у складишту података - Водич са примерима
- Метаподаци у складишту података (ЕТЛ) објашњени примерима
- Водич за тестирање складишта података ЕТЛ (комплетан водич)
- Типови шема у моделирању складишта података - шема Стар & СновФлаке
- Шта је ЕТЛ (екстракт, трансформација, учитавање) поступак у складишту података?