DW : Data Warehouse

Study/IT Word 2016. 9. 28. 23:30 Posted by meanoflife
반응형

용어 : Data Warehouse

약어 : DW

한글 : ?



DW를 간단히 표현하면, 전사 데이터를 통합보관하는 시스템이라고 할 수 있습니다.

이렇게 데이터를 통합보관 하는데는 크게 2가지 의미가 있습니다.


1. 데이터의 보관    2. 데이터의 가공 및 제공


데이터의 보관은 말 그대로, 데이터를 통합하여 보관하는 것이며, 

데이터의 가공 및 제공은 전사의 데이터를 취합하여 분석&가공하여 필요한 시스템에 보내주는 역할을 합니다.


간단히 예를 들자면, 은행 업무의 경우 '영업점(창구)'에서 고객신규 및 수/여신 업무를 수행합니다.

이러한 정보들은 DW시스템에 데이터가 모이게 되며, 이 정보를 기반으로 고객의 실적 및 성향을 분석합니다.


이 자료를 CRM업무 등에서 마케팅정보 등으로 활용할 수 있습니다.


예전에는 DW시스템을 지칭할 때, DW라고 통칭하였는데

최근에는 ADW, EDW, RDW와 같이 업무를 세분화하고 영역을 나눠서 부르고 있습니다.


각각의 영역 및 약어에 대해서 정확한 의미는 잘 모르겠으나 ( 궁금하여 찾아봤으나 못 찾았습니다. )

제가 생각하기로는 다음과 같이 통용되고 있는 것 같습니다.


- ADW : Analysis DataWare House, DW내에서 분석영역을 의미한다.

- EDW : Enterpise DataWare House, 원래 의미로 사용되던 DW영역을 의미한다.

- RDW : ??? DataWare House


DW시스템의 주요 업무는, ETCL( Extract, Transfer, Cleansing, Load )라고 할 수 있습니다.

ETCL은 데이터를 추출하고, 전송하며, 정제하고 적재하는 역할을 말합니다.

즉, 각 시스템이 있는 데이터를 추출( Extract )하여, DW시스템에 적재( Load )를 합니다.

적재시 데이터를 정재( Cleansing )하고, 필요한 시스템으로 제공( Transfer )해 줍니다.


대량의 데이터를 핸들링 하기 때문에, 업무는 대부분 일괄처리( Batch )를 통해 야간에 이뤄지게 됩니다.

일과 시간에는 업무가 진행되고 있기 때문에, 하루 하루의 데이터를 야간에 처리하는 것 입니다.


요즘은 실시간 요건의 추가로, 일과 중에 수행하는 배치작업도 있고, 실시간/준실시간으로 처리하는 작업들도 많이 있습니다.

이런 실시간/준실시간 작업을 처리하는 영역을 SOR영역이라고 칭하기도 합니다.


다음은 DW의 사전적 의미입니다.




DW의 정의


사용자의 의사결정을 지원하기 위해 기업이 축적한 많은 데이터(Time Variant)를 사용자관점에서 주제별로(Subject-Oriented)통합하여 별도의 장소에 저장해 놓은 통합 데이터베이스


디자인, 원시 데이터 추출 및 로딩, 데이터 스토어, 데이터 이용(OLAP), 웨어하우스 관리와 같은 프로세스를 지원하는 컴포넌트들의 유기적 연동을 통해 의사 결정자에게 회사의 경쟁력을 높일 수 있는 주요한 정보를 적기에 제공하는 전략적 정보시스템


데이터웨어하우스를 구축하고 활용하는 일련의 과정으로, 전사적인 아키텍처 상에서 의사결정을 지원하기 위한 환경을 구축하는 개념



DW의 등장 배경


데이터 웨어하우스의 출현은 분석정보에 대한 요구 증대와 이를 충족시킬 수 있는 컴퓨터 시스템의 성능 향상이 필요.

전사적으로 분석 정보들을 한 개의 데이터베이스에 통합하여 저장 관리해야 할 필요성 증대

컴퓨터의 성능 향상 / MPP (massively parallel processing) computers

데이터베이스 관리 시스템의 성능 향상 / RDBMS terabytes capacity

 


DW의 특징

운영시스템을 보호하고 사용자 질의에 신속한 응답성능을 제공


여러 시스템에 산재된 데이터들이 웨어하우스로 취합되고 통합되므로 사용자는 자신들이 필요로 하는 데이터가 어디에 있는지 신경 쓰지 않고 필요한 데이터를 쉽게 활용 가능


데이터는 웨어하우스로 옮겨오기 전에 정제 및 검증과정을 거치게 되며, 따라서 사용자는 양질의 데이터를 사용 가능

  

끝.


반응형