자격증/DAsP

[아키텍처 개요] 데이터 아키텍처의 개념/특징/실패요인, 중요성과 구성

JWonK 2023. 3. 24. 18:58
728x90
반응형

3. 데이터아키텍처 개요

 

 

가. 데이터 아키텍처 개념


데이터는 아주 논리적이고 구체적으로 정의되어야 한다. 개괄적이고 모호하며 전사적 관점에서 통합적으로 활용될 수 없는 데이터는 업무에 도움이 되지 못할 뿐 아니라 혼선과 잘못된 판단을 유발할 수도 있다.

다시 말하면, 체계적으로 잘 정의된 데이터는 기업이나 조직에 크게 도움이 되고 비지니스에 핵심적인 역할을 할 수 있지만, 그렇지 못할 경우는 오히려 비지니스에 악영향을 줄 수 있다.

데이터가 기업의 진정한 자산으로서 가치를 가지려면 체계적으로 잘 정외되고 우수한 품질의 데이터를 유지할 수 있어야 한다.

데이터는 정보시스템의 근간이라고 할 수 있고, 데이터 구조에 대한 체계적인 정의를 토대로 다른 아키텍처 도메인들이 정의되어야만 전사아키텍처가 제대로 효과를 거둘 수 있다.

 

이와 같이 기업이나 조직의 업무 수행에 필요한 데이터의 구조를 체계적으로 정의하여 구축하고 관리하기 위한 방법이 데이터아키텍처이다. 

전사 아키텍처를 구성하는 아키텍처 도메인 중에서도 데이터 아키텍처는 다른 아키텍처 도메인에 비해 독립적으로 구축할 수 있는 특징을 갖고 있다.

 

데이터 아키텍처는 전사의 데이터 영역을 분류하는데, 업무 데이터와 메타 데이터를 구분하거나 업무 데이터를 다시 운영계 데이터, 정보계 데이터 등으로 구반한다. 이를 토대로 전사 수준의 주제 영역을 정의하고, 개념 데이터 모델을 정의하며, 주제 영역별로 논리 데이터 모델/물리 데이터 모델로 상세화 수준을 달리하여 계층적으로 정의한다.

 

 

 

 

▶ 효과적인 데이터 아키텍처의 주요 특징

  1. 비지니스를 효과적으로 지원하는 데이터 전략 (Aligned)

: 데이터 아키텍처는 비지니스 목표를 달성하기 위한 데이터에 대한 전략적 접근과 데이터를 효과적으로 비지니스에 활용할 수 있는 기술 솔루션을 뒷받침함으로써 비지니스 목표를 기술 솔루션과 연계하는 역할을 담당한다. 데이터 아키텍처를 구성하는 데이터와 데이터 구조는 단순히 응용프로그램의 사용을 위한 데이터 저장소가 아니라, 현행의 비지니스를 충분히 지원하면서 미래의 비지니스 변화를 유연하게 수용할 수 있는 유연성확장성을 갖도록 해야한다.

 

   2. 필수/핵심 데이터에 집중 (Targeted)

: 기업이나 조직의 비지니스에 대해 우선순위를 부여하고 이에 따른 필수/핵심 데이터를 선정하여 이를 중심으로 체계적인 데이터아키텍처를 구축하는 것이 데이터아키텍처의 성공 가능성을 높이는데 유리하다. 

 

   3. 명확한 활동과 마일스톤 (Actionable)

: 데이터 아키텍처를 구축하고, 데이터아키텍처를 유지 및 관리하기 위해 필요한 활동들을 정의하고 이러한 활동을 통해 어떤 결과물을 작성하여야 하며, 수행 과정을 단계별로 체크할 수 있는 마일스톤을 명확하게 정의하여야 한다. 이것은 데이터아키텍처의 구축 및 유지관리를 위한 수행 과정이 성공적으로 완수되었는지를 확인할 수 있도록 할 뿐 아니라, 수행 인력들이 데이터 아키텍처에 대해 무엇을 해야 하는지를 알려 줌으로써 절차를 체계화하고 관련 기술력을 내재화하는 데도 도움을 준다.

 

   4. 변화하는 비지니스 요구와 새로운 기술을 충족하기 위한 유연성 (Evolutionary)

: 데이터 아키첵처는 기업이나 조직의 업무 수행에 필요한 데이터의 구조를 체계적으로 정의하는 것이다. 데이터 구조를 정의할 때 가장 중요한 것은 기업이나 조직의 데이터에 대해 논리적이고 구체적인 모습을 정의하는 것이라 할 수 있다. 이와 같은 조건을 충족하는 초기 데이터 모델을 정의했다 하더라도 지속적으로 변화하는 비지니스 요구 사항을 최소한의 변경으로 용이하게 수용할 수 있도록 유연성 및 확장성을 확보해야 한다.

 

 

 

  데이터 아키텍처의 실패 요인

   1. 기업이나 조직의 모든 데이터 및 정보 포함 시도

: 데이터들을 모두 데이터 아키텍처 범위에 끌어들여 체계화하고 통제하고자 하는 시도는 진정으로 중요한 데이터들에 대한 통제력을 약화시킬 수 있어 데이터 아키텍처를 부실하게 만드는 원인이 될 수 있다.

 

   2. 전문성 결여와 내재 기술력에 대한 오해

: 내부 기술 수준에 대한 오해와 이에 따른 독자적 수행은 데이터 아키텍처를 부실하게 만드는 원인이 될 수 있다.

 

   3. IT 부서의 독점적 소유 및 조치

: 데이터 아키텍처를 구축하고 운영하는 데 있어서 전사적 관심과 협조가 필요하다.

 

   4. 외부 구매에 의존하는 기술적 해결 시도

: 외부 전문가나 전문 솔루션은 문제를 풀어가는 열쇠나 방향 또는 방안을 제시하는 역할로 받아들이고 문제를 풀어가는 주체는 항상 내부여야 함을 인지해야한다.

 

   5. 이해 당사자에 의한 독자적 개발 진행 및 통제 부재

: 기업이나 조직의 정보시스템과 데이터에 대해 전사적, 통합적 모습을 고려하고 이에 따른 적절한 통제가 전제되지 않은 상태에서 필요한 부서나 조직마다 독자적으로 시스템을 구축하면 중복 투자에 따른 비용 낭비는 물론이고 난개발로 인한 전사적 관점에서의 데이터 연계 및 활용도 저하와 지속적인 유지보수 비용의 증가 등의 문제로 이어지게 된다.

 

   6. 학술적 접근과 과도한 복잡성

: 지나친 이론에 치우친 설계 또는 복잡도 아키텍처 설계

 

   7. 이상에 치우친 원칙과 정책

: 내외부의 여건을 고려하여 상황에 따른 설계를 해야함

 

   8. 단계적 성과를 고려하지 않은 장기 수행 전략

: 일반적으로 데이터 아키텍처를 구축하는 것이 단기간에 이루어지는 것은 아니다. 그렇다 하더라도 데이터 아키텍처를 구축하는 과정에서 단계적으로 성과를 확인하고 이후의 진행 방향을 가늠해 볼 수 있는 단계적 성과 관리가 필요하다

 

   9. 변화 수용에 대한 배척

: 변경 요인은 수시로 발생할 수 있기 때문에 적절한 시점에 변경사항을 평가하고 반영하는 관리가 필요하다.

 

 

 

 

 

 

 

나. 데이터 아키텍처의 중요성


데이터 자원을 연계하고 융합하면서 새로운 가치 창출이 가능하다는 것을 알게 되었고, 데이터 자원 분석을 통해 빠르고 올바른 의사결정이 가능하게 되었다. 

데이터 아키텍처는 기업이나 조직이 데이터를 효율적으로 처리하는 방법에 대해 전략적 접근과 기술, 이를 통해 축적한 효율적인 데이터 구조를 제공하기 때문에 기업이나 조직의 업무 활동을 직접적으로 지원하고 데이터를 통해 중요한 의사결정과 비지니스 방향 결정에 영향을 미칠 수 있어 기업이나 조직에게 중요한 역할을 하고 자산적 가치를 지닌다.

 

  • 전사의 데이터 구성을 용이하게 파악 가능
  • 데이터 품질 확보 용이
  • 명확한 의사소통 향상
  • 신속하고 적절한 의사결정 가능
  • 데이터 연계 및 상호운용성 향상에 따른 업무 정확성 / 효율성 향상

 

 

 

 

 

 

 

다. 데이터 아키텍처 구성


: 데이터 아키텍처는 기업이나 조직의 업무 수행에 필요한 데이터의 구조를 체계적으로 정의하여 구축하고 관리하기 위한 방법이다.

전사 아키텍처를 구성하는 아키텍처 도메인 중에서도 다른 아키텍처 도메인에 비해 독립적으로 구축할 수 있는 특징을 갖고 있다.

다시 말해서, 전사 아키텍처가 구축되어 있지 않더라도 개별적으로 데이터 아키텍처를 구축하여 운영할 수 있다.

 

데이터 아키텍처는 전사의 데이터 영역을 분류한다.

  • 업무 데이터와 메타 데이터를 구분
  • 업무 데이터를 다시 운영계 데이터와 정보계 데이터 등으로 구분
  • 이를 토대로 전사 수준의 주제 영역을 정의하고, 개념 데이터 모델을 정의
  • 주제 영역별로 논리 데이터 모델 / 물리 데이터 모델을 정의하여 계층적으로 상세화 수준을 달리하는 데이터 구조 정의

데이터 아키텍처는 전사의 데이터 영역을 가장 높은 추상화 수준에서 개괄적으로 표현한 모델로부터 시작하여 이를 단계적으로 상세화해 나가면서 계층적 구성을 갖추게 된다.

 

 

■ 전사 데이터 영역 모델 (계획자 관점)

: 전사 데이터 영역 모델은 개괄 데이터 모델이라고도 하며 상위 수준의 전사 데이터 영역을 분류하여 표현한 것이다. 상위 주제 영역 수준의 데이터 구성도가 이에 해당된다. 주제 영역은 업무 기능과 대응되는 개념으로 그 목적과 용도가 유사하거나 공통된 사안을 내포하고 있는 데이터를 그룹화한 것으로, '전사'의 범위 또는 규모에 따라 계층적으로 구성하기도 한다.

 

 

개념 데이터 모델 (책임자 관점)

: 개념 데이터 모델은 전사 수즌의 데이터 모델로 단위 주제 영역 또는 핵심 엔터티 정도를 표현한 데이터 모델이다. 전사 수준에서 사용하는 데이터를 전체적으로 표현할 수 있는 기본 틀로서, 전사 데이터 아키텍처를 관리하는 데 있어 매우 유용하다. 개념 데이터 모델은 표현하고자 하는 범위 내의 데이터에 대한 윤곽 또는 구도를 쉽게 파악할 수 있는 용도로 사용되기 때문에 아주적은 수의 엔터티로 표현되는 것이 일반적

개념 데이터 모델은 '전사'의 범위 또는 규모에 따라, 혹은 활용 목적이나 여러 여건에 따라 데이터아키텍처의 필수 구성 대상으로 보거나 생략할 수 있다.

 

 

논리 데이터 모델 (설계자 관점)

: 논리 데이터 모델은 개념 데이터 모델에서 정의한 주제 영역과 핵심 엔터리를 기본 정보로 하여 업무 요건을 충족시키기 위한 데이터의 상세한 구조를 논리적으로 구체화한 것이다. 논리 데이터 모델링은 논리 데이터 모델을 정의해 가는 과정을 의미한다. 수집된 업무 관련 데이터 정보 및 사전에 작성된 산출물을 기반으로 필요한 모든 엔터티를 도출하고, 식별자/속성/관계와 서브타입 등을 정의한다. 엔터티/속성/식별자/관계 등의 구성요소를 사용하여 데이터에 관련된 업무 규칙을 구체적으로 명확하게 표현하면서 데이터의 무결성을 보장하기 위한 논리적 모습을 정의하는 것이 중요하다. 논리 데이터 모델의 엔터티와 속성에 대한 명칭, 정의, 형식, 규칙, 코드 등은 전사적인 차원의 표준으로 정의하여 관리해야 한다.

 

 

물리 데이터 모델 (개발자 관점)

: 물리 데이터 모델은 기술적 환경과 특성을 고려하여 특정 데이터베이스 관리 시스템(DBMS)이나 분산 서버 환경 등에 적합한 물리적 데이터 구조를 설계하고 데이터베이스 객체를 정의한 것이다. 모델러는 논리 데이터 모델을 물리적인 데이터 구조로 전환하고 논리 데이터 모델에 정의된 무결성 요소들을 보장하기 위한 물리 데이터 요소를 정의한다.

물리 데이터 모델은 반드시 논리 데이터 모델을 근거로 하기 때문에 물리 데이터 모델에 대한 보완은 항상 논리 데이터 모델의 보완을 거쳐 이루어져야 한다. 이 과정에서 개념 데이터 모델의 보완까지 고려되어야 한다. 물리 데이터 모델은 특정 DBMS에 적합한 물리적 데이터 구조를 정의하는 것 외에 데이터베이스의 성능을 고려한 추가적인 설계가 반영되어야 한다. 이를 위해 이미 설계된 데이터 구조에 추가적으로 데이터의 접근 성능 향상을 위해 PK의 칼럼 순서를 조정하거나 인덱스 설계, 데이터 구조에 대한 비정규화 과정 등을 수행한다. 필요하다면 데이터베이스 관리자(Database Administrator)와의 협업을 통해 데이터의 접근 성능 및 관리 편의성 향상을 위해 파티셔닝을 고려할 수도 있다.

728x90
반응형