자격증/DAsP

[데이터아키텍처 구축] 데이터아키텍처 구축 프로세스

JWonK 2023. 4. 5. 15:56
728x90
반응형

1. 데이터아키텍처 정보 구축 준비


가. 자료 수집

데이터아키텍처 정보를 구축하기 위해 수집할 것은 정보시스템 구축 시 작성한 산출물이나 완료 보고서 등으로, 특히 데이터에 관련된 분석 및 설계 단계의 산출물을 확인해야 한다.

 

 

 

[데이터아키텍처 정보 구축을 위한 수집 자료]

아키텍처 정보 유형
(관리 대상)
매트릭스 정의 산출물 수집 자료 목록 비고
데이터 표준 데이터 표준화 원칙
데이터 모델링 원칙
DB 명명규칙
표준
단어 / 용어 / 도메인 / 코드
- 데이터 표준화 원칙 / 지침, 데이터 모델링 / DB 설계 원칙, 지침, 가이드, DB 명명 규칙 등 DB 설계 관련 제반 지침, 표준, 가이드, 문서 자료
- 데이터 표준 구축 내역(문서 또는 DB)
데이터 표준 구축 내역을 확인할 수 있는 메타 데이터 관리 시스템과 같은 지원도구가 있다면 이에 대해서도 파악해야 함
데이터 구조 개괄모델
주제영역
개념모델
논리모델
물리모델
데이터베이스
사용자 뷰
- 현재 관리하고 있는 ERD(현행화 여부가 중요)
- 엔터티 정의서, 테이블 정의서 등 DB 설계 산출물
- 데이터베이스 현황
- DB 개체 목록, DB에서 실제 수집한 테이블 / 컬럼 구성 내역 등
ERD를 관리하고 있지 않거나 ERD가 현행화 되어 있지 않은 경우 리버스 데이터 모델링을 통해 현행 데이터 구조에 대한 ERD 확보
데이터 흐름 데이터통합 구조도
데이터 흐름도
아웃바운드/인바운드 데이터
정의서
- 논리/물리 시스템 구성도
- 데이터 인터페이스 정의서, 데이터 흐름 정의서 등 내외부 시스템 인터페이스 관련 내역에 대한 정의 자료
데이터를 주고 받는 내외부 시스템들의 구성과 해당 데이터 내역을 파악할 수 있는 자료 확보
데이터 관리  데이터 관리 정책
데이터 표준 관리
요구사항 관리
데이터 모델 관리
데이터 흐름 관리
데이터베이스 관리
- 데이터 / DB 관리와 관련된 제반 정책, 기준, 표준 지침, 가이드 등 자료
- 사용자 요구사항, 데이터 요구사항 등 요구 사항 수집 / 정리 자료
- 데이터 / DB 관리 활동에 따른 제반 결과물 자료
관리 정책 / 기준 / 표준 / 지침 / 가이드 등의 자료와 해당 자료에서 명시한 활동사항이 있는 경우 활동 결과 산출물까지 확보 필요

 

 

나. 데이터아키텍처 정보 구축 방식

상향식과 하향식 존재한다.

 

상향식 구축 방법은 최하위에 있는 구성요소를 조사 분석하여 구성요소들의 공통점을 파악하여 공통적인 구성요소들을 모아 상위 구성요소를 정의해나가는 방식이다.

- 상향식 방식은 조직의 모든 데이터가 포함되는 것을 보장할 수 있는 장점이 있는 반면, 논리화-추상화를 거치면서 상위 계층의 데이터 구조 수준이 서로 다르게 나타날 수 있는 단점이 있다.

 

하향식 구축 방법은 최상위의 구성요소로부터 시작하여 분류 기준에 따라 하위 구성요소를 도출해 내는 방식이다.

- 하향식 방식은 일반적인 분류 기준이나 목적에 따른 분류 기준을 따르기 때문에 관점이 명확하다는 장점이 있다. 그러나 일부 업무가 누락될 가능성이 있으며 어디에도 포함되지 않는 구성요소가 발생할 수 있다는 것이 단점이다.

 

 

 

 

 

 

2. 현행 데이터아키텍처 정보 구축


- 현행 데이터아키텍처 정보의 구축은 현재 업무나 정보시스템, 데이터 주제영역 구성에 대해 기존의 데이터 관련 자료를 분석하여 데이터의 현재 모습에 해당하는 데이터아키텍처 정보를 구축하는 것

  • 상위 수준의 업무 기능과 시스템 또는 데이터 주제영역에 대한 분류를 우선 수행한 후 그 기준에 따라 나머지 데이터아키텍처 정보를 구축하는 것이 효율적
  • 상위 수준의 분류 기준이 정리되면 나머지 정보 구축은 병렬적으로 수행해도 된다.
  • 기존의 데이터 관련 산출물이 데이터의 현재 모습과 일치하면 하향식으로 구축해 나갈 수 있겠으나, 그렇지 않다면 상향식으로 접근하여 현재의 데이터베이스로부터 각 시스템에서 사용하는 데이터 정보를 분석하여 현행 물리 데이터 모델을 도출하고, 현행 데이터 주제영역을 정의한다.
  • 현행 데이터아키텍처를 구축할 때 일반적으로 많이 사용하는 방법은 상향식 접근 방법이지만, 계획자 수준의 상위 정보만을 구축할 경우에는 하향식 방식이 적합하며, 실무자 수준의 정보를 구축할 경우에는 상향식 방식이 더 적합하다고 할 수 있다.

 

현행 데이터아키텍처 정의 내역

  • 전사 데이터 영역 식별
  • 데이터베이스 개체 파악 및 분석
  • 현행 데이터 구조 정보 정의
    • 현행 데이터 주제영역 정의
    • 현행 물리 데이터 모델 정의
    • 현행 논리 데이터 모델 정의
    • 현행 개념 데이터 모델 정의
  • 현행 데이터 표준 정보 정의
    • 현행 데이터 원칙, 표준, 관리 프로세스 파악
  • 현행 데이터 흐름 정보 정의
  • 현행 데이터 관리 정보 정의

 

 

가. 현행 데이터 분석

- 현행 데이터아키텍처 정보를 구축할 때 가장 먼저 할 일은 전사 데이터 영역의 범위를 파악하는 것과 필요한 자료를 수집하는 것이다. 이를 토대로 현행 데이터베이스 개체를 파악하고 데이터 현황을 분석한다.

 

 

■ 현행 데이터 분석 내역

  • 현행 데이터 분석 내역
    • 데이터베이스 개체 및 스토리지 사용 현황 파악
    • 데이터의 완전성 분석 : 미사용 테이블 / 칼럼 파악, 임시 데이터 파악, 논리적 필수 칼럼 및 데이터 결여 등
    • 데이터 우선순위 분석 : 키(핵심) / 메인 엔터티 파악
    • 데이터 정합성 분석 : 데이터 우선순위 및 관련 데이터 간 정합성 파악
    • 데이터 유효성 분석 : 데이터 형식, 유효 범위, 선후관계 유효성(예, 시작일 <= 종료일) 등 파악
  • 데이터 표준화 현황 분석 : 데이터베이스 개체의 명칭 일관성, 도메인 일관성, 코드 사용의 일관성 등 파악
  • 문서화 현황 및 정합성 분석 : 현행 데이터에 대한 설계 문서 확인, 설계 문서와 실물 개체의 일치 여부 확인 등
  • 설계 및 관리 현황 분석 : 전사 데이터 영역에 대한 데이터 구조 설계 자료 보유 여부 및 현행화 상태 파악, 현행의 데이터 관리 체계 파악 등

 

 

나. 현행 데이터 표준 분석

- 전사 데이터 영역으로 파악한 범위에 대해 현재 적용하고 있는 데이터 표준의 존재 여부 및 데이터 표준 구성 현황 / 적용 범위 및 준수도 등을 파악하고, 현행 데이터 표준이 존재하는 경우 현행 데이터 및 데이터 구조에 대해 적용되고 있는 비율이나 현황을 파악한다. 

 

 

현행 데이터 표준 분석 내역

  • 현행 데이터 표준 구성 / 활용 현황 분석
  • 현행 데이터의 표준 준수도 분석

 

 

다. 데이터 요구 사항 분석

현행 및 목표 시스템에 대한 데이터 요구를 수집하여 현행 데이터에 대한 이해 증진 및 목표 데이터 구조 설계 시 방향 도출의 근거로 활용한다. 

 

 

■ 데이터 요구 사항 분석 내역

  • 현행 데이터에 대한 데이터 요구 사항 파악
  • 현행 데이터 요구 사항에 대한 반영 현황 파악
  • 목표 데이터아키텍처에 대한 데이터 요구 사항 정리 및 파악
  • 목표 데이터아키텍처에 대한 방향성 수립 시사점 도출

 

 

라. 현행 물리 데이터 모델 도출

 

- 현행 물리 데이터 모델 도출은 테이블, 칼럼 등 데이터베이스 개체 정보로부터 물리 데이터 모델을 생성하는 작업으로, 생성한 물리 데이터 모델은 ER 다이어그램으로 표현된다. 

- 데이터 모델링 도구를 사용하여 물리 데이터 모델을 생성하게 되면 테이블 정의서와 같은 물리 데이터 모델에 대해 요구되는 산출물 생성을 자동화할 수 있는 장점이 있다.

 

 

 현행 물리 데이타 모델 도출 내역

  • 현행 물리 데이터 모델 생성 대상 범위 파악
  • 현행 물리 데이터 모델 생성 대상 범위 내의 임시 테이블 파악 및 정리
  • 현행 물리 데이터 모델 생성
  • 관계 복원 및 한글 논리명 사용 가능 여부 파악

 

 

마. 현행 논리 데이터 모델 도출

- 현행 논리 데이터 모델 도출은 데이터베이스의 테이블 구조를 그대로 표현한 현행 물리 데이터 모델로부터 데이터 집합의 논리적 형태로 전환하여 현행 논리 데이터 모델을 생성하는 작업이다. 

- 현행 논리 데이터 모델은 테이블 구조가 아니라 대상 데이터의 논리적 형태를 표현하기 위한 것이기 때문에 이해를 위해 한글화가 필수적이며, 이에 따라 데이터 집합을 표현한 엔터티와 데이터 집합의 구체적인 특성을 표현한 속성 / 관계명 등에 대해 한글 명칭으로 표현하게 된다.

- 현행 논리 데이터 모델은 엔터티나 속성의 명칭 외에도 정확한 관계 파악과 표현, 데이터 집합에 대한 통합적 형태 정의 등 데이터 모델링 기법에서 다루어지는 모든 사항에 대해 정확하고 구체적으로 표현하는 것이 중요하다

 

 

■ 현행 논리 데이터 모델 도출 내역

  • 현행 데이터 표준 및 적용 현황 파악
  • 현행 물리 데이터 모델 구성 개체의 명칭에서 명명규칙 파악
  • 명명규칙과 현행 데이터 표준을 토대로 한글명 도출
  • 현행 논리 데이터 모델 생성 및 상세화, 논리화 수행
  • 현행 물리/논리 데이터 모델 개체에 대해 테이블-엔터티, 칼럼-속성 매핑 관계 파악

 

 

 

바. 현행 개념 데이터 모델 도출

- 현행 개념 데이터 모델 도출은 현행 논리 데이터 모델의 엔터티에 대해 의미나 성격이 유사한 것들을 그루핑하여 추상화 수준을 높여 데이터 모델로 정의하는 작업이다.

- 개념 데이터 모델은 형태적으로 논리 데이터 모델과 유사하여 엔터티, 속성, 관계 등의 형태로 표현되지만 이들은 논리 데이터 모델의 엔터티, 속성, 관계와는 표현하는 차원이 다르기 때문에 동일시하지 않아야 한다.

- 개념 데이터 모델은 논리 데이터 모델에 정의된 많은 엔터티와 데이터 구성을 한 눈에 파악할 수 있도록 주요 데이터를 중심으로 요약해서 표현한 것이라 할 수 있다.

- 개념 데이터 모델로 정의하는 데이터의 범위는 보통 주제영역 단위이며, 규모나 의사결정에 따라 대주제영역이나 중주체영역 또는 소주제영역 단위로 정의할 수도 있다.

- 개념 데이터 모델에 표현된 엔터티, 속성, 관계 형태의 각 개념 개체에 대해 논리 데이터 모델의 어떠한 엔터티, 속성, 관계로 상세화되었는지에 대한 매핑 관계를 파악하여 정의하는 것도 중요하다.

 

 

 현행 개념 데이터 모델 도출 내역

  • 현행 개념 데이터 모델 정의 범위 파악
  • 현행 개념 데이터 모델 생성
  • 현행 논리 / 개념 데이터 모델에 대해 각 구성 개체 간 매핑 관계 파악

 

 

 

사. 현행 주제영역 모델 도출

현행 주제영역 모델 도출은 현행 전사 데이터 범위에 대해 데이터 주제영역 구성을 파악하여 분류하는 작업으로, 주제영역의 분류와 구성은 전사 데이터를 한눈에 조망하고, 전사 데이터가 어떠한 체계로 구성되고 관리되는지를 파악할 수 있다.

 

 

■ 현행 주제영역 모델 도출 내역

  • 현행 데이터 주제영역 분류 파악 및 정의

 

 

 

아. 현행 데이터 구조 문제점 및 개선방안 도출

 

- 현행 데이터 구조에 대해 물리 · 논리 · 개념 데이터 모델로 추상화 수준을 높여가면서 계층적으로 구성하는 거은 많은 데이터 개체들을 추상화 수준을 높여가면서 주요 데이터 위주로 신속하게 파악할 수 있도록 하기 위함이다. 

- 단순히 데이터 모델 그림을 그려내는 것이 목적이 아니기 때문에 현행 데이터 모델을 구체적이고 정확하게 표현하여 데이터 구조 상의 문제와 원인, 개선방안 등을 도출할 수 있어야 한다.

 

 

■ 현행 데이터 구조 문제점 및 개선방안 도출 내역

  • 현행 데이터 구조 상의 문제점 파악
  • 현행 데이터 구조 상의 문제로 인한 데이터 오류 사항 근거 수집 및 원인 분석
  • 현행 데이터 구조의 문제에 대한 시사점 도출
  • 현행 데이터 구조 개선 방향 정의

 

 

 

 

 

 

 

3. 목표 데이터아키텍처 정보 구축


- 목표 데이터아키텍처 구축은 현행 데이터아키텍처에 대한 문제점 분석 및 개선 방향 도출 결과를 토대로, 데이터 참조모델에서 바람직한 선진 모델 구조를 참조하거나 재사용할 데이터 구조 등을 파악하고, 데이터 요구 사항을 반영하여 이를 목표 데이터아키텍처에 반영하는 과정으로 진행된다.

- 목표 데이터아키텍처의 구축 범위는 데이터아키텍처의 구축 목적에 따라 다르지만, 일반적으로 초기 목표 데이터아키텍처 수립 시에는 현행 데이터아키텍처 수립과 달리 데이터아키텍처 매트릭스의 개념적 수준까지 정의한다.

 

목표 데이터아키텍처 정의 내역

  • 목표 데이터 표준, 관리 프로세스 정의
  • 목표 데이터 주제영역 모델 정의
  • 목표 개념 데이터 모델 정의
  • 목표 논리 데이터 모델 정의
  • 목표 물리 데이터 모델 정의
  • 목표 데이터베이스 개체 정보 구축
  • 목표 데이터 흐름 정의

 

 

 

가. 목표 데이터 표준, 관리 프로세스 정의

- 현행 데이터아키텍처를 구축하고 현행 데이터 구조의 문제점과 개선방향을 도출한 후, 이 결과에 데이터 관련 요구 사항을 반영하여 목표 데이터아키텍처를 수립하기 위한 목표 데이터 표준과 데이터 관리 프로세스를 정의한다.

- 현행 데이터아키텍처에 대한 분석 결과를 토대로 목표 데이터아키텍처에 보완하거나 추가 또는 개선할 데이터 관리 프로세스를 정의한다.

- 데이터 관리 프로세스는 관련 조직이나 역할의 책임이 명확하게 정의되어야 하며, 절차가 너무 복잡하지 않아야 한다. 또한 명확하게 정의되어야 한다.

 

 

목표 데이터 표준, 관리 프로세스 정의 내역

  • 데이터 정책 관리 프로세스 정의
  • 목표 데이터 표준 정의
  • 데이터 표준 관리 프로세스 정의
  • 데이터 요구 사항 관리 프로세스 정의
  • 데이터 모델 관리 프로세스 정의
  • 데이터 흐름 관리 프로세스 정의
  • 데이터베이스 관리 프로세스 정의
  • 데이터 품질 관리 프로세스 정의

 

 

 

나. 목표 데이터 주제영역 정의

 

- 목표 데이터 주제영역 정의는 전사 데이터 범위 정의, 데이터아키텍처 원칙, 데이터 요구 사항, 현행 데이터아키텍처 분석 결과 등을 토대로 하여 전사 차원의 데이터를 일관된 뷰로 조망할 수 있도록 데이터를 분류하는 것

- 데이터 주제영역은 데이터 최상위 집합으로 전사 차원에서 일관되게 관리되어야 하며, 업무별 사일로(Silo) 구조가 되지 않도록 유사한 데이터별로 하나의 통합된 분류 구조로 정의해야 한다.

 

 

목표 데이터 주제영역 정의 내역

  • 주제영역 분류 원칙 정의
  • 목표 데이터 주제영역 모델 정의
  • 목표 개괄모델 정의 : 주제영역 간의 관계를 정의
  • 목표 주제영역 정의서 작성

 

 

 

다. 목표 개념 데이터 모델 정의

- 목표 개념 데이터 모델 정의는 목표 데이터 주제영역 정의 결과를 토대로 주제영역별로 주요 데이터와 이들 간의 관계를 도출하여 목표 데이터 구조의 골격을 엔터티-관계 모델 형태로 정의하는 작업이라 할 수 있다.

- 목표 개념 데이터 모델을 통해 주제영역별로 목표 데이터 구조의 주요 데이터와 그들 간의 관계를 파악하기에 용이하다. 이를 통해 목표 데이터 구조의 방향을 가늠할 수 있고, 목표 논리 데이터 모델로 상세화하기 위한 틀을 제공할 수 있다.

 

 

 목표 개념 데이터 모델 정의 내역

  • 목표 개념 데이터 모델 정의
  • 목표 개념 데이터 모델 정의서 작성 : 목표 개념 데이터 모델에 나타난 주요 데이터와 관계에 대한 설명

 

 

 

 

라. 목표 논리 데이터 모델 정의

- 목표 논리 데이터 모델 정의는 목표 개념 데이터 모델을 토대로 개념 데이터 모델에 정의된 주요 데이터와 이들 간의 관계에 대한 세부 내용을 도출하여 데이터 구조의 상세한 논리적 형태를 정의하는 것이다.

- 엔터티, 속성, 관계 등의 구성요소를 사용하여 비지니스 규칙이 구체적으로 상세하게 표현되어야 한다.

 

 

목표 논리 데이터 모델 정의 내역

  • 목표 논리 데이터 모델 정의
  • 목표 논리 데이터 모델 정의서 작성 : 엔터티 정의서, 속성 정의서 등

 

 

 

 

마. 목표 물리 데이터 모델 정의

- 목표 물리 데이터 모델 정의는 논리 데이터 모델을 특정 DBMS에 최적화한 형태로 정의하는 작업이다.

- 물리 데이터 모델을 정의할 때 데이터 표준을 이용하여 칼럼명, 데이터 타입 및 길이 등 물리 데이터 요소를 일관되게 생성해야 한다.

 

 

■ 목표 물리 데이터 모델 정의 내역

  • 목표 물리 데이터 모델 정의
  • 목표 물리 데이터 모델 정의서 작성 : 테이블 정의서, 칼럼 정의서 등

 

 

 

 

바. 목표 데이터베이스 개체 정보 구축

- 목표 데이터베이스 개체 정보 구축 시 물리 데이터 모델에 정의된 물리 데이터 요소를 생성하려는 DBMS의 구성과 생성되는 개체의 정보, 활용방법 설계 등이 반영된다.

- 주로 성능과 보안성 확보를 고려한 추가적인 설계에 해당하며, 물리 데이터 모델에 정의된 테이블을 생성하고 관리하기 위한 스토리지 구성과 용량 계획, 스키마 구성 및 DBMS 환경 변수 설정 등과 같은 시스템 저장 공간에 대한 설계를 비롯하여, 핵심 데이터 식별과 이들을 보호하기 위한 접근 권한 및 접근 제어 방법, 암호화 등의 설계, 데이터 분산 설계 등의 내용이 포함된다.

 

 

■ 목표 데이터베이스 개체 정보 정의 내역

  • 목표 시스템 저장 공간 설계
  • 목표 시스템 보안성 정의 : 보호 대상 핵심 데이터 정의, 권한관리 / 접근제어 정책 등
  • 목표 데이터 분산 설계 : 데이터베이스 분산 설계, 데이터 파티셔닝 설계 등

 

 

 

사. 목표 데이터 흐름 정의

- 목표 데이터 흐름 정의는 별개로 분리되어 구축되는 정보시스템이나 외부의 정보시스템들과 데이터 교환을 통해 목표 시스템이 완전한 기능을 발휘하고 전사적인 통합 시스템 체계를 완성할 수 있도록 시스템 간의 데이터 이동을 정의하는 것이다.

 

 

 목표 데이터 흐름 정의 내역

  • 전사 데이터 통합 구조도 정의
  • 데이터 흐름도 정의
  • 아웃바운드/인바운드 데이터 정의서

 

 

 

 

 

 

 

4. 목표 데이터아키텍처 이행 계획 수립


  • 목표 데이터아키텍처 이행 계획은 현행 데이터아키텍처에서 목표 데이터아키텍처로의 이행을 위한 전략을 수립하고 구체적인 이행 계획을 수립하는 것이다. 현행 데이터아키텍처와 목표 데이터아키텍처의 차이 분석을 통하여 프로젝트를 정의한다.
  • 둘 이상의 프로젝트로 정의되는 경우 정의된 프로젝트 간의 유사성과 상호연관성을 고려하여 우선순위를 결정하고, 이를 고려하여 프로젝트 간 및 프로젝트 내에서의 이행 전략과 세부 이행 계획을 수립한다.
  • 또한, 이행 계획을 성공적으로 추진하기 위한 변화 관리 계획 수립도 필요하다. 
  • 세부 이행 계획에는 필요한 인력과 자원에 대한 리소스 계획, 추진 일정, 비용 계획 등이 포함된다.

 

[목표 데이터아키텍처 이행 계획의 주요 활동 및 작업]

■ 데이터아키텍처 차이(Gap) 분석

  • 목표 및 현행 데이터 아키텍처 검토
  • 차이 분석

 

 

■ 프로젝트 정의

  • 프로젝트 목록 정의
  • 개별 프로젝트별 필요 리소스 정의
  • 프로젝트 우선순위 및 연관성 분석

 

 

■ 이행 전략 수립

  • 프로젝트 이행에 필요한 단계별 이행 전략 대안 수립
  • 이행 전략별 타당성 분석 및 대안 확정

 

 

■ 이행 계획 수립

  • 프로젝트별 추진 방법 정의
  • 프로젝트별 세부 활동 및 상세 일정 계획 수립

 

 

■ 변화 관리 계획 수립

  • 변화 관리 대상 및 변화 요인 식별
  • 변화 관리 계획 수립
  • 변화 관리 교육 계획 및 자료 작성

 

 

728x90
반응형