1. 데이터아키텍처 정보 구축 준비
가. 자료 수집
데이터아키텍처 정보를 구축하기 위해 수집할 것은 정보시스템 구축 시 작성한 산출물이나 완료 보고서 등으로, 특히 데이터에 관련된 분석 및 설계 단계의 산출물을 확인해야 한다.
[데이터아키텍처 정보 구축을 위한 수집 자료]
아키텍처 정보 유형 (관리 대상) |
매트릭스 정의 산출물 | 수집 자료 목록 | 비고 |
데이터 표준 | 데이터 표준화 원칙 데이터 모델링 원칙 DB 명명규칙 표준 단어 / 용어 / 도메인 / 코드 |
- 데이터 표준화 원칙 / 지침, 데이터 모델링 / DB 설계 원칙, 지침, 가이드, DB 명명 규칙 등 DB 설계 관련 제반 지침, 표준, 가이드, 문서 자료 - 데이터 표준 구축 내역(문서 또는 DB) |
데이터 표준 구축 내역을 확인할 수 있는 메타 데이터 관리 시스템과 같은 지원도구가 있다면 이에 대해서도 파악해야 함 |
데이터 구조 | 개괄모델 주제영역 개념모델 논리모델 물리모델 데이터베이스 사용자 뷰 |
- 현재 관리하고 있는 ERD(현행화 여부가 중요) - 엔터티 정의서, 테이블 정의서 등 DB 설계 산출물 - 데이터베이스 현황 - DB 개체 목록, DB에서 실제 수집한 테이블 / 컬럼 구성 내역 등 |
ERD를 관리하고 있지 않거나 ERD가 현행화 되어 있지 않은 경우 리버스 데이터 모델링을 통해 현행 데이터 구조에 대한 ERD 확보 |
데이터 흐름 | 데이터통합 구조도 데이터 흐름도 아웃바운드/인바운드 데이터 정의서 |
- 논리/물리 시스템 구성도 - 데이터 인터페이스 정의서, 데이터 흐름 정의서 등 내외부 시스템 인터페이스 관련 내역에 대한 정의 자료 |
데이터를 주고 받는 내외부 시스템들의 구성과 해당 데이터 내역을 파악할 수 있는 자료 확보 |
데이터 관리 | 데이터 관리 정책 데이터 표준 관리 요구사항 관리 데이터 모델 관리 데이터 흐름 관리 데이터베이스 관리 |
- 데이터 / DB 관리와 관련된 제반 정책, 기준, 표준 지침, 가이드 등 자료 - 사용자 요구사항, 데이터 요구사항 등 요구 사항 수집 / 정리 자료 - 데이터 / DB 관리 활동에 따른 제반 결과물 자료 |
관리 정책 / 기준 / 표준 / 지침 / 가이드 등의 자료와 해당 자료에서 명시한 활동사항이 있는 경우 활동 결과 산출물까지 확보 필요 |
나. 데이터아키텍처 정보 구축 방식
상향식과 하향식 존재한다.
상향식 구축 방법은 최하위에 있는 구성요소를 조사 분석하여 구성요소들의 공통점을 파악하여 공통적인 구성요소들을 모아 상위 구성요소를 정의해나가는 방식이다.
- 상향식 방식은 조직의 모든 데이터가 포함되는 것을 보장할 수 있는 장점이 있는 반면, 논리화-추상화를 거치면서 상위 계층의 데이터 구조 수준이 서로 다르게 나타날 수 있는 단점이 있다.
하향식 구축 방법은 최상위의 구성요소로부터 시작하여 분류 기준에 따라 하위 구성요소를 도출해 내는 방식이다.
- 하향식 방식은 일반적인 분류 기준이나 목적에 따른 분류 기준을 따르기 때문에 관점이 명확하다는 장점이 있다. 그러나 일부 업무가 누락될 가능성이 있으며 어디에도 포함되지 않는 구성요소가 발생할 수 있다는 것이 단점이다.
2. 현행 데이터아키텍처 정보 구축
- 현행 데이터아키텍처 정보의 구축은 현재 업무나 정보시스템, 데이터 주제영역 구성에 대해 기존의 데이터 관련 자료를 분석하여 데이터의 현재 모습에 해당하는 데이터아키텍처 정보를 구축하는 것
- 상위 수준의 업무 기능과 시스템 또는 데이터 주제영역에 대한 분류를 우선 수행한 후 그 기준에 따라 나머지 데이터아키텍처 정보를 구축하는 것이 효율적
- 상위 수준의 분류 기준이 정리되면 나머지 정보 구축은 병렬적으로 수행해도 된다.
- 기존의 데이터 관련 산출물이 데이터의 현재 모습과 일치하면 하향식으로 구축해 나갈 수 있겠으나, 그렇지 않다면 상향식으로 접근하여 현재의 데이터베이스로부터 각 시스템에서 사용하는 데이터 정보를 분석하여 현행 물리 데이터 모델을 도출하고, 현행 데이터 주제영역을 정의한다.
- 현행 데이터아키텍처를 구축할 때 일반적으로 많이 사용하는 방법은 상향식 접근 방법이지만, 계획자 수준의 상위 정보만을 구축할 경우에는 하향식 방식이 적합하며, 실무자 수준의 정보를 구축할 경우에는 상향식 방식이 더 적합하다고 할 수 있다.
■ 현행 데이터아키텍처 정의 내역
- 전사 데이터 영역 식별
- 데이터베이스 개체 파악 및 분석
- 현행 데이터 구조 정보 정의
- 현행 데이터 주제영역 정의
- 현행 물리 데이터 모델 정의
- 현행 논리 데이터 모델 정의
- 현행 개념 데이터 모델 정의
- 현행 데이터 표준 정보 정의
- 현행 데이터 원칙, 표준, 관리 프로세스 파악
- 현행 데이터 흐름 정보 정의
- 현행 데이터 관리 정보 정의
가. 현행 데이터 분석
- 현행 데이터아키텍처 정보를 구축할 때 가장 먼저 할 일은 전사 데이터 영역의 범위를 파악하는 것과 필요한 자료를 수집하는 것이다. 이를 토대로 현행 데이터베이스 개체를 파악하고 데이터 현황을 분석한다.
■ 현행 데이터 분석 내역
- 현행 데이터 분석 내역
- 데이터베이스 개체 및 스토리지 사용 현황 파악
- 데이터의 완전성 분석 : 미사용 테이블 / 칼럼 파악, 임시 데이터 파악, 논리적 필수 칼럼 및 데이터 결여 등
- 데이터 우선순위 분석 : 키(핵심) / 메인 엔터티 파악
- 데이터 정합성 분석 : 데이터 우선순위 및 관련 데이터 간 정합성 파악
- 데이터 유효성 분석 : 데이터 형식, 유효 범위, 선후관계 유효성(예, 시작일 <= 종료일) 등 파악
- 데이터 표준화 현황 분석 : 데이터베이스 개체의 명칭 일관성, 도메인 일관성, 코드 사용의 일관성 등 파악
- 문서화 현황 및 정합성 분석 : 현행 데이터에 대한 설계 문서 확인, 설계 문서와 실물 개체의 일치 여부 확인 등
- 설계 및 관리 현황 분석 : 전사 데이터 영역에 대한 데이터 구조 설계 자료 보유 여부 및 현행화 상태 파악, 현행의 데이터 관리 체계 파악 등
나. 현행 데이터 표준 분석
- 전사 데이터 영역으로 파악한 범위에 대해 현재 적용하고 있는 데이터 표준의 존재 여부 및 데이터 표준 구성 현황 / 적용 범위 및 준수도 등을 파악하고, 현행 데이터 표준이 존재하는 경우 현행 데이터 및 데이터 구조에 대해 적용되고 있는 비율이나 현황을 파악한다.
■ 현행 데이터 표준 분석 내역
- 현행 데이터 표준 구성 / 활용 현황 분석
- 현행 데이터의 표준 준수도 분석
다. 데이터 요구 사항 분석
- 현행 및 목표 시스템에 대한 데이터 요구를 수집하여 현행 데이터에 대한 이해 증진 및 목표 데이터 구조 설계 시 방향 도출의 근거로 활용한다.
■ 데이터 요구 사항 분석 내역
- 현행 데이터에 대한 데이터 요구 사항 파악
- 현행 데이터 요구 사항에 대한 반영 현황 파악
- 목표 데이터아키텍처에 대한 데이터 요구 사항 정리 및 파악
- 목표 데이터아키텍처에 대한 방향성 수립 시사점 도출
라. 현행 물리 데이터 모델 도출
- 현행 물리 데이터 모델 도출은 테이블, 칼럼 등 데이터베이스 개체 정보로부터 물리 데이터 모델을 생성하는 작업으로, 생성한 물리 데이터 모델은 ER 다이어그램으로 표현된다.
- 데이터 모델링 도구를 사용하여 물리 데이터 모델을 생성하게 되면 테이블 정의서와 같은 물리 데이터 모델에 대해 요구되는 산출물 생성을 자동화할 수 있는 장점이 있다.
■ 현행 물리 데이타 모델 도출 내역
- 현행 물리 데이터 모델 생성 대상 범위 파악
- 현행 물리 데이터 모델 생성 대상 범위 내의 임시 테이블 파악 및 정리
- 현행 물리 데이터 모델 생성
- 관계 복원 및 한글 논리명 사용 가능 여부 파악
마. 현행 논리 데이터 모델 도출
- 현행 논리 데이터 모델 도출은 데이터베이스의 테이블 구조를 그대로 표현한 현행 물리 데이터 모델로부터 데이터 집합의 논리적 형태로 전환하여 현행 논리 데이터 모델을 생성하는 작업이다.
- 현행 논리 데이터 모델은 테이블 구조가 아니라 대상 데이터의 논리적 형태를 표현하기 위한 것이기 때문에 이해를 위해 한글화가 필수적이며, 이에 따라 데이터 집합을 표현한 엔터티와 데이터 집합의 구체적인 특성을 표현한 속성 / 관계명 등에 대해 한글 명칭으로 표현하게 된다.
- 현행 논리 데이터 모델은 엔터티나 속성의 명칭 외에도 정확한 관계 파악과 표현, 데이터 집합에 대한 통합적 형태 정의 등 데이터 모델링 기법에서 다루어지는 모든 사항에 대해 정확하고 구체적으로 표현하는 것이 중요하다
■ 현행 논리 데이터 모델 도출 내역
- 현행 데이터 표준 및 적용 현황 파악
- 현행 물리 데이터 모델 구성 개체의 명칭에서 명명규칙 파악
- 명명규칙과 현행 데이터 표준을 토대로 한글명 도출
- 현행 논리 데이터 모델 생성 및 상세화, 논리화 수행
- 현행 물리/논리 데이터 모델 개체에 대해 테이블-엔터티, 칼럼-속성 매핑 관계 파악
바. 현행 개념 데이터 모델 도출
- 현행 개념 데이터 모델 도출은 현행 논리 데이터 모델의 엔터티에 대해 의미나 성격이 유사한 것들을 그루핑하여 추상화 수준을 높여 데이터 모델로 정의하는 작업이다.
- 개념 데이터 모델은 형태적으로 논리 데이터 모델과 유사하여 엔터티, 속성, 관계 등의 형태로 표현되지만 이들은 논리 데이터 모델의 엔터티, 속성, 관계와는 표현하는 차원이 다르기 때문에 동일시하지 않아야 한다.
- 개념 데이터 모델은 논리 데이터 모델에 정의된 많은 엔터티와 데이터 구성을 한 눈에 파악할 수 있도록 주요 데이터를 중심으로 요약해서 표현한 것이라 할 수 있다.
- 개념 데이터 모델로 정의하는 데이터의 범위는 보통 주제영역 단위이며, 규모나 의사결정에 따라 대주제영역이나 중주체영역 또는 소주제영역 단위로 정의할 수도 있다.
- 개념 데이터 모델에 표현된 엔터티, 속성, 관계 형태의 각 개념 개체에 대해 논리 데이터 모델의 어떠한 엔터티, 속성, 관계로 상세화되었는지에 대한 매핑 관계를 파악하여 정의하는 것도 중요하다.
■ 현행 개념 데이터 모델 도출 내역
- 현행 개념 데이터 모델 정의 범위 파악
- 현행 개념 데이터 모델 생성
- 현행 논리 / 개념 데이터 모델에 대해 각 구성 개체 간 매핑 관계 파악
사. 현행 주제영역 모델 도출
- 현행 주제영역 모델 도출은 현행 전사 데이터 범위에 대해 데이터 주제영역 구성을 파악하여 분류하는 작업으로, 주제영역의 분류와 구성은 전사 데이터를 한눈에 조망하고, 전사 데이터가 어떠한 체계로 구성되고 관리되는지를 파악할 수 있다.
■ 현행 주제영역 모델 도출 내역
- 현행 데이터 주제영역 분류 파악 및 정의
아. 현행 데이터 구조 문제점 및 개선방안 도출
- 현행 데이터 구조에 대해 물리 · 논리 · 개념 데이터 모델로 추상화 수준을 높여가면서 계층적으로 구성하는 거은 많은 데이터 개체들을 추상화 수준을 높여가면서 주요 데이터 위주로 신속하게 파악할 수 있도록 하기 위함이다.
- 단순히 데이터 모델 그림을 그려내는 것이 목적이 아니기 때문에 현행 데이터 모델을 구체적이고 정확하게 표현하여 데이터 구조 상의 문제와 원인, 개선방안 등을 도출할 수 있어야 한다.
■ 현행 데이터 구조 문제점 및 개선방안 도출 내역
- 현행 데이터 구조 상의 문제점 파악
- 현행 데이터 구조 상의 문제로 인한 데이터 오류 사항 근거 수집 및 원인 분석
- 현행 데이터 구조의 문제에 대한 시사점 도출
- 현행 데이터 구조 개선 방향 정의
3. 목표 데이터아키텍처 정보 구축
- 목표 데이터아키텍처 구축은 현행 데이터아키텍처에 대한 문제점 분석 및 개선 방향 도출 결과를 토대로, 데이터 참조모델에서 바람직한 선진 모델 구조를 참조하거나 재사용할 데이터 구조 등을 파악하고, 데이터 요구 사항을 반영하여 이를 목표 데이터아키텍처에 반영하는 과정으로 진행된다.
- 목표 데이터아키텍처의 구축 범위는 데이터아키텍처의 구축 목적에 따라 다르지만, 일반적으로 초기 목표 데이터아키텍처 수립 시에는 현행 데이터아키텍처 수립과 달리 데이터아키텍처 매트릭스의 개념적 수준까지 정의한다.
■ 목표 데이터아키텍처 정의 내역
- 목표 데이터 표준, 관리 프로세스 정의
- 목표 데이터 주제영역 모델 정의
- 목표 개념 데이터 모델 정의
- 목표 논리 데이터 모델 정의
- 목표 물리 데이터 모델 정의
- 목표 데이터베이스 개체 정보 구축
- 목표 데이터 흐름 정의
가. 목표 데이터 표준, 관리 프로세스 정의
- 현행 데이터아키텍처를 구축하고 현행 데이터 구조의 문제점과 개선방향을 도출한 후, 이 결과에 데이터 관련 요구 사항을 반영하여 목표 데이터아키텍처를 수립하기 위한 목표 데이터 표준과 데이터 관리 프로세스를 정의한다.
- 현행 데이터아키텍처에 대한 분석 결과를 토대로 목표 데이터아키텍처에 보완하거나 추가 또는 개선할 데이터 관리 프로세스를 정의한다.
- 데이터 관리 프로세스는 관련 조직이나 역할의 책임이 명확하게 정의되어야 하며, 절차가 너무 복잡하지 않아야 한다. 또한 명확하게 정의되어야 한다.
■ 목표 데이터 표준, 관리 프로세스 정의 내역
- 데이터 정책 관리 프로세스 정의
- 목표 데이터 표준 정의
- 데이터 표준 관리 프로세스 정의
- 데이터 요구 사항 관리 프로세스 정의
- 데이터 모델 관리 프로세스 정의
- 데이터 흐름 관리 프로세스 정의
- 데이터베이스 관리 프로세스 정의
- 데이터 품질 관리 프로세스 정의
나. 목표 데이터 주제영역 정의
- 목표 데이터 주제영역 정의는 전사 데이터 범위 정의, 데이터아키텍처 원칙, 데이터 요구 사항, 현행 데이터아키텍처 분석 결과 등을 토대로 하여 전사 차원의 데이터를 일관된 뷰로 조망할 수 있도록 데이터를 분류하는 것
- 데이터 주제영역은 데이터 최상위 집합으로 전사 차원에서 일관되게 관리되어야 하며, 업무별 사일로(Silo) 구조가 되지 않도록 유사한 데이터별로 하나의 통합된 분류 구조로 정의해야 한다.
■ 목표 데이터 주제영역 정의 내역
- 주제영역 분류 원칙 정의
- 목표 데이터 주제영역 모델 정의
- 목표 개괄모델 정의 : 주제영역 간의 관계를 정의
- 목표 주제영역 정의서 작성
다. 목표 개념 데이터 모델 정의
- 목표 개념 데이터 모델 정의는 목표 데이터 주제영역 정의 결과를 토대로 주제영역별로 주요 데이터와 이들 간의 관계를 도출하여 목표 데이터 구조의 골격을 엔터티-관계 모델 형태로 정의하는 작업이라 할 수 있다.
- 목표 개념 데이터 모델을 통해 주제영역별로 목표 데이터 구조의 주요 데이터와 그들 간의 관계를 파악하기에 용이하다. 이를 통해 목표 데이터 구조의 방향을 가늠할 수 있고, 목표 논리 데이터 모델로 상세화하기 위한 틀을 제공할 수 있다.
■ 목표 개념 데이터 모델 정의 내역
- 목표 개념 데이터 모델 정의
- 목표 개념 데이터 모델 정의서 작성 : 목표 개념 데이터 모델에 나타난 주요 데이터와 관계에 대한 설명
라. 목표 논리 데이터 모델 정의
- 목표 논리 데이터 모델 정의는 목표 개념 데이터 모델을 토대로 개념 데이터 모델에 정의된 주요 데이터와 이들 간의 관계에 대한 세부 내용을 도출하여 데이터 구조의 상세한 논리적 형태를 정의하는 것이다.
- 엔터티, 속성, 관계 등의 구성요소를 사용하여 비지니스 규칙이 구체적으로 상세하게 표현되어야 한다.
■ 목표 논리 데이터 모델 정의 내역
- 목표 논리 데이터 모델 정의
- 목표 논리 데이터 모델 정의서 작성 : 엔터티 정의서, 속성 정의서 등
마. 목표 물리 데이터 모델 정의
- 목표 물리 데이터 모델 정의는 논리 데이터 모델을 특정 DBMS에 최적화한 형태로 정의하는 작업이다.
- 물리 데이터 모델을 정의할 때 데이터 표준을 이용하여 칼럼명, 데이터 타입 및 길이 등 물리 데이터 요소를 일관되게 생성해야 한다.
■ 목표 물리 데이터 모델 정의 내역
- 목표 물리 데이터 모델 정의
- 목표 물리 데이터 모델 정의서 작성 : 테이블 정의서, 칼럼 정의서 등
바. 목표 데이터베이스 개체 정보 구축
- 목표 데이터베이스 개체 정보 구축 시 물리 데이터 모델에 정의된 물리 데이터 요소를 생성하려는 DBMS의 구성과 생성되는 개체의 정보, 활용방법 설계 등이 반영된다.
- 주로 성능과 보안성 확보를 고려한 추가적인 설계에 해당하며, 물리 데이터 모델에 정의된 테이블을 생성하고 관리하기 위한 스토리지 구성과 용량 계획, 스키마 구성 및 DBMS 환경 변수 설정 등과 같은 시스템 저장 공간에 대한 설계를 비롯하여, 핵심 데이터 식별과 이들을 보호하기 위한 접근 권한 및 접근 제어 방법, 암호화 등의 설계, 데이터 분산 설계 등의 내용이 포함된다.
■ 목표 데이터베이스 개체 정보 정의 내역
- 목표 시스템 저장 공간 설계
- 목표 시스템 보안성 정의 : 보호 대상 핵심 데이터 정의, 권한관리 / 접근제어 정책 등
- 목표 데이터 분산 설계 : 데이터베이스 분산 설계, 데이터 파티셔닝 설계 등
사. 목표 데이터 흐름 정의
- 목표 데이터 흐름 정의는 별개로 분리되어 구축되는 정보시스템이나 외부의 정보시스템들과 데이터 교환을 통해 목표 시스템이 완전한 기능을 발휘하고 전사적인 통합 시스템 체계를 완성할 수 있도록 시스템 간의 데이터 이동을 정의하는 것이다.
■ 목표 데이터 흐름 정의 내역
- 전사 데이터 통합 구조도 정의
- 데이터 흐름도 정의
- 아웃바운드/인바운드 데이터 정의서
4. 목표 데이터아키텍처 이행 계획 수립
- 목표 데이터아키텍처 이행 계획은 현행 데이터아키텍처에서 목표 데이터아키텍처로의 이행을 위한 전략을 수립하고 구체적인 이행 계획을 수립하는 것이다. 현행 데이터아키텍처와 목표 데이터아키텍처의 차이 분석을 통하여 프로젝트를 정의한다.
- 둘 이상의 프로젝트로 정의되는 경우 정의된 프로젝트 간의 유사성과 상호연관성을 고려하여 우선순위를 결정하고, 이를 고려하여 프로젝트 간 및 프로젝트 내에서의 이행 전략과 세부 이행 계획을 수립한다.
- 또한, 이행 계획을 성공적으로 추진하기 위한 변화 관리 계획 수립도 필요하다.
- 세부 이행 계획에는 필요한 인력과 자원에 대한 리소스 계획, 추진 일정, 비용 계획 등이 포함된다.
[목표 데이터아키텍처 이행 계획의 주요 활동 및 작업]
■ 데이터아키텍처 차이(Gap) 분석
- 목표 및 현행 데이터 아키텍처 검토
- 차이 분석
■ 프로젝트 정의
- 프로젝트 목록 정의
- 개별 프로젝트별 필요 리소스 정의
- 프로젝트 우선순위 및 연관성 분석
■ 이행 전략 수립
- 프로젝트 이행에 필요한 단계별 이행 전략 대안 수립
- 이행 전략별 타당성 분석 및 대안 확정
■ 이행 계획 수립
- 프로젝트별 추진 방법 정의
- 프로젝트별 세부 활동 및 상세 일정 계획 수립
■ 변화 관리 계획 수립
- 변화 관리 대상 및 변화 요인 식별
- 변화 관리 계획 수립
- 변화 관리 교육 계획 및 자료 작성
'자격증 > DAsP' 카테고리의 다른 글
[데이터아키텍처 구축] 데이터아키텍처 정보 구성 정의 (0) | 2023.03.26 |
---|---|
[데이터아키텍처 구축] 데이터아키텍처 방향 수립 (0) | 2023.03.26 |
[아키텍처 프레임워크] 데이터 아키텍처 프로세스 (0) | 2023.03.25 |
[아키텍처 프레임워크] 데이터아키텍처 참조모델 (0) | 2023.03.25 |
[아키텍처 프레임워크] 아키텍처 프레임워크 개요, 구성, 사례 (0) | 2023.03.25 |