1. 분산 데이터베이스

- 논리적으로는 같은 시스템에 속하지만 물리적으로는 컴퓨터 네트워크를 통해 분산되어 있는 DB


1) 분산 데이터베이스 시스템의 구성 요소

- 분산 처리기 : 자체적으로 처리 능력을 가지며 지리적으로 분산되어 있는 컴퓨터 시스템

- 분산 데이터베이스 : 지리적으로 분산되어 있는 데이터 베이스. 해당 지역의 특성에 맞게 DB 구현됨

- 통신 네트워크 : 분산 처리기들을 통신망으로 연결, 논리적으로 하나의 시스템처럼 작동할 수 있도록 하는 네트워크


2) 분산 데이터베이스의 목표

- 위치 투명성 : 접근하려는 데이터베이스의 실제 위치 알 필요 없이 단지 데이터베이스의 논리적 명칭만으로 접근 가능

- 중복 투명성 : 동일한 데이터가 여러 곳에 중복되어 있더라도 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용

  시스템은 자동으로 여러 데이터에 대한 작업 수행

- 병행 투명성 : 다수의 트랜잭션들이 동시에 실행되더라도 그 트랜잭션의 수행 결과는 서로 영향 받지 않음

- 장애 투명성 : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션은 정확하게 수행됨

장점

단점

높은 지역 자치성

데이터 공유성 향상

분산 제어 가능

시스템 성능이 향상됨

높은 효율성, 융통성

높은 신뢰성, 가용성

점증적 시스템 용량 확장 용이

DBMS가 수행할 기능이 복잡

어려운 DB 설계

잠재적 오류 증가

처리 비용 증가

소프트웨어 개발 비용 증가

 

2. 멀티미디어 데이터베이스

- 텍스트, 그래픽, 정지 화상, 동영상, 음성 등이 복합적으로 구성된 데이터베이스


1) 멀티미디어 데이터베이스의 특성

- 데이터가 일반적으로 대용량

- 검색 대상의 내용이 데이터의 중간에 있을 수 있으므로 미디어별로 별도의 검색 방법이 필요

- 비정형 데이터이므로 데이터 구조가 복잡하고 관계를 구성하기 어려움

 

2) 멀티미디어 데이터베이스 구축 방법

(1) 파일 기반 기법

- DMBS 사용 X. 단순한 검색 위주의 VOD(Video on Demand) 등에 이용

- 데이터의 동시 접근이 어렵고 회복 기능 등 지원 빈약

(2) 관계형 데이터베이스 기반 기법

- CLOB : 텍스트 데이터 저장 / BLOB : 이미지, 비디오, 오디오 등 이용

- 정형화된 데이터는 관계형 데이터베이스 데이터 타입 이용 / 비정형화된 데이터는 파일로 저장

(3) 객체 지향 데이터베이스 기반 기법

- 멀티미디어를 가장 잘 표현할 수 있는 기법

- 사용자 정의 클래스, 사용자 정의 메소드 이용 -> 미디어별로 별도의 클래스 정의 가능

(4) 객체 관계형 데이터베이스 기반 기법

- 관계형 데이터베이스의 CLOB, BLOB 데이터 타입 이용

  사용자 정의 클래스. 사용자 정의 메소드 이용해 미디어별 타입 정의해서 사용

 

3. 주기억장치 데이터베이스

- 데이터베이스 전체를 주기억장치에 상주시킨 후 데이터베이스 연산을 수행하는 시스템.

- 디스크 입출력이 발생하지 않음

1) 주기억장치 데이터베이스의 특성

- 디스크 입출력이 줄어들어 빠른 연산 가능

- 시스템에 문제 발생 시 복구하는 회복작업 구현이 어려움

- 주기억장치 구입비용이 많이 듬

 

4. 데이터 웨어하우스

- 급증하는 다량의 데이터를 효과적으로 분석하여 정보화 -> 여러 계층의 사용자들이 효율적으로 사용할 수 있도록

한 데이터 베이스

- 전사적 데이터 통합을 통한 정보의 효율적 분석이 필요, 신속 정확한 의사결정으로 경쟁력 확보하기 위한 의사결정

용 데이터베이스

- 다양한 원본데이터베이스로부터 정제되어 추출된 데이터만을 저장하고 필요한 인덱스를 생성

이후 데이터의 다차원 분석 도구로 데이터 웨어하우스를 분석해 효율적 의사결정에 필요한 자료 얻음

장점

단점

높은 투자 수익률 얻을 수 있음

타사에 비해 경쟁우위 획득 가능

의사 결정자의 생산성 향상

기존 시스템과 명확한 역할 설정 못하면 업무 혼란 초래

추출 기준에 맞지 않는 데이터의 입력, 갱신, 삭제가 발생하면 불일치 문제 발생 가능

의사결정을 위한 충분한 데이터가 확보되지 않으면 정확한 결과 도출 불가능

과다한 자원을 사용하게 되고 유지 보수 어려움

 

5. 데이터마트

- 전사적으로 구축된 데이터 웨어하우스로부터 특정 주제나 부서 중심으로 구축된 소규모 단일 주제의 데이터 웨어하우스

- 부서별, 업무 기능별로 구축되는 데이터 웨어하우스로서 일반적으로 한 기업 내 복수개의 데이터 마트 존재

- 전사적 통합성을 염두에 두고 데이터마트가 데이터 웨어하우스보다 먼저 구축될 수 있음

1) 데이터 마트의 특징

- 전사적 데이터 웨어하우스의 데이터를 분석 요건에 적합한 구조로 재구성함

- 추세, 패턴 분석 및 데이터 접근이 용이한 요약 데이터로 구성, 필요시 일부 상세 데이터 포함

- 분석에 필요한 이력 데이터만을 포함하는 제한된 규모의 데이터

- 다양한 질의나 요구를 충족하는 유연성과 접근성이 뛰어난 다차원구조의 데이터

 

6. 데이터 마이닝

- 데이터 웨어하우스에 저장된 데이터 집합에서 사용자의 요구에 따라 유용하고 가능성 있는 정보를 발견하기 위한 기법

- 데이터마이닝의 기법

연관

대용량의 트랜잭션 데이터로부터 “A이면 B이다형식의 연관 관계를 발견

연속

개인별 트랜잭션 이력 데이터를 시계열적으로 분석하여 트랜잭션의 향후 발생 가능성을 예측

분류

다른 그룹과의 차별적인 특성을 도출

클러스터링

(군집화) 상호 간 유사한 특성을 갖는 데이터들을 집단화

특성화

데이터 집합의 일반적인 특성을 분석하는 것, 데이터의 요약 과자ᅟᅥᆼ을 통해 특성 발견

패턴 분석

데이터베이스 내의 명시된 패턴을 찾는 방법

경향 분석

시계열 데이터들이 시간 축으로 변화하는 전개과정을 특성화 -> 동적으로 변하는 데이터 분석


7. OLAP

- 다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사결정에 활용하는 방식

- 데이터 웨어하우스 / 데이터 마트 같은 시스템과 상호 연관됨

- 데이터 웨어하우스 : 데이터를 저장하고 관리

   OLAP : 데이터 웨어하우스의 데이터를 전략적인 정보로 변환

- 중간 매개체가 없이 이용자들이 직접 컴퓨터를 이용하여 데이터에 접근하는 데 있어 필수적인 시스템

 

1) OLAP 연산

- Roll-up : 분석할 항목에 대해 한 차원 계층 구조를 따라 단계적으로 상세 데이터 -> 요약 데이터 로 접근

- Drill-down : 분석할 항목에 대해 한 차원 계층 구조를 따라 단계적으로 요약 데이터 -> 상세 데이터 로 접근

- Drill-through : 데이터 웨어하우스나 OLTP에 존재하는 상세 데이터에 접근하는 기능

- Drill-across : 다른 데이터 큐브의 데이터에 접근하는 기능

- Pivoting : 보고서의 행, , 페이지 차원을 바꾸어 볼 수 있는 기능

- Slicing : 다차원 데이터 항목들을 다양한 각도에서 조회하고 자유롭게 비교하는 기능

- Dicing : Slicing을 더 세분화하는 기능


2) OLAP 종류

- ROLAP : 관계형 데이터베이스와 관계형 질의어 사용 -> 다차원 데이터를 저장하고 분석

- MOLAP : 특수한 구조의 다차원 데이터베이스 사용, 큐브 캐시라고 하는 주기억장치 속에 데이터 큐브를 보관

* 데이터 큐브 : 특정 목적의 OLAP에서 사용하기 위한 큐브 형태의 다차원 논리적 구조

- HOLAP : ROLAP + MOLAP

   빠른 데이터 검색이 필요한 경우에는 요약을 메모리에 저장. 기본 데이터나 다른 요약들은 관계형 DB에 저장

 

8. OLTP

- 온라인 업무 처리 형태의 하나

- 네트워크상의 여러 이용자가 실시간으로 데이터베이스의 데이터를 갱신하거나 검색하는 등의 단위 작업을 처리하는 방식

- 단위 작업 : 트랜잭션 / 데이터 무결성!

- 빠른 응답 시간 요구, 개개의 레코드를 효율적으로 조회하고 수정할 수 있도록 정규화 되어 있음

구분

OLTP

OLAP

데이터 구조

복잡(운영시스템 계산에 적합)

단순(사업 분석에 적합)

데이터의 갱신

순간적 / 동적

주기적 / 정적

응답 시간

2, 3 ~ 몇 초 이내

수 초 ~ 몇 분 까지도 가능

데이터의 범위

과거 30 ~ 90

과거 5~ 10

데이터의 성격

정규/핵심 업무 데이터, 변경 어려움

비정규/일기 전용 데이터, 변경 용이

데이터의 크기

GIGA BYTE

TERA BYTE

데이터의 내용

상세 데이터

기록 보관된 요약/계산 데이터

데이터 특성

트랜잭션 중심, 중복 배제

주제 중심, 중복 수용

데이터 액세스 빈도

높음

보통 혹은 낮음

데이터의 사용법

고도로 구조화된 연속 처리

고도로 비구조화된 분석 처리

쿼리의 성격

예언 가능. 주기적

예측하기 어려움, 특수함


9. ODBC

- 프로그램과 데이터베이스의 종류에 상관없이 자유롭게 데이터베이스에 접근하여 사용할 수 있도록 Microsoft사가 만든 응용프로그램의 표준 

  인터페이스(API)

- 데이터베이스에 따른 차이는 ODBC 드라이버에 흡수

  -> 사용자는 DB종류 의식 않고 ODBC 기준에 맞게 응용프로그램을 작성하면 됨

- 데이터베이스를 교체하더라도 응용프로그램은 그대로 사용 가능 -> 비용 절감

 

1) ODBC의 구조


- Application : DB접속 시 ODBC API 사용

Driver Manager : ApplicationODBC Driver 간의 통신 관리하는 라이브러리. DSN에 정의된 형태로 필요한 드라이버 로딩 or 언로딩

DSN : 서버 연결 시 필요한 드라이버, DB 정보 저장함

ODBC Driver : ODBC AP 지원 함수 구현 라이브러리

데이터베이스 : ODBC Driver에서 요청한 SQL에 대한 결과를 반환


+ Recent posts