[데이터 이해] 02. 데이터베이스의 정의와 활용
1. 데이터베이스의 특징
데이터베이스는 통합, 저장, 공용, 변화되는 데이터를 특징으로 한다.
통합된 데이터 (integrated data) |
동일한 내용의 데이터가 중복되어 있지 않음. |
저장된 데이터 (stored data) |
컴퓨터가 접근할 수 있는 저장 매체(자기 디스크, 자기 테이프)에 저장됨. |
공용 데이터 (shared data) |
여러 사용자에게 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용. |
변화되는 데이터 (changeable data) |
새로운 데이터의 추가, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지. |
2. 데이터베이스 관리 시스템
데이터베이스를 관리하여 응용프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어
RBDMS | • 관계형 데이터베이스 관리 시스템 • 정형화된 열과 행으로 구성되는 하나 이상의 테이블로 구성 • 테이블에서 기본키 Primary Key)로 각 행을 식별함 예 : 오라클, Access, MySQL, MSSQL |
ODBMS | • 객체지향 데이터베이스 관리 시스템 • 정보를 객체 형태로 표현하는 데이터 베이스 모델, 오브젝트(Object) 데이터베이스라고도 부름 • 복잡한 데이터의 구조를 표현 및 관리하는 DBMS → 객체들을 생성하여 계층에서 체계적으로 정리하고, 다시 계층들을 상위 계층으로부터 속성과 방법을 물려받을 수 있는 DBMS • 이미지 및 동영상 저장에 적합 |
NoSQL | • Non-SQL, Non-Relational, Not Olny SQL • 관계형 데이터베이스보다 덜 제한적인 일관성 모델을 이용하는 데이터의 저장 및 검색을 위한 메커니즘 제공, 디자인 단순화, 수평적 확장성, 세세한 통제 등을 포함. • 기존의 RDMS가 갖고 있는 특성뿐만 아니라 다른 특성들을 부가적으로 지원함. 예 : MongoDB, Apache HBase, Redis |
☞ SQL(Structured Query Langage)
RDBMS의 데이터를 관리하기 위해서 설계된 특수 목적의 프로그래밍 언어(챔벌린과 보이스에 의해 개발)
▣ 데이터베이스의 특성 5가지
정보 축적 및 전달 측면 | 기계 가동성, 검색 가능성, 원격 조작성 |
정보 이용 측면 | 이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득하고 원하는 정보를 정확하고 경제적으로 찾아낼 수 있음 |
정보 관리 측면 | 방대한 양의 정보를 체계적으로 축적할 수 있고 새로운 내용 추가나 갱신이 용이함 |
정보기술 발전의 측면 | 정보처리, 검색/관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전을 견임 |
경제/산업적 측면 | 경제, 산업, 사회 활동의 효율성을 재고하고 국민의 편의를 증진하는 수단 |
3. 데이터베이스 설계 절차
요구조건 분석 | 데이터베이스 사용자, 사용목적, 사용범위, 제약조건 등을 정리, 명세서 작성 |
개념적 설계 | 정보를 추상적인 개념으로 표현하는 과정 E - R 다이어그램 작성 |
논리적 설계 | 자료를 컴퓨터가 이해할 수 있도록 특정 DBMS의 논리적 자료 구조로 변환 |
물리적 설계 | 논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정 |
☞ 인덱스(index)
- 데이터베이스 내의 데이터를 신속하게 정렬하고 탐색하게 해주는 구조
☞ 스키마(schema)
- 데이터베이스의 구조와 제약 조건에 관해 전반적인 명세를 기술한 것
☞ 메타데이터(metadata)
- 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해주는 데이터
☞ 데이터 사전(data dictionary)
- 자료에 대한 정보를 모아 두는 저장소
- 자료의 이름, 표현 방식, 자료의 의미와 사용 방식, 그리고 다른 자료와의 관계를 저장함
※ 예제 및 기출문제
1. 다음 중 사용자 정의 데이터나 멀티미디어 데이터 증 복잡한 데이터 구조를 표현 및 관리할 수 있는 데이터베이스 관리 시스템으로 적절한 것은?
ⓛ 관계형 DBMS
② 객체지향 DBMS
③ 네트워크 DBMS
④ 계층형 DBMS
2. 다음 중 데이터베이스의 특징이 아닌 것은?
ⓛ USB 등 컴퓨터가 접근할 수 있는 저장 매체에 저장할 수 있다.
② 동일한 내용의 데이터가 중복되어 있지 않다.
③ 여러 사용자에게 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용한다.
④ 정형 데이터만 저장할 수 있다.
3. 다음 중 데이터 NoSQL 저장 방식과 관련이 없는 도구는?
ⓛ MongoDB
② Apache HBase
③ MySQL
④ Redis
정답 : 1 - ②, 2 - ④, 3 - ③
'ADsP 데이터 분석 준전문가 자격증' 카테고리의 다른 글
[데이터 이해] 04. 빅데이터의 이해 (0) | 2022.08.26 |
---|---|
[데이터 이해] 03. 기업 내부 데이터베이스 (0) | 2022.08.24 |
[데이터 이해] 01. 데이터의 이해 (0) | 2022.08.24 |
[데이터 분석 기획] 11. 데이터 거버넌스 체계 수립 (0) | 2022.08.24 |
[데이터 분석 기획] 10. 분석 거버넌스 체계 수립 (0) | 2022.08.24 |