정의
데이터베이스는 공동의 목적을 지닌 다수의 사람이 공유하고 관리하는 데이터의 집합을 의미한다.
개념
데이터는 관찰 혹은 측정을 총해 얻을 수 있는 값(Value)이나 사실(Fact)로 숫자, 문자, 그림, 소리 등 가공되지 않은 1차 자료이다. 또한 데이터는 정형 데이터와 비정형 데이터 두 종류로 나뉜다.
- 정형 데이터: 일정한 체계를 가지고 있는 데이터로 사용자가 쉽게 이해하고 시스템이 바로 적용할 수 있다.
SQL 기반 관계형 데이터베이스에 사용되는 데이터이다. - 비정형 데이터: 일정한 체계가 없는 데이터로 자신이나 비디오, 오디오 등이 여기에 해당한다.
일정한 체계가 없기 때문에 검색이나 분석이 매우 어렵지만 정형 데이터에 비해 유연하다는 장점이 있다.
특정한 틀이 없는 NoSQL 데이터베이스에 사용된다.
데이터베이스는 다수의 사람들이 공유하여 사용할 목적으로 데이터를 일정한 형식으로 구조화해 통합하고 관리하는 데이터의 집합니다.
데이터의 관리 효율을 높이기 위해 중복을 제거하고 구조화한 것이다.
데이터의 구조화란 단순한 측정값에 불과한 데이터를 목적에 맞게 속성별로 정리하는 것을 말한다.
데이터베이스 안의 데이터들의 특징
- 공유 데이터: 개인이 아닌 공동으로 사용학시 위해 저장된 데이터이다.
- 통합 데이터: 흩어져 있는 데이터의 중복은 관리가 어려워 중복을 허용하지 않는다. 따라서 중복을 최소화하여 중복으로 발생할 수 있는 불일치 현상을 제거해야 한다.
- 저장 데이터: USB와 같이 컴퓨터가 접근 가능한 매개체에 저장해야 한다.
- 운영 데이터: 조직의 목적을 달성하기 위해 사용되는 데이터이다.
관계형 데이터베이스 시스템(RDBMS, SQL)
표(테이블)로 데이터를 표현하는 소프트웨어로 SQL시스템이라고도 한다.
많이 사용되는 RDBMS로는 Oracle IBM, MsSQL, MySQL 등이 있다.
특징
- 무결성: 중복 데이터가 서로 다른 값을 가지고 있다면 실제 값으로 반영해 데이터를 정확하게 유지한다.
- 일관성: 모든 데이터가 일정한 형식을 갖춰 일관성을 갖는다.
- 경제성: 데이터의 중복을 제거해 기억 공간이 절약된다.
- 보안성: 데이터를 암호화하여 보호할 수 있다.
비관계형 데이터베이스 관리 시스템(NoSQL)
관계형 데이터베이스 관리 시스템은 하나의 표에 데이터가 수만 개씩 쌓이게 되면 성능이 저하되는 단점이 있어 대용량 데이터 처리가 가능한 NoSQL이 각광받기 시작했다.
NoSQL에는 몽고디비, 네오포제이, 레디스, 카산드라 등이 있다.
특징
- 스키마 리스: 데이터 구조를 미리 정의할 필요가 없어 비형식적인 데이터를 저장할 때 용이
- 대용량성: 비디오나 사진과 같은 대용량 데이터를 저장할 때 용이
- 분산 저장: 데이터 용량이 커지면 이를 처리하기 위해 여러 서버에 분산 저장하고 데이터를 복제한다.
- 경제성: 데이터 용량이 커지면 관계형 데이터베이스는 성능이 더욱 좋은 단일 서버가 필요해져 비용이 많이 들지만
비관계형 데이터베이스는 여러 대의 절혐한 서버를 이용하기 때문에 비용이 훨씬 저렴하다.