본문 바로가기

학교수업/데이터베이스

[데이터베이스] 회복과 병행 제어

트랜잭션(Transaction)

  • 하나의 작업을 수행하는데 필요한 데이터베이스 연산들을 모아놓은 것
  • 작업 수행에 필요한 SQL문들의 모임: 특히 데이터베이스 변경하는 INSERT, DELETE, UPDATE문의 실행 관리
  • 논리적 작업의 단위
  • 장애 발생시 복구, 병행 제어 작업을 위한 중요 단위
  • 데이터베이스의 무결성과 일관성을 보장하기 위해 작업 수행에 필요한 연산들을 하나의 트랜잭션으로 제대로 정의하고 관리해야함

트랜잭션의 특셩(ACID)

원자성(Atomicity)

  • all-or-nothing: 트랜잭션 연산들이 모두 정상 실행되거나 하나도 실행되지 않거나
  • 트랜잭션 수행 도중 장애 발생시 데이터베이스를 트랜잭션 작업 전 상태로 돌려야 함
  • 원자성 보장을 위해 장애발생시 회복 기능 필요

일관성(Consistency)

  • 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태 유지해야함
  • 트랜잭션 특성 보장 위해 DBMS 병행제어기능 필요

격리성(Isolation)

  • 수행중인 트랜잭션 완료될 때까지 다른 트랜잭션이 중간 연산 결과에 해당하는 데이터에 접근할 수 없음
  • 격리성 보장을 위해 여러 트랜잭션이 동시에 수행되더라도 마치 순서대로 하나씩 수행되는 것처럼 정확하고 일관된 결과 얻을 수 있도록 제어하는 기능 필요(병행제어기능)

지속성(Durability)

  • 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 결과는 영구적이어야함
  • 지속성의 보장을 위해 트랜잭션 완료 후 발생하는 장애에 대한 회복기능 필요

 

트랜잭션의 주요 연산

commit 연산

  • 트랜잭션 수행이 성공적으로 완료되었음을 알림
  • 연산 실행시 트랜잭션의 수행결과가 데이터베이스에 반영되고 일관된 상태를 지속적으로 유지

 

rollback 연산

  • 트랜잭션 수행 실패했음을 알림
  • 연산 실행시 지금까지의 연산결과 취소되고 트랜잭션 수행 전의 상태로 되돌아감

 

트랜잭션의 상태

  • 활동(active) 상태: 트랜잭션 수행되기 시작하여 수행중인 상태
  • 부분완료(partially committed) 상태: 트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태
  • 완료 상태(committed)상태: 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태. 결과를 db에 반영하고 트랜잭션 종료됨.
  • 실패(failed)상태: 장애 발생으로 트랜잭션 수행 중단됨
  • 철회(aborted) 상태: 트랜잭션의 수행 실패로 rollback연산 실행한 상태. 지금까지의 연산 취소하고 원래로 돌림. 철회된 트랜잭션은 상황에 따라 다시 수행되거나 폐기.

 

장애

데이터베이스 저장 장치의 종류

 

장애와 회복

트랜잭션 수행을 위해 필요한 데이터 이동 연산

트랜잭션이 db 데이터를 처리하기 위해서는 데이터를 디스크에서 메인메모리로 가져와 처리한 후 그 결과를 디스크로 보내는 작업 필요. 메인 메모리 버퍼 블록의 데이터를 응용 프로그램의 변수로 가져오고 데이터 처리 결과를 저장한 변수 값을 메인 메모리 버퍼 블록으로 옮기는 작업 필요

중요

회복

  • 장애 발생시 데이터베이스를 장애 발생 전으로 복구하는 작업
  • 트랜잭션의 특성 보장, 데이터베이스 일관된 상태로 유지
  • 회복 관리자(Recovery manager): 장애 발생 탐지, 데이터베이스 복구기능 제공

회복을 위한 db복사본 생성 방법

  • 데이터베이스 회복은 사전 데이터 저장을 통해 이루어짐
    • 덤프(dump): db전체를 다른 저장장치에 주기적으로 복사
    • 로그(log): db에서 변경 연산 실행될 때마다 데이터 변경 전후값을 별도 파일에 기록
  • 회복을 위한 기본연산
    • redo(재실행): 가장 최근에 저장한 데이터베이스 복사본을 가져오고 로그를 이용해 복사본 만들어진 이후 실행된 모든 변경 연산을 재실행하여 장애 발생 전으로 복구(전반적으로 손상된경우)
    • undo(취소): 로그 이용해 지금까지 실행된 모든 변경 연산 취소하여 db복구(변경중이거나 변경된 내용만 신뢰성을 잃은 경우)

 

로그 파일

데이터 변경 전후 값을 기록한 파일

레코드 단위로 트랜잭션 수행과 함께 기록됨

 

회복 기법

로그 회복 기법 - 즉시 갱신(immediate update) 회복 기법

  • 트랜잭션 수행 중 데이터 변경 연산의 결과를 db에 즉시 반영.
  • 변경 연산 로그 파일에 기록한 뒤 데이터베이스에 변경 연산 반영
  • 장애 발생 시점에 따라 redo나 undo 연산 실행해 데이터베이스 복구

 

 

로그 회복 기법 - 지연 갱신(deffered update) 회복 기법

  • 트랜잭션 수행 중 데이터 변경 연산의 결과를 로그에만 기록하고 트랜잭션 부분 완료 후에 로그 기록 이용해 db에 한꺼번에 반영
  • 트랜잭션 수행중 장애 발생시 로그 내용 버리기만 하면 됨
  • redo만 사용
  • 로그 레코드에는 변경 이후 값만 기록 <T1, X, new_value>

 

검사 시점 회복 기법

  • 로그 기록 이용하되, 일정 시간 간격으로 checkpoint를 만들고 검사 시점이 되면 모든 로그 레코드를 로그 파일에 기록한 뒤 데이터 변경 내용을 데이터베이스에 반영한 후 검사시점을 의미하는 <checkpoint L> 로그 레코드를 로그 파일에 기록
  • 장애 발생시 가장 최근 검사 시점 이후의 트랜잭션 대상으로 회복작업(<checkpoint L>이후)
  • 작업 범위가 정해지므로 불필요한 회복 작업이 없어 효율적

 

미디어 회복 기법

  • 디스크에 발생할 수 있는 장애에 대한 회복
  • 덤프 이용: 전체 데이터베이스 내용을 일정 주기마다 저장장치에 복사
  • 디스크 장애 발생시 수행
  • 가장 최근에 복사해둔 덤프를 이용해 장애 발생 이전의 데이터베이스 상태로 복구하고 필요에 따라 REDO연산 수행

 

병행 제어

병행 수행(Concurrency)

여러 사용자가 데이터베이스를 동시공유할 수 있도록 여러개의 트랜잭션을 동시에 수행

여러 트랜잭션이 차례로 번갈아 수행되는 인터리빙 방식

 

병행제어(Concurrency Control) 또는 동시성 제어

병행 수행 시 같은 데이터에 접근하여 연산을 실행해도 문제가 발생하지 않고 정확한 수행 결과 얻도록 트랜잭션 수행 제어

 

병행수행시 문제점

갱신분실(lost update)

  • 하나의 트랜잭션이 수행한 연산 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화됨
  • 여러 트랜잭션이동시에 수행되더라도 마치 순차적으로 수행한 것과 같은 값을 얻을 수 있어야 함

모순성(Inconsistency)

하나의 트랜잭션이 여러 데이터 변경 연산 실행할 때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산해서 모순된 결과가 발생하는 것

 

연쇄복귀(cascading rolback)

트랜잭션 완료 전 장애 발생으로 rollback 연산 수행하면,  장애 발생 전 이 트랜잭션이 변경한 데이터를 가져가서 변경 연산을 실행한 다른 트랜잭션에도 rollback연산을 연쇄적으로 실행해야 한다는 것

 

트랜잭션 스케줄

트랜잭션에 포함되어 있는 연산 수행 순서

직렬 스케줄 (serial schedule)

인터리빙 방식 이용하지 않고 각 트랜잭션별로 연산을 순차적으로 실행시키는 것

항상 모순 없는 정확한 결과

각 트랜잭션을 독립적으로 수행하므로 병행 수행 아님

 

비직렬 스케쥴(nonserial schedule)

인터리빙 방식을 이용해 트랜잭션을 병행 수행

하나의 트랜잭션 완료 전 다른 트랜직션 연산 실행 가능 >> 갱신 분실, 모순성, 연쇄 복귀 등의 문제 발생 가능

 

직렬 가능 스케줄(serializable schedule)

직렬 스케줄처럼 정확한 결과를 생성하는 비직렬 스케줄

비직렬 스케줄 중 수행결과가 동일한 직렬 스케줄이 있는 것

인터리빙 방식으로 병행 수행하면서도 정확한 결과 얻을 수 잇음

일반적으로 직렬 가능성 보장하는 병행 제어 기법 사용

 

병행 제어 기법

  • 병행 수행하면서도 직렬 가능성을 보장하기 위한 기법
  • 모든 트랜잭션에 대해 직렬가능성이 보장되는 규약을 정의하고 트랜잭션들이 이 규약을 따르도록 함
  • 대표 예시: 로킹 기법

 

로킹기법

  • 한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 끝낼 때까지 다른 트랜잭션이 그 데이터에 접근할 수 없도록 상호배제함.
  • 동일 데이터 동시 접근을 막기 위해 lock, unlock연산 이용
  • lcok: 트랜잭션이 데이터에 대한 독점권 요청하는 연산
  • unlock: 트랜잭션이 데이터에 대한 독점권 반환
  • 로킹의 단위: lock연산 실행하는 대상 데이터의 크기. 전체 db부터 릴레이션, 투플, 속성 등 다양
  • 로킹 단위 클수록 병행성은 낮지만 제어 쉬움
  • 로킹 단위 작을수록 병행성은 높지만 제어 어려움
  • 기본 로킹 규약의 호율성 높이기: 트랜잭션들이 같은 데이터에 동시에 read 연산 실행 허용
  •  공용 lock 연산 동시 실행 가능 but 다른 트랜잭션이 전용 lock연산을 실행한 데이터에는 공용 전용 둘다 실행 불가

 

2단계 로킹 규약

기본 로킹 규약의 문제 해결하고 트랜잭션 직력 가능성 보장

lock과 unlock의 수행 시점에 대한 새 규약 추가

 

교착 상태(dead lock)

두 트랜잭션들이 서로 상대가 독점하고 있는 데이터를 대상으로 unlock 연산이 샐행되는 상태를 기다리며 트랜잭션 수행을 중단하고 있는 상태

'학교수업 > 데이터베이스' 카테고리의 다른 글

[데이터베이스] 11. 보안과 권한 관리  (0) 2022.06.14
[데이터베이스] 9. 정규화  (0) 2022.06.14
[데이터베이스] 7.4 뷰(View)  (0) 2022.06.14
SQL  (0) 2022.04.21
6장. 관계 데이터 연산  (0) 2022.04.21