반응형

목차

1. BCP와 DRP

2. BCP (Business Continuty Planning)

3. DRP (Disaster Recovery Planning)

 


1. BCP와 DRP

- BCP 프로세스는 범위와 계획의 초기화를 포함

- 사업 영향 평가 (Business Impact Assessment : BIA)

  : 기업에 어느정도 피해가 있을 때에 얼마나 영향이 미치는지에 대해서 평가하고 정량화하는 것

    사업 지속 개발 계획

    많은 문서로 구성되어 있음

- DRP는 다음을 포함

  : 재해 복구 계획 프로세스

   재해 복구 계획 테스트

   정상적 작동 가능 테스트

   항상 최신화

   재해가 일어나지 않았을 때에 미리 확인 필요

   재해 복구 절차

- 재해 (정보 자원의 사용 불능으로 발생하는 비즈니스 중단 사태)

 자연재해 : 정보 처리 시설에 직접적인 피해 (전산실의 위치)

 통신, 전기, 가스등의 기반 서비스 중단

  : 정전 시 발전기를 어떻게 구축할 것인지

 테러, 바이러스 등으로 인한 재해

 생화학 바이러스

 실수 (직원)

 : 직원들의 실수로 인해 벌어지는 상황

// 재해 상황이 BCP를 실행 할 심각한 중단 상황인지 판단하기 위해서 위험 기반의

분류 시스템(risk classification system)이 필요 (BCP, DRP는 사후승인)

- 사업 연속성 계획과 재해 복구 계획은 BIA에 내용을 근거로 상세하게 세워져야함

- 계획의 요소

 재해 이전 준비

 대피 절차

 재해 선언 절차

 재해 선언 상황 판단 기준

 책임 및 책임자

 명확한 계약 정보

 복구 대안의 단계별 설명

 복구 및 지속 운영에 필요한 자원 식별

2. BCP

- BCP의 목적

 조직의 생존을 위해서 핵심적인 기능 및 운영이 예기치 못한 중단으로부터 보호 될 수 있도록 하는 것

- 발생 가능한 여러 종류의 위험

 고객 서비스 중단

 이미지 및 브랜드 손실

 지적, 인적 자산 보호 실패

 비즈니스 통제 상실

 법률적 요구 사항 위반

- BCP의 책임

 고위 경영진 (회사의 생존과 자산보호의 책임을 위임 받음)

- BCP의 구성

 재해 복구 계획 + 사업 운영 연속성 확보 계획

 업무시스템을 복구 할 때 민감도를 따짐

- 중점 고려 사항

 조직의 생존에 가장 필요한 핵심 사업 영역

 핵심 사업 영역을 지원하는 물적, 인적 자원

- 사업 연속성 계획은 위험분석을 기반으로 수행하며 이를 위해서 자산을 고려한 위협 식별작업이 필요함

- 위험은 자산 가치와 인지된 위협이 발생될 비율에 비례

 손실액(SEL) x 발생가능성(ARO) = ALE

- IT 재해 복구 계획 (사업 연속성 계획의 하위 요소, 기술문서)

- 모든 복구 계획의 기준은 비용편익

 절대 비용(cost)가 편익(benefit)을 초과해서는 안 됨

- BCP의 네가지 구성요소

 범위와 계획의 초기화

 사업 영향 평가 (Business Impact Assessment : BIA)

 // BIA의 주요목적 : 핵심 우선순위 결정, 중단시간 산정, 지원 요구사항, 재난 발생 시 사업에 어떤 영향을 줄지 임원진에게 관련정보를 제공하기 위한 문서화가 중요

 사업 지속 개발 계획

 계획 승인과 구현

 // 구현 : 지속 계획을 지속해서 개선해 나가는 것

- BCP 구현및 운영 과정

1) 사업 연속성/재해 복구 정책 수립

2) 사업 영향 분석

3) 사업 연속성 계획과 재해 복구 절차 수립

4) 훈련과 인식 프로그램

5) 계획 테스트및 실행

6) 모니터링

 : 계획을 지속적으로 할 수 있는지 지속해서 감시 및 판단하는 것

// work though : 한 방에 모여서 그 대책에 대해서 한 번 점검하는 것

# 범위와 계획 초기화

 

- BCP 프로세스의 개시

- 역할과 책임을 식별

 최고 경영진 (프로젝트의 개시, 최종승인, 지속적인 지원 책임)

 BCP위원회 (계획 구현, 테스트를 지휘)

 단위 사업 관리자 (핵심 프로세스의 정의와 우선순위 부여)

 // 단위 사업의 이사/각 부서의 부서장들 등

 기능 사업부서 (구현과 테스트에 참여)

 // 그 밑에 있는 주사들이 구현과 테스트에 참여

# 사업 영향 평가 (BIA)

- 세가지 주요 요소

1) 핵심 우선 순위 결정

 모든 핵심적인 단위 프로세스를 식별하고 파괴적 사건에 대한 영향을 평가해야함

2) 중단시간 산정

 핵심 프로세스가 중단된 채로 조직이 회생불능에 빠지기 까지 견딜 수 있는 시간을 산정

 MTD : Maximum Tolerable Downtime (견딜수 있는 시간을 산정한 것)

 일반적인 측정치는 기대치에 비해서 무척 짧음

3) 지원 요구사항

 핵심 프로세스를 복구하는데 필요한 자원요구 사항

- BIA 수행하는 접근 방법

 설문지

 인터뷰

 회의

 시스템 관련 BIA에서는 과거의 트랜잭션 양을 분석하고 결과는 인터뷰단계에서 실증해야함

# 취약성 평가

- 위험 평가 방법

 정량적 : 경제적 측면

 정성적 : 운영 측면

- 정량적 손실 기준

 매출 손실 및 추가 부채에 대한 비용

 사건 복구 비용

 법적인 비용 (계약의 위반, 법률 위반)

 법적 비용이 들어간 것은 예상 비용보다 꽤 크다는 것을 의미

 - 정성적 손실 기준

 시장 점유율 감소

 신뢰나 공신력 감소

 운영적인 측면에서 할 수 있을지 없을지에 대한 평가

// 취약성 평가를 기반으로 한 핵심 지원 영역에 대한 정의가 중요

- 문서화

 BIA의 마지막 단계

 모든 프로세스와 프로시저, 분석 결과의 완전한 문서화가 중요

 적절한 고위 경영진에 대한 권고사항 프리젠테이션

 보고서에는 식별된 핵심 지원영역과 양적인 영향을 종합하고 권고된 복구 우선순위가 포함 되어야함

# 사업 지속 개발 계획

- BIA로부터 도출된 핵심 사업기능을 지원하기 위한 비상계획과 전략을 세움

- 두 가지의 중요한 단계

 지속 전략 계획

  컴퓨팅 계획(전략)

  설비 계획

  인력 계획

  지원과 장비 계획

 지속적인 문서 전략 : 지속 전략 계획의 각각의 결과에 대한 완전한 문서화

- 계획의 전사적 파급을 위한 인지도 향상

 사고 복구는 개개인의 노력에 의존함

 양질의 훈련과 교육

- 계획의 유지 보수

 최신의 버전이 유지되도록 업데이트를 수행해야함

 컴퓨팅 환경의 변화등이 원인

 

- BCP 구성 문서

 사업 복구 계획

 운영 계획 연속성

 IT 비상 계획 지원의 연속성

 위급 상황 시 통신 계획

 사고 대응 계획

 재해 복구 계획

 거주자 비상계획

- 시스템, 사용자, 네트워크 복구 전략 등을 공급하기 위한 절차

- 계획 사본 저장

 핵심 의사 결정자의 사택

 복구 시설이나 저장 시설(오프 사이트)

3. DRP

- 매우 파괴적인 사건 발생시 조직이 재해를 복구하기 위한 전략적인 방법을 제공함으로써 혼란을 줄이고

위기상황에 대처하는 조직의 능력을 향상시킴

- DRP의 구성과 목적

 컴퓨터 및 네트워크 시스템 장애로 부터 조직을 보호

 업무 서비스 제공 지연으로인한 위험의 최소화

 재해 중 직원들의 안전한 행동 요령과 의사결정의 최소화

 테스트를 통한 대기 시스템의 안정성 보장

- DRP영역

 재해 복구 계획 프로세스 (재해 복구 계획 프로시저)

 재해 복구 계획 테스트

 재해 복구 프로시저

- MTBF (Mean Time between Failure) : 장애 사이 기간 (길수록)

: 어떤 장애가 발생한 후 처리된 다음 똑같은 장애가 다시 발생할 때까지 걸리는 시간

- MTTR (Mean time to Repair) : 장애 교정 시간(짧을수록)

: 장애가 발생하고 이 장애가 복구되는 시간

- 합리적인 비용으로 수용 가능한 복구 시간대를 제공 할 수 있는 복구 전략이 필요

- 복원력

 대체 경로나 여분의 시스템을 이용 위협에 대처하는 능력

 복원력에 의해 복구 되지 않아 손실되거나 피해를 입은 시스템에 대한 대책은 재해 복구 절차에서 고려

- 잔존 위험

 복구 전략이 선택된 이후 남아있는 위험

 교정 통제 이후의 위험

 보험 등의 방법으로 통제

// 가장 적절한 복구 전략은 BIA에서 식별된 상대적 위험도를 바탕으로 선택 되어짐

# 복구 목표 시점(RPO)과 복구 목표 시간(RTO)

- RPO (Recovery Point Objective)

 장애 발생시 복구 시점(현재로 부터 과거 시점, 짧을 수록 비용이 많이 듬)

 RPO가 매우 짧다는 의미는 손실 데이터의 양이 작다는 것을 뜻함

 가장 이상적인 경우 : 재해시점 = RPO시점 : 데이터 손실이 없음

 미러링, 듀플렉싱 < 백업 < 릴 백업 (클수록 운영 비용이 적음)

- RTO(Recovery Time Objective)

 복구 가능 최단 시간(허용 시간)

 적을 수록 복구 비용이 많이 듬

- 이외 복구 파라미터

 중단 기간 : 시스템 중단부터 복구까지 수용 가능한 시간 (초과 시 손실비용 급격히 증가)

 서비스 공급 목표 : 대체 프로세스의 목표 서비스 수준

 최대 허용 범위 : 대체 프로세스가 지원 가능한 최대 시간

 

# 재해 복구 계획 프로세스

- 재해 복구 계획의 단계

 데이터 처리 지속 계획 (Data Processing Continuity Planning)

  : 재해를 예측하고 대처하기 위한 계획 수립

- 데이터 복구 계획 유지 보수 (Data Recovery Plan Maintenance)

  : 계획이 항상 최신의 버전이도록 유지하기 위한 계획

# 데이터 처리 지속 계획

 - 상호 지원 계약

  가장 적은 비용

  호환성의 문제

  동시 재해 시 복구 불능

  복구에 다른 대안이 없는 경우에만 고려하는 것이 좋음

- 가입 서비스

 핫사이트(Hot site) : 고가, 동일한 보안 이슈, 자원 집약적, 최신의 데이터나 응용을 유지

 웜사이트(Warm site) : 경제적, 위치 선정이 유연, 관리자원 낭비가 적음

 쿨사이트(Cold site) : 가장 저렴한 구성, 재해복구 성공에 확신이 어려움

​ // 경제적 측면과 자원낭비 측면을 고려해 가장적당한것을 골라 사용함

- 다중센터

 : 여러 운영 센터로 처리를 나누어 운영

- 서비스업체

 DRP에 대한 외주

 대규모 재해시에 자원에 대한 경합 (SLA를 통해서 어느정도 해소 가능)

- 기타 백업 대안

 이중정보처리시설

 모바일사이트 : Sun(블랙박스), IBM(PMDC)

- 트랜잭션 중복 구현

 : 전자볼팅(Electronic Vaulting) : 대체 사이트로 트랜잭션을 덤프하는 배치 프로세스, 원격저널링(Remote Journaling)

// 원격저널링(Remote Journaling) : 로그정보를 원격에 저장하는 것,

백업된 로그정보는 장애 시 트랜잭션 복구에 이용

   데이터베이스 쉐도우잉(Database Shadowing) : 다중 DB서버 운영으로 완전 이중화 , Mysql 에서 많이사용됨

// 특정 디비를 백업으로 사용함

- 재해복구 계획의 유지 보수

 최신의 버전이 유지되도록 업데이트를 수행해야함

 컴퓨팅 환경의 변화 등이 원인

 재해 복구 계획은 조직의 실재적인 복구 능력이므로 주기적으로 테스트되어야함

# 재해 복구 계획 테스트

- 이유

 복구 프로세스의 정확성을 검증하고 결함을 식별

 직원 훈련

 백업 사이트의 처리 역량을 검증

# 복구 테스트 유형

- 체크리스트(Checklist)

  : 계획이 조직의 모든 영역에 해당되는지 확인 및 검토하는것

    실질적으로 관리자가 문서로 확인하는 작업 수행

- 구조적 점검(Structured walk-through)

  : 사업 단위 관리자들이 계획이 복구능력을 제공하는지 검토하고 확인하는것

    실제 담당자들이 다 모여서 실질적으로 묻고 따지는 것

- 시뮬레이션(Simulation)

 : 재해에 대한 직원의 능력을 테스트

  실재 복구 프로세스나 대체 응용을 기동하지는 않음

  블라인드 시뮬레이션 : 난데없이 재해가 났다고 하고 실제로 시뮬레이션하는 것

  시뮬레이션 : 실제로 알고하는 것

  운영프로그램을 돌리기 전 단계까지 해야함

  백업사이트

- 병렬 테스트(Parallel)

  : 가장 많이 수행되는 재해 복구 테스트

    핵심적인 기능이 대체 복구 사이트에서 수행되는지 확인

    트랜잭션 결과를 비교함으로써 정확성과 안정성을 확인

    데이터를 넣어서 실제와 비교하는 것

    사이트의 일부를 빌려서 결과값을 비교

- 전체 시스템 중단 테스트(Full-interruption)

 : 극히 드물지만 절대적으로 최선의 테스트

   실제 재해 상황처럼 조직의 기능을 중단시키고 복구 계획을 실행

   기업에서는 하지 않음 (민방위훈련)

# 재해 복구 프로시저

- 재해복구 프로시저의 요소

 복구팀

 구조팀

 정상 운영 재개

 기타 복구 이슈

 

- 복구팀(Recovery Team)

 백업 사이트에서 핵심적인 기능의 운영을 담당

- 구조팀(Salvage Team)

 재해를 입은 주사이트의 원래 기능을 복원하기 위한 팀

 재해 사이트의 장비 및 시설에 대한 관리와 확인을 담당

 정상운영 복귀를 결정하는 권한을 가짐

- 정상운영 재개

 회복팀에 의해서 구현

 복구단계와는 달리 가장 덜 민감하고 덜 중요한 기능부터 주사이트로 이전

 재해상황의 종료는 모든 기능이 원래 사이트로 환원되고 데이터가 정확하다고 증명된 이후 공식적으로 종료

 //  원래 사이트로 돌아가는 프로시저에는 매우 다양하고 심각한 취약성들이 존재함

- 기타 복구 이슈

 외부 그룹과 인터페이스

  : 관공서와의 물리적 논리적 거리 (경찰서, 소방서, 시청)

  : 보도 기관, 주주, 고객과의 의사 소통

 직원

  : 조직은 직원의 안전에 고유의 책임을 짐 (신체상, 경제적)

 사기와 범죄행위

  : DRP는 재해시 계획적 또는 우발적으로 발생하는 약탈, 도난 등의 대해서 고려해야함

 재정적 부담

 : DRP 운영의 제정적인 문제

 : 사고 처리 도중 발생된 제정적인 부담은 예상이나 이를 집행하는 비상관리자의 권한을 초과할 가능성에

대해서 언급되어야함

 보도 기관과의 관계

 대변인 같은 공식적인 대외 채널이 필요

 : 심각한 상황에서 미리 준비된 성명서 같은 대처가 필요

   사고의 원인에 대해서 추측하지 않음

   책임을 추측하지 않음

   시스템이나 프로세스를 비난하지 않음

   조사가 시작되고 결과가 발표될 것임을 포함

   조직 내 누구도 성명을 발표해서는 안됨

 

반응형

'2020 > 학원' 카테고리의 다른 글

정보보안 거버넌스(6)  (0) 2020.02.27
정보보안 거버넌스(5)  (0) 2020.02.27
정보보안 거버넌스(4)  (0) 2020.02.27
정보보안 거버넌스(3)  (0) 2020.02.27
정보보안 거버넌스(2)  (0) 2020.02.26

+ Recent posts