본문 바로가기

KNOWLEDGE BASE

Error Detection and Correction(SBE, MBE)


Error Detection and Correction

- 메모리 오류 검출 및 수정

 

메모리 사용 중 데이터는 전송 중에 변경될 수 있습니다. 신뢰성 있는 통신을 위해 오류들은 검출 및 정정되어야 합니다.

메모리 오류는 다음과 같이 크게 두 가지의 종류가 있습니다

 

 - Single-Bit Error (SBE)

 - Multi-Bit Error (MBE or Burst Error)


#Single-Bit Error

 

SBE는 문자 그대로 단일 비트 오류를 뜻하며 전송되는 8비트의 데이터의 한 비트만 변경이 되는 것을 말합니다. 대부분의 SBE는 메모리 내에 있는 ECC(Error Correction Code): 에러 검출 코드를 통하여 검출 및 수정이 됩니다.

SBE가 발생 되었다는 건 이미 에러를 검출하고 수정까지 완료한 상태에 SBE Alert을 보냅니다. ECC로 수정 가능한 SBE가 있고, 수정이 불가능한 SBE도 있습니다. 두 증상 모두 서버의 리부팅은 발생되지 않고, 메모리의 용량까지 정확하게 표기 됩니다

차이점은 수정이 불가능한 SBE 100%정상적인 메모리로 사용은 불가능합니다. 메모리 번지는 표시되지만 Write에있어서 Err가 발생되어 병목현상(Bottleneck)이 발생 될 수 있습니다이로 인하여 ECC로 수정이 되지 않는 메모리는 교체를 해 주어야 합니다.


#Multi-Bits Error

 

MBE도 추가로 설명을 드리자면, 단일 비트 에러가 아닌 두 개 이상의 연속 또는 개별 비트가 변경된 것을 말합니다. 이 경우 서버는 사용 중 ECC로 인한 수정이 불가하여, 서버리부팅이 진행됩니다. MBE가 복구가 되는 경우도 있지만,

MBE가 발생하게 되면 메모리는 교체를 하는 것이 좋습니다