Error Detection and Correction
- 메모리 오류 검출 및 수정
메모리 사용 중 데이터는 전송 중에 변경될 수 있습니다. 신뢰성 있는 통신을 위해 오류들은 검출 및 정정되어야 합니다.
메모리 오류는 다음과 같이 크게 두 가지의 종류가 있습니다.
- Single-Bit Error (SBE)
- Multi-Bit Error (MBE or Burst Error)
#Single-Bit Error
SBE는 문자 그대로 단일 비트 오류를 뜻하며 전송되는 8비트의 데이터의 한 비트만 변경이 되는 것을 말합니다. 대부분의 SBE는 메모리 내에 있는 ECC(Error Correction Code): 에러 검출 코드를 통하여 검출 및 수정이 됩니다.
SBE가 발생 되었다는 건 이미 에러를 검출하고 수정까지 완료한 상태에 SBE Alert을 보냅니다. ECC로 수정 가능한 SBE가 있고, 수정이 불가능한 SBE도 있습니다. 두 증상 모두 서버의 리부팅은 발생되지 않고, 메모리의 용량까지 정확하게 표기 됩니다.
차이점은 수정이 불가능한 SBE는 100%정상적인 메모리로 사용은 불가능합니다. 메모리 번지는 표시되지만 Write에있어서 Err가 발생되어 병목현상(Bottleneck)이 발생 될 수 있습니다. 이로 인하여 ECC로 수정이 되지 않는 메모리는 교체를 해 주어야 합니다.
#Multi-Bits Error
MBE도 추가로 설명을 드리자면, 단일 비트 에러가 아닌 두 개 이상의 연속 또는 개별 비트가 변경된 것을 말합니다. 이 경우 서버는 사용 중 ECC로 인한 수정이 불가하여, 서버리부팅이 진행됩니다. MBE가 복구가 되는 경우도 있지만,
MBE가 발생하게 되면 메모리는 교체를 하는 것이 좋습니다.
'KNOWLEDGE BASE' 카테고리의 다른 글
POC / Pilot / BMT (0) | 2015.06.25 |
---|---|
Queue (큐) (0) | 2015.06.22 |
단일 루트 I/O 가상화 (SR-IOV: Single Root I/O Virtualization) (0) | 2015.06.19 |
I/O가속 기술(I/O Acceleration Technology, I/OAT) (0) | 2015.06.19 |
Dell Server Linux-base OMSA install (0) | 2015.06.19 |