어느 날이었습니다. Nextcloud의 데이터 백업용으로 연결되어 있는 하드 디스크를 만져봤는데, 화들짝 놀랄 정도로 뜨거운 열기가 느껴졌습니다. 마치 삼격살 구워 먹고 난 후 덜 식은 프라이팬을 만지는 느낌 같았달까요. 문득, 자성은 열에 취약하다는 얘기가 떠올랐고, 이대로 두다간 중요한 정보가 홀랑 날아갈 수도 있겠다는 불안감이 엄습했습니다.

저는 Proxmox 서버에 HDD를 3개를 외장으로 연결하고, Debian 리눅스에 Nextcloud를 깔아서 사용 중에 있습니다. 그리고 3개의 HDD 중 2개는 RAID로 묶어서 현행 데이터용으로 사용하고 나머지 하나는 백업용으로 사용합니다. 위 사진에서 지옥불처럼 뜨겁게 보이는 하나가 바로 백업용 디스크입니다.
원래부터 좀 뜨겁다 싶어서 케이스 뚜껑을 벗겨놓고 사용을 하는데도, 상부는 45도이고, 사진상 가장 뜨거운 부분은 50도가 넘어가고 있습니다. 어디선가 들었던 거 같은데 HDD의 적정 온도는 30~50℃라고 하던데, 표면온도가 50도가 넘어가면 내부는 위험온도가 아닐까 걱정이 됩니다.
얼른 Proxmox페이지 열어서 HDD SMART데이터 확인을 해 봤습니다. 그런데, 잉?


서버가 SMART데이터를 가져오지 못하고 있습니다. 현행 데이터를 보관하고 있는 디스크 쪽은 위의 오른쪽 사진처럼 데이터가 정상적으로 들어오고 있고 온도도 40도 초반으로 괜찮은 거 같은데, 백업 디스크가 문제였습니다.
도대체 왜 이런 현상이 발생하는지, 그리고 이 뜨거운 디스크 온도를 파악하고 관리할 방법은 없을지를 스터디한 내용을 공유하겠습니다.
"Unknown Bridge" 오류
SMART 정보를 왜 못 읽지?
Proxmox에서 디스크의 SMART 데이터를 표시하지 못하는 데는 다음과 같은 이유가 있을 수 있다고 합니다.
- Proxmox의 인식 방식: Proxmox는 백그라운드의 smartd라는 데몬으로부터 디스크 정보를 받아오는데요. 만약 데몬이 디스크가 연결된 USB Bridge를 인식하지 못했다면 데이터를 받아올 수 없기 때문에 이런 문제가 생길 수 있습니다.
- 그리고 데이터는 잘 읽어 왔더라도 Proxmox가 읽어 올 수 있는 데이터가 누락되었거나 했을 때도 이런 문제가 생길 수 있다고 하네요.
- 마지막으로, 이건 생각하고 싶지 않지만, USB Bridge 칩셋이 지원을 하지 않는 원초적인 문제가 있을 수도 있겠죠. 인터넷을 찾아보면 특정 칩셋을 사용하는 외장하드 케이스에서 SMART 지원이 잘 되지 않는다는 글도 보입니다.
smartd 데몬의 상태 확인
먼저 "smartctl --scan"이라는 명령어로 데몬이 디스크를 잘 인식하고 있는지를 먼저 확인해 보겠습니다. 이 명령어는 시스템에 연결된 모든 디스크를 스캔해서 어떤 방식으로 인식이 되는지 알려준다고 합니다.

현재 SMART값을 못 읽고 있는 디스크는 "/dev/sdd"입니다. 그런데 smartctl --scan결과에서는 sdd 디스크는 인식이 되지 않습니다. 그렇다면 smartctl -i 명령으로 직접 해당 디스크릴 지정해서 정보를 확인해 봅니다.

결과는 위에 보시는 것처럼 USB Bridge를 정상적으로 인식하지 못하고 있습니다. 원래 정상적으로 장치가 인식이 되었다면 다음과 같은 결과를 볼 수 있다고 합니다.
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/sdb -d sat # /dev/sdb, ATA device, S.M.A.R.T. capable
/dev/sdc -d usbjmicron # /dev/sdc, JMicron USB bridge
이렇게 브리지의 칩셋을 정상적으로 인식하지 못한 경우 위 캡처에서도 나와 있지만 "-d"옵션을 사용해서 브리지 타입을 지정해 줄 수 있습니다. 여기서 사용할 수 있는 타입은 usbjmicron, usbsunplus, sntjmicron 등등이 있는데요. 대부분의 외장하드는 USB-SATA 브리지 칩셋이란 것으로 연결이 되기 때문에 "sat(SATA ATA Translation)"가 가장 보편적으로 사용된다고 합니다. sat를 지정해서 다시 확인해 봅니다.
짜란~, 다행히 하드디스크의 SMART 데이터를 사용할 수 있다고 표시되고 있네요.

그리고 나중에 알게 된 팁인데 "lsusb" 명령으로 브리지 칩셋 정보를 확인할 수 있는데요. 제 경우 "ASM1153E"라는 정보를 확인할 수 있었고 이 경우는 "sat" 타입설정으로 잘 동작한다고 알려져 있었습니다.

smartd 데몬 설정 실패기
필요한 정보가 제공이 되고 있다는 걸 확인했으니 데몬에서 이 정보를 정상적으로 읽어 오도록 해주기만 하면 될 것 같은데요. 결론적으로는 실패였고, 제가 시도했던 방법은 다음과 같습니다.
일단 "sat"라는 타입으로 SMART정보를 정상적으로 일어 올 수 있다는 걸 확인했으니 smartd 데몬 설정파일에 해당 사항을 추가해 보기로 했습니다. nano 편집기로 smartd.conf파일을 열어줍니다.
nano /etc/smartd.conf
그리고 아래 내용을 추가합니다.
/dev/sdd -d sat -a -o on
제 경우는 파일 안에 활성화된 줄이 한 줄 있었는데 그 바로 밑에 추가를 했습니다.

그리고 "systemctl restart smartd" 명령으로 데몬을 재시작시켜주었습니다. 하지만 이렇게 해도 데몬 설정이 변경되지 않았고 SMART 데이터도 올라오지 않았습니다.
일단 오늘은 디스크 정보를 확인할 수 있는데 만족하고 나중에 Proxmox까지 데이터를 끌어오는 방법을 찾아봐야겠습니다.
외장하드 온도 확인하기
아쉽게도 아직은 Proxmox GUI 환경에서 디스크 온도를 확인할 수 없지만, smartctl명령을 이용하면 CLI. 환경에서 온도를 확인할 수 있습니다. 일단 다음 명령으로 SMART 정보를 모두 확인할 수 있고요. "temp"라는 키워드로 필터링하면 온도와 관계된 정보만 확인할 수 있습니다.
# SMART 정보 모두 확인
smartctl -a -d sat /dev/sdd
# 온도와 관계된 정보만 확인
smartctl -a -d sat /dev/sdd | grep -i "temp"
이렇게 온도를 확인해 보니... 앗! 56℃가 나왔습니다. 최대 온도는 58도까지 찍었네요.

마무리
앞서 언급했었지만, 56도라는 온도는 하드디스크에게는 쾌적한 온도는 아닙니다. 물론 아주 위험한 수준이라고는 할 수 없지만 지속적으로 이 온도가 계속된다면 수명에 영향을 줄 수밖에 없겠죠. 그래서 앞으로 계획은 이렇습니다.
- 냉각 설루션 모색: 지금은 하드디스크가 바람이 잘 통하지 않는 선반에 숨어있어서 조건이 좋지 못한 것 같습니다. USB 팬이라도 동원해서 공기 순환방안을 찾아봐야겠습니다.
- 지속적인 모니터링: 일단 SMART정보를 proxmox까지 가져가는 방법을 찾는 게 필요하겠지만 당장은 smartctl 명령을 통해서 주기적으로 심각한 수준으로 뜨거워지지는 않는지 점검을 해야겠습니다.
끝!
'홈서버' 카테고리의 다른 글
| 해킹에 무방비하게 노출된 내 서버, 기본적인 방어는 되어 있는지 확인해 보세요 (7) | 2023.08.27 |
|---|---|
| ESPHome - OSError: [Errno 105] No buffer space available (2) | 2023.04.11 |
| 스마트 플러그 Sonoff S26 R2 - ESPHome 설치 & HA연동 이상무 (0) | 2022.03.21 |
| 라즈베리파이 OS 64bit로 업그레이드하고 Home Assistant 설치하기 (0) | 2022.03.16 |
댓글