ralmSys.com - Disk pada sebuah server adalah komponen vital untuk menunjang operasional server dalam memenuhi kebutuhan bisnis sebuah perusahaan. Permasalahan pada disk harus cepat dicegah dan ditangani dengan baik untuk menghindari kegagalan sistem IT perusahaan.
Dari berbagai masalah pada disk server yang ada, msalah disk pre-failure adalah salah satunya. Pada kasus di artikel ini, indikasi disk mengalami pre-failure setelah mendapatkan informasi dari tim OS dimana terdapat log ataupun alert yang menampilkan disk pada salah satu server mengalamai disk failure.
Setelah mendapatkan informasi tersebut, kita melakukan pengecekan di sistem ISM (Software Infrastructure Manager) dan iRMC (Integrated Remote Management Controller). Hasil dari pengecekan melalui ISM dan iRMC tidak ditemukan alert error pada server. Pada kondisi ini, kita menebak bahwa masalahnya bukan Disk Failure, namun Disk Pre-Failure karena dari sistem ISM dan iRMC tidak ditemukan alert disk failure.
Untuk penjelasan Disk Pre-Failure sendiri akan dijelaskan pada artikel lainnya. FYI, dalam troubleshoot ini kita menggunakan tools StorCLI (Storage Command Line Interface) dimana merupakan alat manajemen berbasis perintah (command line) untuk mengelola dan memelihara RAID control berbagai vendor server yang memiliki fungsi utama memantau, mengkonfigurasi, dan memecahkan masalah pada perangkat penyimpanan.
Berikut langkah - langkah troubleshoot indikasi disk pre-failure pada server Fujitsu PRIMERGY RX2540 M5 yang saya lakukan.
Troubleshoot Disk Pre-Failure Fujitsu PRIMERGY RX2540 M5
1. Masuk ke OS server melalui SSH, disini OS yang digunakan adalah Ubuntu Server dan menggunakan SSH Client PuTTY.
2. Masuk mode root.
3. Cek Bad Block dengan command berikut
/opt/MegaRAID/storcli/storcli64 ldinfo -Lall -aall
4. Dari info bad block, akan ada info bad block "yes" pada VD tertentu. Pada contoh ini, nilai bad block terdapat pada VD 11.
5. Selanjutnya untuk memastikan bahwa disk yang mengalami pre-failure cocok dari sisi OS, kita gunakan command berikut ini.
lscsci -g
6. Output dari command diatas adalah sebagai berikut.
7. Telihat jika disk yang mengalami pre-failure (VD 11) pada /dev/sdl. Setelah kita memastikan/konfirmasi ke tim OS, benar terdapat log error yang mengindikasikan disk mengalami Pre-Failure. Perhatikan screenshoot berikut ini.
8. Untuk tambahan analisa troubleshoot terkait disk pre-failure, kita juga bisa mengecek error count pada disk yang terindikasi pre-failure. Jalankan command berikut dimana x merupakan posisi slot nya. Berdasarkan informasi sebelumnya, disk yang mengalami indikasi pre-failure adalah slot 10 (s10).
/opt/MegaRAID/storcli/storcli64 /c0 /e65 /s<x> show all
9. Output dari command diatas adalah sebagai berikut.
10. Terlihat terdapat nilai media error count dan other error count yang mengindikasikan disk mengalami pre-failure.
Demikian troubleshoot indikasi disk pre-failure pada server Fujitsu PRIMERGY RX2540 M5 yang bisa dibagikan. Jika ada pertanyaan atau tambahan lainnya bisa kalian tulis di komentar. Terimakasih.
