Troubleshooting
การตรวจสอบสถานะของ Container
$ sudo docker ps
สำหรับดูสถานะการใช้งานของ Docker Container ว่ามี container ไหนกำลังทำงานอยู่
การตรวจสอบสถานะของ Server
$ sudo htop
สำหรับดูสถานะการทำงานของ CPU และ RAM ของ Server ว่า CPU และ RAM มีการใช้งานเท่าไหร่
การดูสถานะการใช้งานของ GPU
$ sudo nvidia-smi
สำหรับการทำงาน GPU และ RAM ของ GPU ที่กำลังใช้งาน
การ Restart container
$ sudo docker restart [container name]
เพื่อการ Restart Container
Warnings
ไม่ควรลบ Container เนื่องจากจะทำให้ License เดิมที่ติดตั้งอยู่ไม่สามารถใช้งานได้และจำเป็นต้อง Activate License ใหม่อีกครั้ง
Version ของ CUDA ควรเป็น Version 11 เนื่องจาก Version ที่ใหม่กว่าจะเกิดปัญหา Backward Compatibility
ควรทำการ Restart Container ทุกๆ 7 วัน
ถ้าหากมีการ Deploy Application ที่ใช้งาน GPU อื่นๆเพิ่มขึ้นมาภายในภายหลังจะเกิดปัญหาการจัดสรร Memory ของ GPU ได้
ควรปิดการ Update ของ OS เพื่อป้องการ Update แล้วจะทำให้การทำงานของ Container ผิดพลาด
Last updated