Troubleshooting

การตรวจสอบสถานะของ Container

$ sudo docker ps

สำหรับดูสถานะการใช้งานของ Docker Container ว่ามี container ไหนกำลังทำงานอยู่

การตรวจสอบสถานะของ Server

$ sudo htop

สำหรับดูสถานะการทำงานของ CPU และ RAM ของ Server ว่า CPU และ RAM มีการใช้งานเท่าไหร่

การดูสถานะการใช้งานของ GPU

$ sudo nvidia-smi

สำหรับการทำงาน GPU และ RAM ของ GPU ที่กำลังใช้งาน

การ Restart container

$ sudo docker restart [container name]

เพื่อการ Restart Container

Warnings

  1. ไม่ควรลบ Container เนื่องจากจะทำให้ License เดิมที่ติดตั้งอยู่ไม่สามารถใช้งานได้และจำเป็นต้อง Activate License ใหม่อีกครั้ง

  2. Version ของ CUDA ควรเป็น Version 11 เนื่องจาก Version ที่ใหม่กว่าจะเกิดปัญหา Backward Compatibility

  3. ควรทำการ Restart Container ทุกๆ 7 วัน

  4. ถ้าหากมีการ Deploy Application ที่ใช้งาน GPU อื่นๆเพิ่มขึ้นมาภายในภายหลังจะเกิดปัญหาการจัดสรร Memory ของ GPU ได้

  5. ควรปิดการ Update ของ OS เพื่อป้องการ Update แล้วจะทำให้การทำงานของ Container ผิดพลาด

Last updated