Links

Troubleshooting

การตรวจสอบสถานะของ Container

$ sudo docker ps
สำหรับดูสถานะการใช้งานของ Docker Container ว่ามี container ไหนกำลังทำงานอยู่

การตรวจสอบสถานะของ Server

$ sudo htop
สำหรับดูสถานะการทำงานของ CPU และ RAM ของ Server ว่า CPU และ RAM มีการใช้งานเท่าไหร่

การดูสถานะการใช้งานของ GPU

$ sudo nvidia-smi
สำหรับการทำงาน GPU และ RAM ของ GPU ที่กำลังใช้งาน

การ Restart container

$ sudo docker restart [container name]
เพื่อการ Restart Container
Warnings
  1. 1.
    ไม่ควรลบ Container เนื่องจากจะทำให้ License เดิมที่ติดตั้งอยู่ไม่สามารถใช้งานได้และจำเป็นต้อง Activate License ใหม่อีกครั้ง
  2. 2.
    Version ของ CUDA ควรเป็น Version 11 เนื่องจาก Version ที่ใหม่กว่าจะเกิดปัญหา Backward Compatibility
  3. 3.
    ควรทำการ Restart Container ทุกๆ 7 วัน
  4. 4.
    ถ้าหากมีการ Deploy Application ที่ใช้งาน GPU อื่นๆเพิ่มขึ้นมาภายในภายหลังจะเกิดปัญหาการจัดสรร Memory ของ GPU ได้
  5. 5.
    ควรปิดการ Update ของ OS เพื่อป้องการ Update แล้วจะทำให้การทำงานของ Container ผิดพลาด