InfiniBand Data Center Switch
Twin-Port OSFP Remote Direct Memory Access (RDMA)
NVIDIA Network (InfiniBand / Spectrum-X)
NVIDIA Network เป็นระบบเครือข่ายที่ออกแบบมาสำหรับงาน AI โดยเฉพาะ ไม่ใช่แค่เร็ว (400G / 800G) แต่มีคุณสมบัติพิเศษ เช่น Latency ต่ำมาก การส่งข้อมูลแบบ RDMA และระบบควบคุมการจราจรข้อมูลที่เหมาะกับ AI โดยผู้ผลิตนั้นเป็นตำนานผู้นำวงการ Traffic มาอย่างยาวนานซึ่งก็คอ Mellanox แต่หน่วยประมวลผลจัดเต็มใช้เป็น x86 Coffee Lake i3 มาให้เลยทีเดียว
ต่างจาก L3 Switch ทั่วไปยังไง L3 Switch เหมาะกับงาน Network ทั่วไป เช่น Office หรือ Data Center ปกติ แต่ไม่เหมาะกับ AI Training ขนาดใหญ่ เพราะมี Latency สูงกว่า ไม่มี RDMA และไม่รองรับการสื่อสารแบบ GPU-to-GPU อย่างมีประสิทธิภาพ

MQM9700-NS2F, NVIDIA® 64-Port NDR 400G InfiniBand Data Center Switch, 32 OSFP Ports, Managed, x86 Dual Core, NVIDIA Quantum™-2 Chip, P2C Airflow
32 OSFP Ports, Can Use Breakout for 64× 400GbE or 128× 200GbE
25.6 Tb/s Aggregate Switch Throughput, More Than 66.5 Billion Packets per Second
1+1 Hot-swappable Power Supplies, 6+1 Hot-swappable Fans
Support SHARPV3, Adaptive Routing, Congestion Control and QoS, Self-healing Networking
Support Fat Tree, SlimFly, Dragonfly+, Multi-dimensional and Other Network Topologies
Support CLI, WebUI, SNMP, JSON Interface, for Flexible Operation
MQM9790-NS2F, 64 x NDR 400G, 32 x 800G OSFP Ports, 800G InfiniBand DataCenter Switch
32 OSFP Ports, Can Use Breakout for 64× 400GbE or 128× 200GbE
25.6 Tb/s Aggregate Switch Throughput, More Than 66.5 Billion Packets per Second
1+1 Hot-swappable Power Supplies, 6+1 Hot-swappable Fans
Support SHARPV3, Adaptive Routing, Congestion Control and QoS, Self-healing Networking
Support Fat Tree, SlimFly, Dragonfly+, Multi-dimensional and Other Network Topologies
Support UFM® Platform for Flexible Operation
เปรียบเทียบ
L3 Switch = ถนนดี ๆ ทั่วไป
NVIDIA Network = ระบบขนส่งที่ออกแบบมาเฉพาะทางสำหรับธุรกิจของ AI ที่ต้อง Sync กันตลอดเวลา
ตัวอย่างการใช้งานจริง
Smart City: วิเคราะห์ภาพจากกล้องจำนวนมาก
Factory: ตรวจสอบคุณภาพสินค้าอัตโนมัติ
University: มหาวิทยาลัย สำหรับวิจัยโมเลกุล
Healthcare: วิเคราะห์ภาพทางการแพทย์
AI Chat Training: ฝึกฝนระบบผู้ช่วยอัจฉริยะ
ทำไมต้อง Training AI
AI ไม่ได้ฉลาดมาเองตั้งแต่แรก แต่เริ่มจากการไม่รู้อะไรเลย การ Training จะทำให้มันเข้าใจข้อมูลและสามารถใช้งานจริงได้ เช่น แยกแยะวัตถุ ตรวจจับเหตุการณ์ หรือวิเคราะห์พฤติกรรม
ทำไม Training ต้องใช้ Network แรง
ในระบบ AI ขนาดใหญ่ GPU หลายตัวต้องทำงานร่วมกัน และมีการแลกเปลี่ยนข้อมูลกันตลอดเวลา หาก Network ช้า จะทำให้การ Train ช้าลงอย่างมาก
จำเป็นต้อง Train เองหรือไม่
ส่วนใหญ่ไม่จำเป็น เพราะมี AI ที่ถูก Train มาแล้ว (Pre-trained Model) ให้ใช้งาน แต่ในกรณีที่ต้องการความแม่นยำเฉพาะทาง เช่น โรงงาน มหาวิทยาลัย สมาร์ทซิตี้ ระบบวิจัยโมเลกุล บางรูปแบบ อาจต้องเทรนเพิ่ม หรือ ปรับแต่งให้เหมาะสมกับบริษัทที่ต้องการใช้ AI ให้เกิดประโยชน์ หรือ เปิด Services ให้บริการ AI Access มาทาง Data Center ได้อีกด้วย
“เราพร้อมคิดค้น Solutions IT Infrastructure ที่ดี มีประสิทธิภาพสูงให้กับคุณ”
CEO, Founder


