บทความนี้จะกำหนดหน่วยความจำ LPDDR ว่ามีความจำเป็นสำหรับการเปิดใช้งานการอนุมาน AI ความเร็วสูงและประหยัดพลังงานโดยตรงบนอุปกรณ์เคลื่อนที่และจุดสิ้นสุดอื่นๆ
Low-Power Double Data Rate (LPDDR) ถือกำเนิดขึ้นในฐานะหน่วยความจำประสิทธิภาพสูงและใช้พลังงานต่ำสำหรับโทรศัพท์มือถือ นับตั้งแต่เปิดตัวครั้งแรกในปี พ.ศ. 2549 LPDDR รุ่นใหม่แต่ละรุ่นได้มอบแบนด์วิดท์และความจุที่จำเป็นสำหรับการเปลี่ยนแปลงครั้งใหญ่ในประสบการณ์ผู้ใช้มือถือ อีกครั้งหนึ่งที่ LPDDR เป็นผู้นำในการเปลี่ยนแปลงครั้งสำคัญอีกครั้ง เนื่องจากแอปพลิเคชัน AI เชิงสร้างสรรค์รุ่นต่อไปจะถูกรวมไว้ในโทรศัพท์มือถือและแล็ปท็อปของเรา
AI บนจุดสิ้นสุด (endpoints) คือการอนุมานที่มีประสิทธิภาพ กระบวนการนำโมเดล AI ที่ผ่านการฝึกอบรมมาใช้ในการคาดการณ์หรือการตัดสินใจนั้น จำเป็นต้องใช้เทคโนโลยีหน่วยความจำเฉพาะทางที่มีประสิทธิภาพสูงกว่า ซึ่งปรับให้เหมาะกับความต้องการเฉพาะของอุปกรณ์จุดสิ้นสุด หน่วยความจำสำหรับการอนุมาน AI บนจุดสิ้นสุดจำเป็นต้องสร้างสมดุลที่เหมาะสมระหว่างแบนด์วิดท์ ความจุ พลังงาน และความกะทัดรัดของฟอร์มแฟกเตอร์
LPDDR พัฒนามาจากเทคโนโลยีหน่วยความจำ DDR เพื่อเป็นทางเลือกที่ประหยัดพลังงาน LPDDR5 และ LPDDR5X ซึ่งเป็นส่วนขยายเสริม ถือเป็นการอัปเดตล่าสุดของมาตรฐาน LPDDR5X มุ่งเน้นไปที่การปรับปรุงประสิทธิภาพ พลังงาน และความยืดหยุ่น ให้อัตราข้อมูลสูงสุดถึง 8.533 Gbps ซึ่งเพิ่มความเร็วและประสิทธิภาพได้อย่างมาก เมื่อเทียบกับหน่วยความจำ DDR5 แล้ว LPDDR5/5X จำกัดความกว้างของบัสข้อมูลไว้ที่ 32 บิต พร้อมกับเพิ่มอัตราข้อมูล การเปลี่ยนมาใช้สัญญาณนาฬิกาความเร็วหนึ่งในสี่ เมื่อเทียบกับสัญญาณนาฬิกาความเร็วครึ่งหนึ่งใน LPDDR4 พร้อมด้วยฟีเจอร์ใหม่ Dynamic Voltage Frequency Scaling ช่วยให้การทำงานของ LPDDR5 ที่มีอัตราข้อมูลสูงกว่าอยู่ในเกณฑ์ความร้อนเดียวกันกับอุปกรณ์ที่ใช้ LPDDR4
เมื่อพิจารณาถึงพื้นที่ของโทรศัพท์มือถือ ประกอบกับความต้องการหน่วยความจำที่สูงขึ้นสำหรับการใช้งานขั้นสูง LPDDR5X สามารถรองรับความจุได้สูงสุด 64GB โดยใช้ DRAM หลายไดในแพ็กเกจแบบหลายได ลองพิจารณาตัวอย่างของโมเดล LLaMa 2 ขนาด 7B ซึ่งโมเดลนี้ใช้ความจุหน่วยความจำ 3.5GB หากใช้ INT4 แพ็กเกจ LPDDR5X ขนาด x64 ซึ่งมีอุปกรณ์ LPDDR5X สองเครื่องต่อแพ็กเกจ ให้แบนด์วิดท์รวม 68GB/s ดังนั้นโมเดล LLaMa 2 จึงสามารถรันการอนุมานได้ 19 โทเค็นต่อวินาที
เนื่องจากความต้องการหน่วยความจำประสิทธิภาพสูงขึ้น เราจึงเห็น LPDDR5 พัฒนาในตลาด โดยผู้ผลิตรายใหญ่ประกาศขยาย LPDDR5 เพิ่มเติมในชื่อ LPDDR5T โดย T ย่อมาจาก Turbo LPDDR5T เพิ่มประสิทธิภาพเป็น 9.6 Gbps ทำให้มีแบนด์วิดท์รวม 76.8 GB/s ในแพ็กเกจ x64 ที่มี LPDDR5T หลายชุด ดังนั้น ตัวอย่างข้างต้นของโมเดล LLaMa 2 ขนาด 7B จึงสามารถรันการอนุมานได้ 21 โทเค็นต่อวินาที
ด้วยการใช้พลังงานต่ำและความสามารถแบนด์วิดท์สูง LPDDR5 จึงเป็นตัวเลือกหน่วยความจำที่ยอดเยี่ยมไม่เพียงแต่สำหรับอุปกรณ์พกพาที่ล้ำสมัยเท่านั้น แต่ยังเหมาะสำหรับการอนุมาน AI บนจุดสิ้นสุดที่ประสิทธิภาพการใช้พลังงานและรูปแบบกะทัดรัดเป็นปัจจัยสำคัญที่ต้องพิจารณาอีกด้วย