Làn sóng AI không chỉ khiến GPU khan hiếm mà nay còn đẩy nhu cầu DRAM cho CPU tăng vọt.
Sự bùng nổ của trí tuệ nhân tạo đang tạo ra áp lực ngày càng lớn lên ngành công nghiệp bộ nhớ toàn cầu. Nếu trước đây cuộc đua phần cứng AI chủ yếu xoay quanh GPU, thì nay CPU cũng bắt đầu bước vào “cơn khát” DRAM với quy mô chưa từng có.
Theo thông tin được SE Daily dẫn lại từ các nguồn trong ngành, nhiều hãng sản xuất CPU đang xem xét nâng dung lượng bộ nhớ dành cho các bộ xử lý AI lên mức 300 - 400 GB. Đây là bước nhảy rất lớn nếu so với mức 96 - 256 GB DRAM thường thấy trên mỗi chip hiện nay.
Xu hướng này được cho là sẽ tiếp tục đẩy chuỗi cung ứng DRAM vào tình trạng căng thẳng, đặc biệt khi nhu cầu AI vẫn tăng quá nhanh so với năng lực sản xuất thực tế của ngành bán dẫn.

Với tốc độ phát triển nhanh chóng của Trí tuệ nhân tạo tác nhân (Agentic AI), thành phần chính đang được chú trọng chính là CPU (Ảnh: Wccftech).
Các nhà sản xuất bộ nhớ hiện đang hưởng lợi lớn về doanh thu nhờ AI, nhưng đồng thời cũng đối mặt áp lực không thể đáp ứng hết đơn đặt hàng. Dù nhiều doanh nghiệp đã thúc đẩy kế hoạch mở rộng nhà máy, phần lớn cơ sở mới vẫn chưa kịp đi vào hoạt động.
Samsung thậm chí đánh giá thị trường DRAM năm 2027 có thể còn căng thẳng hơn cả năm 2026. Điều này cho thấy nguy cơ thiếu hụt bộ nhớ nhiều khả năng sẽ chưa sớm chấm dứt, ít nhất là khi làn sóng AI vẫn tiếp tục tăng nhiệt trên toàn cầu.
Một trong những nguyên nhân chính đến từ sự phát triển của Agentic AI, nhóm mô hình AI có khả năng xử lý và ra quyết định phức tạp hơn nhiều so với trước đây. Những hệ thống này đòi hỏi lượng bộ nhớ lớn hơn đáng kể để duy trì hiệu năng.
Trước kia, trung tâm dữ liệu AI thường có tỷ lệ GPU áp đảo CPU, phổ biến ở mức khoảng 8 GPU cho mỗi CPU. Tuy nhiên, tỷ lệ này hiện đã giảm xuống khoảng 4:1 và được dự đoán có thể tiến gần mức 1:1 trong tương lai.
Điều đó cho thấy CPU đang dần trở thành thành phần quan trọng hơn trong hạ tầng AI, thay vì chỉ đóng vai trò hỗ trợ cho GPU như trước.
Dù các thuật toán nén dữ liệu và tối ưu bộ nhớ đã phần nào giúp giảm áp lực lên vùng nhớ đệm KV cache, tổng nhu cầu bộ nhớ vẫn liên tục tăng lên. Vì vậy, các hãng phần cứng đang tính tới phương án nâng mạnh dung lượng DRAM cho CPU AI.
Hiện chưa rõ loại bộ nhớ nào sẽ được sử dụng cho các mốc 300 - 400 GB nói trên, và trên thực tế, các nền tảng CPU hiện đại đã có thể hỗ trợ tổng dung lượng bộ nhớ lên tới 4 - 8 TB thông qua DIMM cho toàn hệ thống. Tuy nhiên, đây là bộ nhớ gắn ở cấp nền tảng, không phải bộ nhớ tích hợp trực tiếp trên từng chip xử lý.

Khi các hãng công nghệ tính tới mức RAM 300 - 400 GB cho mỗi bộ xử lý AI, thị trường bộ nhớ toàn cầu được dự báo sẽ tiếp tục căng thẳng trong nhiều năm tới (Ảnh: Wccftech).
Một số công nghệ mới như MRDIMM đang được kỳ vọng sẽ cải thiện cả dung lượng lẫn băng thông bộ nhớ, nhưng về bản chất vẫn là DRAM dạng tách rời.
Không chỉ CPU, GPU AI thế hệ mới cũng đang liên tục tăng dung lượng bộ nhớ. NVIDIA chuẩn bị tung ra nền tảng Vera Rubin với 288 GB HBM từ tám chip nhớ. Trong khi đó, AMD được cho là đang phát triển GPU MI400 với dung lượng lên tới 432 GB. Google cũng vừa công bố TPU thế hệ thứ 8, trong đó phiên bản TPU 8i dự kiến sở hữu 288 GB HBM.
Khi các dòng Intel Xeon và AMD EPYC chuyên cho AI bắt đầu hướng tới DDR5 dung lượng cao tới 400 GB, áp lực thiếu bộ nhớ được dự báo sẽ tiếp tục kéo dài.
Giới công nghệ cũng đang tính tới khả năng CPU tương lai sẽ được đóng gói kèm HBM, hoặc sử dụng các chuẩn bộ nhớ mới như HBF hay ZAM đang trong quá trình phát triển. AMD trước đây từng ra mắt phiên bản EPYC tích hợp HBM, cho thấy hướng đi này hoàn toàn khả thi.
Một giải pháp khác đơn giản hơn là tăng mạnh dung lượng trên từng thanh DIMM. Nếu DIMM 400 GB trở thành hiện thực, chỉ một thanh bộ nhớ cũng đã vượt dung lượng HBM trên nhiều GPU AI hiện nay như NVIDIA GB300 hay AMD MI350X.
Tuy nhiên, cuộc đua DRAM mật độ cao cũng kéo theo hệ quả đáng lo ngại. Khi ngày càng nhiều dây chuyền sản xuất phải ưu tiên chip nhớ cao cấp cho AI, năng lực dành cho các dòng bộ nhớ phổ thông sẽ bị thu hẹp.
Samsung trước đó đã ngừng sản xuất LPDDR4 để tập trung vào LPDDR5 có biên lợi nhuận cao hơn. Với DDR5, thị trường cũng đang xuất hiện ngày càng nhiều biến thể phục vụ riêng cho AI và trung tâm dữ liệu.
Điều này làm dấy lên lo ngại rằng tình trạng thiếu hàng sẽ không chỉ giới hạn trong lĩnh vực AI, mà còn lan sang nhiều thiết bị phổ thông khác, từ máy tính cá nhân cho tới điện thoại, qua đó đẩy giá bộ nhớ tăng thêm trong thời gian tới.
Theo dantri.com.vn
https://dantri.com.vn/cong-nghe/ai-sap-ngon-toi-400-gb-ram-moi-chip-20260504112428600.htm