Unigen ra mắt module AI M.2 Amaretti E1.S: Chạy mô hình 20 tỷ tham số chỉ với 10W điện
Module AI M.2 Amaretti E1.S: 20 tỷ tham số, 10W điện

Unigen ra mắt module AI Amaretti E1.S: Công nghệ đột phá cho máy tính cá nhân

Hãng Unigen vừa chính thức trình làng module AI Amaretti E1.S, một giải pháp phần cứng độc đáo có thể cắm trực tiếp vào khe M.2 trên bo mạch chủ như một ổ SSD thông thường. Điểm đặc biệt là module này có khả năng chạy các mô hình ngôn ngữ lớn với quy mô lên đến 20 tỷ tham số trong khi chỉ tiêu thụ 10W điện năng.

Chip SAKURA-II: Trái tim của module AI tiết kiệm năng lượng

Bên trong module Amaretti E1.S là chip tăng tốc SAKURA-II do công ty EdgeCortix phát triển. Chip này ban đầu được thiết kế cho các thiết bị nhúng tiết kiệm điện như Raspberry Pi 5 và các bo mạch sử dụng chip ARM. Với kích thước chỉ 19x19mm, chip này nhỏ đến mức có thể dễ dàng nhầm lẫn với một thanh RAM hay ổ SSD mini.

Chip SAKURA-II tích hợp bộ xử lý thần kinh (NPU) hiệu suất cao cùng với 20MB bộ nhớ đệm trong chip. Thiết kế nhỏ gọn này cho phép module hoạt động mà không cần hệ thống làm mát phức tạp, phù hợp với cả máy tính để bàn thông thường và các máy chủ nhỏ.

Banner rộng Pickt — ứng dụng danh sách mua sắm cộng tác cho Telegram

Bộ nhớ lớn trong kích thước nhỏ

Amaretti E1.S có hai phiên bản bộ nhớ: 16 GB và 32 GB, sử dụng chuẩn LPDDR4x tốc độ cao với băng thông đạt tới 68 GB/s. Với phiên bản 32 GB, module đủ sức xử lý các mô hình ngôn ngữ lớn có tới 20 tỷ tham số, đáp ứng nhu cầu của nhiều ứng dụng AI thực tế:

  • Trợ lý ảo thông minh
  • Phân tích văn bản tự động
  • Các quy trình AI tự động hóa
  • Xử lý ngôn ngữ tự nhiên

Điều này có nghĩa là người dùng có thể thực hiện các tác vụ AI phức tạp ngay trên thiết bị của mình mà không cần phải kết nối lên máy chủ đám mây.

Hiệu quả năng lượng và khả năng mở rộng

Amaretti E1.S đạt mức 6 đơn vị hiệu suất AI trên mỗi watt, một con số ấn tượng trong lĩnh vực xử lý AI cục bộ. Nếu cần thêm sức mạnh xử lý, người dùng có thể cắm nhiều module cùng lúc vào các khe M.2 còn trống trên bo mạch chủ. Tính năng này mang lại sự linh hoạt cao trong việc mở rộng khả năng xử lý theo nhu cầu cụ thể của từng ứng dụng.

EdgeCortix cũng cung cấp phiên bản cao cấp hơn gắn khe PCIe tích hợp hai chip SAKURA-II, nhưng giải pháp M.2 của Amaretti E1.S được đánh giá là phù hợp hơn cho các hệ thống có khe cắm còn nhàn rỗi và yêu cầu tiết kiệm không gian.

Tương thích rộng rãi với các nền tảng AI

Module Amaretti E1.S được thiết kế để tương thích với hầu hết các bộ công cụ AI phổ biến hiện nay:

  1. TensorFlow
  2. PyTorch
  3. ONNX
  4. Hugging Face

Sự tương thích này giúp các nhà phát triển có thể tích hợp module vào quy trình làm việc hiện có mà không cần thay đổi đáng kể. Unigen cũng khẳng định module hỗ trợ cả hai xu hướng AI đang phát triển mạnh: AI tạo sinh và AI tác nhân tự động.

Thông tin về giá cả và thời gian giao hàng

Unigen bán Amaretti E1.S kèm theo tản nhiệt lắp sẵn, giúp người dùng không cần mua thêm phụ kiện làm mát. Mặc dù hãng chưa công bố mức giá chính thức, nhưng với dung lượng bộ nhớ lên đến 32 GB, giá thành dự kiến sẽ ở mức đáng kể.

Thời gian giao hàng theo thông báo của Unigen là khoảng 14 tuần, ngắn hơn đáng kể so với việc chờ đợi mua các máy chủ GPU thông thường vốn thường có thời gian chờ lâu hơn. Điều này tạo ra lợi thế cạnh tranh quan trọng cho sản phẩm trong bối cảnh nhu cầu về phần cứng AI đang tăng cao.

Banner sau bài viết Pickt — ứng dụng danh sách mua sắm cộng tác với hình minh họa gia đình

Amaretti E1.S đại diện cho một bước tiến quan trọng trong việc đưa khả năng xử lý AI mạnh mẽ đến gần hơn với người dùng cá nhân và doanh nghiệp nhỏ. Với thiết kế nhỏ gọn, tiết kiệm năng lượng và hiệu suất cao, module này hứa hẹn sẽ mở ra nhiều ứng dụng thực tế trong lĩnh vực trí tuệ nhân tạo tại Việt Nam và trên toàn thế giới.