DeepSeek V4: Bom tấn AI hay cú hụt hơi của Trung Quốc sau 15 tháng im lặng?
Sau 15 tháng không có bản cập nhật lớn, cộng đồng công nghệ Trung Quốc đang đặt câu hỏi liệu DeepSeek V4 sẽ trở thành "bom tấn" AI hay là cú hụt hơi đáng thất vọng nhất. Trong khi các gã khổng lồ toàn cầu như OpenAI, Anthropic và Google duy trì nhịp nâng cấp 2-3 tháng, DeepSeek đã chậm lại đáng kể, từ vị thế dẫn đầu trở thành kẻ tụt hậu.
Áp lực chuyển đổi sang chip nội địa
Theo tiết lộ từ Reuters tháng 1/2025, sau khi DeepSeek R1 ra mắt, các cơ quan liên quan đã "khuyến khích" công ty sử dụng bộ vi xử lý Ascend của Huawei thay vì tiếp tục dựa vào Nvidia. DeepSeek, từ một công ty khởi nghiệp AI thuần túy, nhanh chóng trở thành quân cờ then chốt trong chiến lược tự chủ công nghệ quốc gia.
Đầu năm 2025, DeepSeek thực sự nỗ lực dùng chip Huawei Ascend 910C để huấn luyện mô hình thế hệ mới. Tuy nhiên, quá trình này vấp phải rào cản kỹ thuật nghiêm trọng: độ ổn định huấn luyện không đủ, hệ thống thường xuyên sập trong các kịch bản phân tán quy mô lớn, và tốc độ giao tiếp giữa chip không đạt kỳ vọng. Dù Huawei cử kỹ sư hỗ trợ trực tiếp, vấn đề tương thích vẫn không được giải quyết.
Kết quả là một sự thỏa hiệp: DeepSeek quay lại dùng GPU Nvidia cho giai đoạn huấn luyện, còn chip Ascend chỉ dùng cho suy luận. Điều này đồng nghĩa với việc mất gần một năm để thử sai ở khâu cốt lõi.
Những thách thức kỹ thuật và sự chậm trễ
Năm 2026, phiên bản V4 xuất hiện tín hiệu mới. Theo 36Kr, DeepSeek ưu tiên bàn giao phiên bản tiền phát hành cho chip Ascend 950PR của Huawei và chip Cambricon Technologies để tương thích hóa. Tuy nhiên, khó khăn cốt lõi nằm ở việc "đối chiếu độ chính xác", đảm bảo mô hình cho kết quả nhất quán trên các hệ sinh thái phần cứng khác nhau, đòi hỏi điều chỉnh lượng lớn mã nguồn tầng thấp.
Khoảng cách về hiệu năng, độ trưởng thành hệ sinh thái và chuỗi công cụ giữa chip nội địa Trung Quốc và Nvidia khiến quá trình tương thích tiêu tốn thời gian khổng lồ. Điều này tạo ra sự khác biệt rõ rệt so với lộ trình ban đầu của DeepSeek là thuần túy nâng cao hiệu năng mô hình.
Mất mát nhân sự và áp lực cạnh tranh
Từ nửa cuối năm 2025, đội ngũ nhân sự cốt lõi của DeepSeek bắt đầu lung lay. Các tên tuổi chủ chốt như Vương Bỉnh Tuyên, Quách Đạt Nhã, Ngụy Hạo Nhiên và Nguyễn Trưng đã lần lượt rời đi, mang theo sự tích lũy kỹ thuật từ V1 đến R1. Nguyên nhân một phần đến từ chế độ đãi ngộ không cạnh tranh, khi đối thủ đưa ra mức lương gấp 2-3 lần, thậm chí tổng thu nhập 8 chữ số.
DeepSeek, với tư cách công ty khởi nghiệp chưa gọi vốn bên ngoài, không thể sánh với chính sách kích thích cổ phiếu của các gã khổng lồ như ByteDance, Alibaba hay Tencent. Áp lực giữ chân nhân tài gia tăng trong bối cảnh đối thủ như Zhipu AI hay MiniMax đã niêm yết và giá cổ phiếu tăng vọt.
Vai trò kép và kỳ vọng điều chỉnh
DeepSeek hiện rơi vào sự mơ hồ về vị thế: vừa cần thương mại hóa và giữ chân nhân tài, vừa được kỳ vọng gánh vác trọng trách tương thích hóa nội địa. Xung đột từ hai vai trò này là logic sâu xa khiến công ty chậm lại trong năm qua.
Do đó, kỳ vọng thị trường về hiệu năng DeepSeek V4 đang được điều chỉnh giảm. Mô hình này có thể không phải "bom tấn" gây sốt toàn giới công nghệ, nhưng có thể là cột mốc quan trọng về mặt công nghiệp, chứng minh các mô hình tiên tiến của Trung Quốc có thể đạt độ khả dụng trên hệ sinh thái phần cứng nội địa.
"Bài kiểm tra" của DeepSeek V4 có lẽ quan trọng hơn đối với định hướng dài hạn của toàn bộ giới AI Trung Quốc. Nếu thành công, đây sẽ là bước ngoặt mở đường cho mục tiêu tự chủ công nghệ; nếu thất bại, nó giúp xác định rõ giới hạn năng lực hiện tại của chip nội địa.



