Getty Images/BBC
Tác giả, Lily Jamali
Vai trò, Phóng viên Công nghệ Bắc Mỹ
X,@lilyjamali
San Francisco
Tổng thống Mỹ Donald Trump mới nhậm chức chưa đầy một tuần thì một ứng dụng trí tuệ / trí thông minh nhân tạo (AI) mới của Trung Quốc có tên DeepSeek đã làm rung chuyển Thung lũng Silicon.
Chỉ sau một đêm, DeepSeek-R1 đã vươn lên trở thành ứng dụng miễn phí được tải xuống nhiều nhất tại Mỹ, dẫn đầu bảng xếp hạng của Apple.
Công ty cho biết vào thời điểm đó, chatbot mới của họ đã cạnh tranh với ChatGPT. Không chỉ vậy, họ khẳng định rằng chi phí phát triển chỉ bằng một phần nhỏ của đối thủ.
Những tuyên bố đó - và sự gia tăng đột ngột về mức độ phổ biến của ứng dụng - đã xóa sổ 600 tỷ đô-la hoặc 17% giá trị thị trường của gã khổng lồ chip Nvidia, đánh dấu mức lỗ trong một ngày lớn nhất đối với một cổ phiếu trong lịch sử thị trường chứng khoán Mỹ.
Một số cổ phiếu công nghệ khác có liên quan đến AI cũng bị cuốn vào vòng xoáy giảm điểm.
DeepSeek cũng đặt ra nghi ngờ về sự thống trị AI của Mỹ. Trước đó, Trung Quốc được coi là tụt hậu so với Mỹ. Rồi dường như Trung Quốc đã vươn lên dẫn đầu.
Nhà đầu tư mạo hiểm Marc Andreessen gọi sự xuất hiện của DeepSeek-R1 là "khoảnh khắc Sputnik của AI", liên hệ đến vệ tinh Liên Xô cùng tên đã khởi động cuộc chạy đua vào không gian giữa Mỹ và Liên Xô hơn nửa thế kỷ trước.
Cổ phiếu của các công ty liên quan đến chất bán dẫn của Nhật Bổn đã kéo dài đợt giảm điểm vào cuối tháng Một sau khi việc ra mắt AI DeepSeek của Trung Quốc đã tạo ra làn sóng bán tháo cổ phiếu công nghệ của Mỹ. Bloomberg/Getty Images
Vẫn còn sức hút
Đã sáu tháng trôi qua kể từ khi DeepSeek gây chấn động thế giới.
Ngày nay, ứng dụng đột phá của Trung Quốc phần lớn đã không còn xuất hiện trên các tít báo. Nó không còn là chủ đề nóng hổi trong giờ vàng ở San Francisco nữa. Nhưng DeepSeek vẫn chưa biến mất.
DeepSeek đã thách thức một số giả định quan trọng về AI vốn được các giám đốc điều hành người Mỹ như Sam Altman, CEO của OpenAI, công ty sản xuất ChatGPT, ủng hộ.
Sid Sheth, CEO của công ty khởi nghiệp chip AI d-Matrix, nói: "Chúng tôi đang đi trên con đường mà càng lớn càng tốt."
Có lẽ việc khai thác tối đa các trung tâm dữ liệu, máy chủ, chip và điện để vận hành tất cả không phải là con đường phía trước.
Mặc dù DeepSeek dường như không có quyền truy cập vào công nghệ mạnh nhất hiện có vào thời điểm đó, ông Sheth nói với BBC rằng điều đó cho thấy "với kỹ thuật thông minh hơn, bạn thực sự có thể xây dựng một mô hình có năng lực".
Trào lưu sử dụng DeepSeek bùng nổ vào cuối tuần cuối tháng Một, trước khi bộ phận I.T của các công ty kịp thời ngăn cản nhân viên đổ xô dùng thử.
Đến thứ Hai vào tuần sau đó, khi các tổ chức nhận ra, nhiều nơi đã vội vàng cấm nhân viên sử dụng ứng dụng này vì lo ngại dữ liệu người dùng có thể bị chia sẻ (chia xẻ) với Trung Quốc, nơi DeepSeek đặt trụ sở.
Tuy không có số liệu chính xác, nhưng nhiều người Mỹ vẫn đang tiếp tục sử dụng DeepSeek.
Một số công ty khởi nghiệp ở Thung lũng Silicon đã chọn dùng DeepSeek thay vì các mô hình AI đắt đỏ hơn của Mỹ để tiết kiệm chi phí.
Một nhà đầu tư chia sẻ với tôi rằng đối với các công ty thiếu vốn, khoản tiền tiết kiệm được từ việc tiếp tục dùng DeepSeek đang giúp họ chi trả cho những nhu cầu thiết yếu khác, chẳng hạn như tuyển thêm nhân sự.
Tuy nhiên, họ cũng rất cẩn trọng. Trên các diễn đàn trực tuyến, người dùng chia sẻ cách chạy DeepSeek-R1 trên thiết bị cá nhân thay vì trên máy chủ của DeepSeek tại Trung Quốc. Họ tin rằng cách làm này có thể bảo vệ dữ liệu khỏi việc bị lấy một cách bí mật.
Ông Christopher Caen, Giám đốc điều hành của công ty phần mềm Mill Pond Research, bình luận, "Đây là một cách tốt để sử dụng mô hình này mà không phải lo lắng về việc nó sẽ rò rỉ những gì" sang Trung Quốc.
Cạnh tranh Mỹ-Trung
CFOTO/Future Publishing/Getty Images
Một số chuyên gia nhận định, sự xuất hiện của DeepSeek cũng đánh dấu một bước ngoặt trong cuộc cạnh tranh AI giữa Mỹ và Trung Quốc.
Wendy Chang, là chuyên viên phân tách chính sách của Viện Nghiên cứu Trung Quốc Mercator nói với BBC : "Cho đến thời điểm này, Trung Quốc được xem là đang cố gắng bắt kịp các mô hình ngôn ngữ lớn, với các mô hình cạnh tranh nhưng luôn tụt hậu so với các mô hình tốt nhất của Tây phương."
Mô hình ngôn ngữ lớn (LLM) là một hệ thống lập luận được đào tạo để dự đoán từ / chữ tiếp theo trong một câu hoặc cụm từ nhất định.
DeepSeek đã thay đổi nhận thức khi tuyên bố đã đạt được một mô hình hàng đầu chỉ với một phần nhỏ tài nguyên tính toán và chi phí so với các đối thủ Mỹ.
Chỉ riêng trong năm 2024, OpenAI đã chi 5 tỷ đô-la. Ngược lại, các chuyên viên nghiên cứu DeepSeek cho biết họ đã phát triển DeepSeek-R1 - vượt trội hơn mô hình o1 của OpenAI trên nhiều tiêu chuẩn - chỉ với 5,6 triệu đô-la.
Bà Chang nói : "DeepSeek đã tiết lộ cho thế giới thấy tính cạnh tranh của bối cảnh AI Trung Quốc,"
Các công ty phát triển AI Mỹ đã tận dụng được sự thay đổi này. Các thỏa thuận liên quan đến AI và các thông báo khác được chánh quyền Trump và các công ty công nghệ lớn của Mỹ đưa ra thường được coi là rất quan trọng để vượt lên trước Trung Quốc.
Ông trùm AI của Tổng thống Trump, David Sacks, nói rằng công nghệ này sẽ có "những tác động sâu sắc đến cả nền kinh tế và an ninh quốc gia" khi chánh quyền công bố Kế hoạch Hành động AI vào tháng trước.
Ông Sacks nói : "Mấu chốt là Mỹ tiếp tục là cường quốc thống trị về AI."
DeepSeek chưa bao giờ xoa dịu được những lo ngại về tác động an ninh từ nguồn gốc Trung Quốc của mình.
Chánh phủ Mỹ đã và đang đánh giá mối liên hệ của công ty này với Bắc Kinh, như Reuters đã đưa tin lần đầu vào tháng Sáu.
Một viên chức cấp cao của Bộ Ngoại giao Mỹ nói với BBC rằng họ hiểu rằng "DeepSeek đã sẵn lòng cung cấp, và có thể sẽ tiếp tục cung cấp, hỗ trợ cho các hoạt động quân sự và tình báo của Trung Quốc".
DeepSeek đã không trả lời yêu cầu bình luận của BBC nhưng chính sách bảo mật của công ty nêu rõ rằng các máy chủ của họ được đặt tại Cộng hòa Nhân dân Trung Hoa.
Chính sách của DeepSeel nêu rõ: "Khi bạn truy vấn dịch vụ của chúng tôi, dữ liệu cá nhân của bạn có thể được xem xét và tính toán, rồi được lưu trữ trên máy chủ của chúng tôi tại Cộng hòa Nhân dân Trung Hoa. Việc này có thể là việc cung cấp trực tiếp dữ liệu cá nhân của bạn cho chúng tôi hoặc việc chuyển giao do chúng tôi hoặc bên thứ ba thực hiện."
Feature China/Future Publishing/Getty Images
Cách vận hành mới?
Đầu tuần này, OpenAI đã khơi lại những cuộc thảo luận về DeepSeek sau khi phát hành một cặp mô hình AI.
Đây là những phiên bản miễn phí và mở đầu tiên - nghĩa là chúng có thể được tải xuống và chỉnh sửa - được gã khổng lồ AI của Mỹ phát hành trong 5 năm, trước cả khi ChatGPT mở ra kỷ nguyên AI dành cho người tiêu dùng.
Ông Sheth của d-Matrix cho hay: "Có một sự liên kết rõ ràng từ DeepSeek đến những gì OpenAI đã công bố tuần này,".
"DeepSeek đã chứng minh rằng các mô hình nhỏ hơn, hiệu quả hơn vẫn có thể mang lại hiệu suất ấn tượng - và điều đó đã thay đổi tư duy của ngành,"
"Những gì chúng ta đang thấy bây giờ là làn sóng tiếp theo của tư duy đó: một sự chuyển dịch sang các mô hình có kích thước phù hợp, nhanh hơn, rẻ hơn và sẵn sàng triển khai ở quy mô lớn."
Nhưng đối với những người khác, chẳng hạn như các công ty AI lớn của Mỹ, phương pháp vận hành cũ dường như vẫn còn tồn tại và phát triển tốt.
Chỉ vài ngày sau khi phát hành các mô hình miễn phí, OpenAI đã công bố GPT-5. Trong thời gian chuẩn bị, công ty cho biết họ đã tăng cường đáng kể năng lực tính toán và cơ sở hạ tầng AI của mình.
Hàng loạt thông báo về các cụm trung tâm dữ liệu mới cần thiết cho AI đã được đưa ra trong bối cảnh các công ty công nghệ Mỹ đang cạnh tranh để giành được nhân tài AI hàng đầu.
Giám đốc điều hành Meta Mark Zuckerberg đã đầu tư hàng tỷ đô-la để hiện thực hóa tham vọng AI của mình và cố gắng thu hút nhân viên từ các đối thủ bằng các gói lương 100 triệu đô-la.
Vận mệnh của những gã khổng lồ công nghệ dường như gắn chặt hơn bao giờ hết với cam kết chi tiêu cho AI, bằng chứng là hàng loạt kết quả kinh doanh bùng nổ được công bố trong mùa báo cáo tài chánh công nghệ vừa qua.
Trong khi đó, cổ phiếu của Nvidia, vốn đã lao dốc ngay sau khi DeepSeek xuất hiện, đã phục hồi - chạm mức cao mới, đưa Nvidia trở thành công ty có giá trị nhất thế giới trong lịch sử.
Ông Caen của Mill Pond Research nhận xét, "Câu chuyện ban đầu hóa ra lại không phải là mấu chốt của vấn đề."
Chúng ta đang quay trở lại một tương lai mà AI dường như sẽ phụ thuộc vào nhiều trung tâm dữ liệu hơn, nhiều chip hơn và nhiều năng lượng hơn.
Nói cách khác, sự thay đổi hiện trạng của DeepSeek vẫn chưa kéo dài.
Vậy còn bản thân DeepSeek thì sao?
Bà Marina Zhang, giáo sư tại Đại học Công nghệ Sydney, nói, "DeepSeek hiện đối mặt với những thách thức trong việc duy trì đà phát triển."
Bà nói rằng điều này một phần là do những khó khăn trong hoạt động, nhưng cũng do sự cạnh tranh gay gắt từ các công ty ở Mỹ và Trung Quốc.
Bà Zhang nói rằng sản phẩm tiếp theo của công ty, DeepSeek-R2, được cho là đã bị trì hoãn. Lý do ? Đó là do thiếu hụt chip cao cấp.