DeepSeek: Mô hình AI gây chấn động thế giới

05/02/2025

Mô hình AI của Trung Quốc – DeepSeek được ví như “gã khổng lồ thầm lặng” gây chấn động thế giới khi sở hữu AI mạnh với mức chi phí đầu tư thấp.

*Mô hình AI DeepSeek của Trung Quốc gây ấn tượng với chi phí đầu tư thấp*

DeepSeek là gì?

DeepSeek được thành lập từ năm 2023 tại Trung Quốc. Công ty được High-Flyer tài trợ toàn phần và không có kế hoạch huy động vốn. Công ty tập trung vào xây dựng công nghệ nền tảng. Dù từng nhận được đánh giá cao từ giới chuyên môn khi ra mắt các phiên bản V2 và V3 nhưng vẫn chưa thật sự nổi bật.

Trong một loạt bài kiểm tra chuẩn của bên thứ ba, mô hình của DeepSeek đã vượt Llama 3.1 của Meta, GPT-4o của OpenAI và Claude Sonnet 3.5 của Anthropic với độ chính xác từ giải quyết vấn đề phức tạp đến toán học và mã hóa. V3 cũng đánh bại đối thủ cạnh tranh trên Aider Polyglot, bài kiểm tra được thiết kế để đo lường khả năng của các mô hình AI. Theo DeepSeek, mô hình được đào tạo trên một tập dữ liệu gồm 14,8 nghìn tỷ token cùng kích thước khổng lồ với 671 tỷ tham số, lớn hơn khoảng 1,6 lần so với Llama 3.1 405B.

Chỉ đến đầu năm 2025, khi mô hình DeepSeek R1 với mã nguồn mở trên GitHub được tung ra, mô hình AI DeepSeek mới thật sự trở nên nổi tiếng với sức lan toả mạnh mẽ. Hàng triệu lượt tải trên App Store và Google Play chỉ trong một tuần.

Dù còn một số vấn đề liên quan đến phản hồi, mô hình hiện được đánh giá rất cao khi chỉ mất hai tháng để xây dựng với chi phí chưa đến 6 triệu USD, đồng thời dùng GPU H800 vốn được Nvidia hạ cấp sức mạnh để tuân thủ lệnh cấm của Mỹ, thay vì những mẫu chip AI mạnh nhất thị trường.

Đánh giá về mô hình AI DeepSeek R1

Theo đánh giá của một số bên thứ ba, AI này thậm chí vượt trội so với o1 mới nhất của OpenAI trong nhiều bài kiểm tra.

“DeepSeek R1 là mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự. OpenAI o1 mất 60 USD cho một triệu token đầu ra, còn DeepSeek R1 chỉ cần 2,19 USD“, Shubham Saboo, Giám đốc sản phẩm của DeepSeek, cho biết trên X cuối tháng 1.

Arnaud Bertrand, người sáng lập HouseTrip và Me & Qi, so sánh trên X: “Về cơ bản, điều này giống như ai đó phát hành điện thoại có sức mạnh bằng với iPhone, nhưng bán với giá 30 USD thay vì 1.000 USD“.

“Mô hình AI DeepSeek thực sự ấn tượng. Họ đã biết cách thực hiện một mô hình nguồn mở có khả năng suy luận, đạt hiệu quả tính toán siêu việt“, CEO Microsoft Satya Nadella phát biểu tại Diễn đàn Kinh tế Thế giới ở Davos ngày 22/1.

Đặc biệt, giới chuyên gia cũng đánh giá cao LLM mà DeepSeek đang phát triển. “Họ có thể chắt lọc để tạo ra một LLM thực sự tốt và sử dụng quy trình gọi là ‘chưng cất’ để làm điều đó“, Chetan Puttagunta, chuyên gia của Benchmark, nói với CNBC. “Về cơ bản, họ sử dụng một mô hình rất lớn để giúp mô hình nhỏ của mình trở nên thông minh và cách này rất tiết kiệm chi phí“.

Theo CNBC, những diễn biến mới làm dấy lên hồi chuông cảnh báo về việc liệu vị thế dẫn đầu toàn cầu của Mỹ về AI có đang bị thu hẹp hay không. Đồng thời, điều này cũng đặt ra câu hỏi về khoản chi khổng lồ của các công ty công nghệ lớn cho việc xây dựng mô hình AI và trung tâm dữ liệu có hiệu quả không, khi Trung Quốc cũng có thể tạo được LLM có sức mạnh lớn với chi phí thấp.

Theo VnExpress

Nhìn chung, trí tuệ nhân tạo (AI) không chỉ là xu thế tất yếu mà còn là động lực phát triển, thúc đẩy chuyển đối số. Tuy nhiên, để đáp ứng yêu cầu chuyển đổi số thành công, các doanh nghiệp cần nâng cấp hạ tầng cơ sở, ứng dụng các phần mềm hiện đại và tăng cường bảo mật thông tin – hạn chế các tác động tiêu cực từ sự phát triển của AI.

Với nhiều năm kinh nghiệm, PHUCBINH GROUP là nhà thầu cơ điện, nhà thầu điện nhẹ, nhà thầu công nghệ và thi công PCCC uy tín hàng đầu, chuyên cung cấp, triển khai thi công và bảo trì, nâng cấp hệ thống mạng, lắp đặt thiết bị mạng, cung cấp thiết bị văn phòng, máy trạm, cho thuê server, camera AI, sao lưu dữ liệu, IT outsoursing… nhằm đáp ứng hạ tầng công nghệ số, sẵn sàng cho các doanh nghiệp đón đầu xu hướng công nghệ.