Trang chủ / Tin tức / Smarthome| Khả năng xử lý tiếng Việt của AI Việt trước thách thức GPT-4 và Llama

Smarthome| Khả năng xử lý tiếng Việt của AI Việt trước thách thức GPT-4 và Llama

Tháng 1 22, 2025
08:25

Trong những năm gần đây, các mô hình ngôn ngữ lớn (LLM) được phát triển và huấn luyện bởi các kỹ sư Việt Nam như KiLM và ViGPT đang chứng tỏ khả năng xử lý ngôn ngữ tiếng Việt không hề thua kém so với các tên tuổi lớn như GPT-4 và Llama. Những tiến bộ này đã đánh dấu bước tiến vượt bậc trong ngành AI tại Việt Nam.

Báo Cáo Tình Hình Phát Triển Mô Hình Ngôn Ngữ Lớn Tiếng Việt

Theo báo cáo mới nhất về tình hình phát triển mô hình ngôn ngữ lớn tiếng Việt, đến cuối năm 2024, đã có ít nhất 45 mô hình ngôn ngữ lớn tiếng Việt được xây dựng từ các tổ chức, doanh nghiệp trong và ngoài nước. Để đánh giá năng lực của các mô hình này, bộ tiêu chuẩn VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) đã được xây dựng bởi Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) cùng Zalo AI từ tháng 11/2023.

Bộ tiêu chuẩn VMLU gồm 10.880 câu hỏi thuộc 58 chủ đề và 4 lĩnh vực: tổng quát, STEM, Khoa học xã hội, và Khoa học nhân văn. Đây là công cụ quan trọng để đánh giá năng lực và tiềm năng của các mô hình ngôn ngữ lớn tiếng Việt.

Top Các Mô Hình Ngôn Ngữ Lớn Tiếng Việt

Trong bảng xếp hạng dành cho các mô hình ngôn ngữ lớn huấn luyện từ đầu (From-scratch models), Llama-3-70B của Meta dẫn đầu với 66,44 điểm, trong khi GPT-4 của OpenAI đứng thứ ba với 65,53 điểm. Đặc biệt, các sản phẩm nội địa như KiLM-13b-v24.7.1 do Zalo AI phát triển đã đạt vị trí thứ hai, và ViGPT-1.6B-v1 của VinBigData xếp thứ tám. Các mô hình khác trong top 10 còn có sự góp mặt của những tên tuổi lớn như GPT-4o-mini, Gemma, và Phi-3-128k từ OpenAI, Google, và Microsoft.

Ngoài ra, Llama-3 của Meta dẫn đầu về năng lực xử lý tiếng Việt trong lĩnh vực Khoa học Xã hội, trong khi GPT-4 của OpenAI đạt điểm cao nhất ở lĩnh vực STEM. Đặc biệt, sản phẩm của Zalo AI đã giành vị trí số một trong hạng mục Khoa học Nhân văn.

Sự Phát Triển Cộng Đồng AI Tiếng Việt

Mô hình ngôn ngữ lớn không chỉ là nền tảng cho các ứng dụng AI về ngôn ngữ mà còn tạo ra những bước đột phá trong việc phát triển công nghệ AI tại Việt Nam. Một số mô hình đáng chú ý được huấn luyện tại các trường đại học như ML4U của Đại học Bách Khoa TP.HCM và FPT AI của Trường Đại học FPT. Cùng với đó, nhiều tổ chức quốc tế cũng đã và đang tối ưu hóa các mô hình ngôn ngữ lớn cho tiếng Việt, như UONLP của Đại học Oregon, DAMO Academy của Alibaba và SDSRV teams của Samsung.

Mặc dù số lượng mô hình ngôn ngữ lớn tại Việt Nam hiện nay vẫn còn khiêm tốn so với các quốc gia khác, nhưng những kết quả đạt được đã chứng minh nỗ lực mạnh mẽ của các đơn vị trong việc tiếp cận công nghệ tiên tiến toàn cầu. Theo các chuyên gia, xu hướng phát triển LLM tại Việt Nam trong tương lai sẽ hướng tới việc tận dụng các mô hình mở như Llama, từ đó điều chỉnh và tối ưu hóa để phục vụ cho các bài toán và dữ liệu chuyên ngành.

Triển Vọng và Tương Lai Của Mô Hình Ngôn Ngữ Lớn Tiếng Việt

Những thành tựu này không chỉ giúp củng cố nền tảng công nghệ AI trong nước mà còn mở ra cơ hội ứng dụng thực tiễn cho người Việt. Giáo sư Nguyễn Lê Minh, Giám đốc Trung tâm Nghiên cứu Interpretable AI – Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST), nhận định: “Sự gia tăng số lượng mô hình ngôn ngữ lớn tại Việt Nam phản ánh sự quan tâm sâu sắc của cộng đồng đối với việc phát triển GenAI. Trong tương lai, việc phát triển các mô hình LLM sẽ giúp thúc đẩy tính ứng dụng của AI tại Việt Nam.”

Để hỗ trợ quá trình huấn luyện mô hình ngôn ngữ chất lượng cao, JAIST và Zalo AI sẽ tiếp tục cải tiến bộ tiêu chuẩn VMLU, tạo ra nền tảng vững chắc cho cộng đồng AI tại Việt Nam. Tiến sĩ Đặng Trần Thái, Trưởng phòng Xử lý Ngôn ngữ Tự Nhiên tại VinBigData, nhấn mạnh: “Chúng ta cần các bộ benchmark chuẩn xác để đảm bảo huấn luyện mô hình AI đạt chất lượng cao và đáp ứng yêu cầu thực tiễn.”

Smarthome| Lời kết

Sự phát triển mạnh mẽ của các mô hình ngôn ngữ lớn tiếng Việt là minh chứng rõ ràng cho tiềm năng và tương lai sáng lạn của AI tại Việt Nam. Việc nâng cao chất lượng và tối ưu hóa các mô hình này sẽ giúp Việt Nam gia nhập vào dòng chảy công nghệ toàn cầu, đóng góp cho sự phát triển của nền tảng GenAI và các ứng dụng AI tiên tiến phục vụ cộng đồng. Hy vọng bài viết này của SmartHome Ario – Nhà Thông Minh Thế Hệ Mới sẽ cung cấp cho bạn nhiều thông tin hữu ích.

Giải pháp tăng cường độ phủ sóng cho thiết bị BLE Mesh

Tin tức Smarthome: Bộ Kích Sóng BLE Mesh – Tăng 200% độ ổn định cho hệ thống nhà thông minh Meta Title...

Hệ thống an ninh AI nhầm lẫn: Túi Doritos bị đánh dấu là vũ khí, học sinh bị còng tay 3

Smarthome| Hệ thống an ninh AI nhầm lẫn: Túi Doritos bị đánh dấu là vũ khí, học sinh bị còng tay

Một học sinh trung học tại Maryland, Mỹ, đã bị còng tay và khám xét sau khi hệ thống an ninh AI của trường...

Tên lửa hành trình SOM-J Thổ Nhĩ Kỳ: Tầm bắn 275km, bay sát mặt biển, "sát thủ" chống hạm 3

Nhà thông minh| Tên lửa hành trình SOM-J Thổ Nhĩ Kỳ: Tầm bắn 275km, bay sát mặt biển, "sát thủ" chống hạm

Tên lửa hành trình SOM-J “Make in Türkiye” là bước nhảy vọt trong công nghệ vũ khí chống...

Open Innovation Day (OID) 2025 khai mạc: Đột phá công nghệ, thúc đẩy chuyển đổi xanh và số 3

Smarthome| Open Innovation Day (OID) 2025 khai mạc: Đột phá công nghệ, thúc đẩy chuyển đổi xanh và số

Sự kiện Open Innovation Day (OID) 2025 tại TP.HCM khai mạc với chủ đề “Đột phá công nghệ, thúc...

CMC giới thiệu hệ sinh thái an ninh mạng “Make in Vietnam” bảo vệ chủ quyền dữ liệu Việt Nam 3

Nhà thông minh| CMC giới thiệu hệ sinh thái an ninh mạng “Make in Vietnam” bảo vệ chủ quyền dữ liệu Việt Nam

Tại Công ước Hà Nội, Tập đoàn CMC đã giới thiệu hệ sinh thái an ninh mạng hợp nhất “Make in Vietnam”...

Phát minh đột phá pin thể rắn Trung Quốc: Lái xe hơn 1.000km, sạc siêu tốc 3

Smarthome| Phát minh đột phá pin thể rắn Trung Quốc: Lái xe hơn 1.000km, sạc siêu tốc

Các nhà khoa học Trung Quốc vừa công bố bước tiến lớn trong công nghệ pin lithium-kim loại thể rắn, giải...

Donald Trump ân xá cho Changpeng Zhao – Nhà sáng lập Binance: “Chiến tranh với tiền mã hóa đã kết thúc” 3

Nhà thông minh| Donald Trump ân xá cho Changpeng Zhao – Nhà sáng lập Binance: “Chiến tranh với tiền mã hóa đã kết thúc”

Tổng thống Mỹ Donald Trump vừa ký lệnh ân xá cho Changpeng Zhao (CZ) – nhà sáng lập sàn giao dịch tiền...

Snapchat mở miễn phí "Imagine Lens" – Ống kính AI biến ảnh thành tác phẩm sáng tạo chỉ với một lời nhắc 3

Nhà thông minh| Snapchat mở miễn phí "Imagine Lens" – Ống kính AI biến ảnh thành tác phẩm sáng tạo chỉ với một lời nhắc

Snapchat vừa chính thức mở quyền truy cập miễn phí cho Imagine Lens – ống kính AI tạo hình ảnh theo lời...

Smarthome| Khả năng xử lý tiếng Việt của AI Việt trước thách thức GPT-4 và Llama

Báo Cáo Tình Hình Phát Triển Mô Hình Ngôn Ngữ Lớn Tiếng Việt

Top Các Mô Hình Ngôn Ngữ Lớn Tiếng Việt

Sự Phát Triển Cộng Đồng AI Tiếng Việt

Triển Vọng và Tương Lai Của Mô Hình Ngôn Ngữ Lớn Tiếng Việt

Smarthome| Lời kết

Liên hệ

Giải pháp

Thông tin

Tải app 3D ARIO trên điện thoại