Các mô hình ngôn ngữ lớn (LLM)
càng ngày càng phình to, lên đến hàng nghìn tỷ biến số, với tham vọng "nuốt
chửng kiến thức của toàn thế giới". Việt Nam có thể, và có chỗ đứng nếu chạy
đuổi theo những mô hình "AI to" như vậy không?
Sự đồ sộ của các mô hình LLM
khiến rất nhiều người tin là AI cái gì cũng biết, cái gì cũng hỏi AI, AI nói
sai cũng tin, đôi khi gây ra hậu quả tai hại. Đã có những quyển sách khoa học
do ChatGPT viết, với các trích dẫn không có thật được ChatGPT bịa ra. Thậm chí
có những người khi gặp khủng hoảng tinh thần, hỏi AI thì AI khuyên nên tự tử,
thế là tự tử chết thật. Trong y tế thì từ khi có LLM các trang mạng thông tin
nghiêm túc về y tế bị ế vì dân tình đi hỏi những thứ như ChatGPT thay vì tra cứu
các trang đó, và thế là họ hay nhận được những thông tin sai lệch, rất nguy hiểm.
Nguyên nhân nằm ở cấu trúc và
cách học của các mô hình ngôn ngữ hiện tại dựa trên xác suất chứ không dựa trên
kiến thức có đảm bảo và suy luận chặt chẽ. Nên các mô hình ngôn ngữ rất "dẻo
mồm" nhưng cũng rất dễ "râu ông nọ cắm cằm bà kia", khả năng nói
nhảm (hallucination) cao, nhất là khi đi vào cách lĩnh vực chuyên môn. Một lần
tôi thử kiểm tra MedGemma của Google (một mô hình VLM – ngôn ngữ hình ảnh lớn,
dành cho y tế) cho các ảnh bệnh về da thì kết quả là có trên 90% các trường hợp
là nói sai, đặc biệt khi gặp phải các bệnh hơi hiếm, chỉ đúng khi gặp trường hợp
phổ biến của bệnh phổ biến.
Thế giới cần có những mẫu hình
(paradigm) AI đa dụng mới tốt hơn, đáng tin hơn là LLM. Đây là một cuộc chơi mới
mà Việt Nam hoàn toàn có thể tham dự. Giáo sư Yann LeCun, một trong những người
đi đầu trong lĩnh vực học sâu, cũng đã bỏ Meta để lập công ty nghiên cứu những
hướng mới này.
Mặt khác, thế giới rất cần
phát triển nhiều AI chuyên dụng cho rất nhiều lĩnh vực khác nhau, có độ tin tưởng
cao hơn nhiều so với AI đa dụng. Những AI chuyên dụng này thường có kích thước
nhỏ, có cấu trúc mạng thần kinh, dữ liệu để học và cách huấn luyện phù hợp nhất
với vấn đề mà nó giải quyết, là những thứ mà AI đa dụng không làm được.
Tương lai của một "trợ thủ
AI biết tất" sẽ không nằm ở những LLM to tướng, mà ở những mô hình đa dụng
khác không nhất thiết phải to, mà có thể nhỏ có logic tốt hơn, hiểu các khái niệm
chính xác hơn, biết kết nối đến các AI chuyên dụng thích hợp nhất khi gặp từng
vấn đề. Trí tuệ "siêu việt" sẽ không phải là một trí tuệ tập trung nằm
ở một nơi, mà là một mạng rất rộng các trí tuệ chuyên gia cho từng lĩnh vực
khác nhau, kết nối vào với nhau, ai có vấn đề về lĩnh vực nào có thể gọi ngay đến
chuyên gia lĩnh vực đó. Việt Nam có khả năng làm ra nhiều AI chuyên dụng tham
gia vào mạng trí tuệ siêu việt phi tập trung này.

Ứng dụng AI trong chẩn đoán
ngày càng mở ra cơ hội điều trị bệnh ở Việt Nam. Ảnh: Nhóm nghiên cứu của TS.
Hà Thị Thanh Hương (bìa phải) cùng các cộng sự trong phòng thí nghiệm để nghiên
cứu sử dụng AI giúp chẩn đoán Alzheimer.
"Nhỏ là đẹp",
và những xu hướng mới
Trong cuộc cách mạng tin học từ
mấy chục năm trước đã có khái niệm nhỏ là đẹp, tức là các chương
trình phần mềm nhỏ gọn, có thể chạy trên các máy nhỏ, tiết kiệm chi phí phần cứng,
nhiều khi có giá trị hơn nhiều so với các chương trình cồng kềnh.
Khi công suất tính toán tăng
nhanh, nhu cầu nhỏ là đẹp giảm đi, người ta ít quan tâm tối ưu
hóa dung lượng của các phần mềm, mà quan tâm nhiều hơn đến việc làm sao để tạo
ra nhanh các phần mềm với chi phí thấp, và muốn làm nhanh, làm rẻ thì không thể
làm nhỏ đẹp được mà chỉ làm sao cho nó chạy được thôi. Trừ một số vấn đề chuyên
dụng như là phần mềm nhúng, gài trong các chip nhỏ, bắt buộc phải làm nhỏ.
Nói đến hạ tầng cơ sở cho điện
toán và AI, chúng ta không nên quên sức mạnh của tính toán phi tập trung
(distributed computing): nhiều trung tâm máy tính nhỏ nằm ở nhiều nơi nối vào với
nhau có thể tạo thành hệ thống mạnh hơn và an toàn hơn là một vài trung tâm lớn
quá tập trung.
— Nguyễn Tiến Dũng
Thời nay, vấn đề nhỏ
là đẹp lại được đặt ra, khi mà các trung tâm điện toán đám mây chạy
LLM ngốn quá nhiều năng lượng của thế giới, hơn tổng sản lượng điện của cả một
quốc gia lớn, khiến người ta phải nghĩ đến xây hàng loạt nhà máy điện nguyên tử
để phục vụ AI, và khối năng lượng khổng lồ đó để phục vụ AI cũng biến thành nhiệt
làm hại môi trường.
Các mô hình AI nhỏ (small
model) sẽ ngày càng được quan tâm hơn các mô hình lớn (large model). Mô hình nhỏ.
ngoài chuyện tiếp kiệm năng lượng, còn có ưu thế là chạy được tại chỗ (ở máy
tính bàn. điện thoại. vv) chứ không cần chạy trên đám mây, tăng tính an toàn và
giá trị sử dụng cho người dùng.
Mạng thần kinh tiết kiệm (frugal/parcimonious)
cũng là một xu hướng rất quan trọng. Các nạng này còn nhỏ hơn nhiều lần so với
các mô hình nhỏ vừa kể trên. Một điều thú vị là mạng quá to thì chỉ học vẹt còn
mạng nhỏ thì mới dễ học các quy luật hơn, nên các mạng này đặc biệt quan trọng
với những vấn đề liên quan đến vật lý hay logic.
Nhưng mạng cố định về cấu trúc
thì khó học, mà mạng phải được phép thay đổi cấu trúc (như trong não động vật,
phải cho phép các tế bào thần kinh và các đường dây nối chúng sinh ra và mất
đi) thì mới dễ học được các qui luật. Cách học và cách tạo mạng thần kinh của
các mạng tiết kiệm này bởi vậy cũng khác các mạng như kiểu mạng tích chập (CNN)
hay mạng Transformer (dùng trong chatGPT) phổ biến hiện tại.
Ngoài ra còn nhiều xu hướng mới
khác trong AI, mà các trung tâm nghiên cứu phát triển AI ở Việt Nam cũng như
trên thế giới cần nắm bắt.
Hợp tác và mã nguồn
mở
Khi nguồn lực còn hạn chế, hợp
tác là điều kiện để tồn tại và đi nhanh hơn.
Ví dụ, về dữ liệu cho AI học,
đừng kỳ vọng rằng chỉ cần dữ liệu do một cơ sở nào đó (ví dụ như một bệnh viện)
sinh ra là đủ để làm một AI tốt. Muốn có AI tốt thì cần dữ liệu rất phong phú,
đa dạng, từ nhiều nguồn khác nhau. Mỗi nơi có một ít dữ liệu mà cứ dữ khư khư sợ
"mất của" như hiện tại thì không kết hợp được các dữ liệu đó thành một
kho dữ liệu đủ lớn, đủ phong phú. Nhưng tất nhiên chia sẻ dữ liệu phải đi cùng
với cơ chế tốt để các bên không cảm thấy bị thiệt thòi.
Có lần tôi nói chuyện với một
bác sĩ, tích lũy cả đời được khoảng 20.000 dữ liệu, và nghĩ là như thế là đủ huấn
luyện AI chẩn đoán bệnh. Tuy con số 20 nghìn dữ liệu là rất lớn so với cá nhân,
nhưng so với thế giới thì chỉ là muối bỏ bể, và AI trong lĩnh vực của bác sĩ cần
đến hàng triệu dữ liệu để huấn luyện.
Về mặt thuật toán, mã nguồn mở
là một cách hợp tác tốt nhất để phát triển nhanh. Mã nguồn mở tạo được niềm tin
cao hơn là mã nguồn đóng, thu hút được nhiều người quan tâm phát triển và nhiều
người dùng hơn, tạo nên hệ sinh thái tốt hơn, đem lại nhiều giá trị cho xã hội
hơn và nhờ vậy cũng đem lại nhiều giá trị cho người tạo ra sản phẩm hơn. Chính
phủ nên có các chính sách nhằm khuyến khích mã nguồn mở.
Khuyến khích mạng phi tập
trung cũng có nghĩa là nên khuyến khích nhiều công ty, tổ chức, cá nhân tham
gia vào hạ tầng AI chứ không nên chỉ trông cậy vào vài 'ông lớn'.
— Nguyễn Tiến Dũng
Trung Quốc rất chú trọng áp dụng
mã nguồn mở trong cuộc cạnh tranh với Mỹ về AI. Công ty khởi nghiệp Mistral ở
Pháp cạnh tranh với OpenAI cũng đi theo hướng mã nguồn mở, cũng đã có giá trị
hàng tỷ đô la, và thu tiền chủ yếu từ dịch vụ cho các tổ chức cần chủ quyền cao
về AI.
Hạ tầng cho AI
Khi nói đến hạ tầng cơ sở cho
AI, người ta hay nói đến các trung tâm điện toán đám mây hiệu suất cao và trung
tâm dữ liệu. Trong dự thảo luật về AI của chính phủ năm 2025 cũng nhấn mạnh ưu
tiên điện toán đám mây, là các trung tâm tính toán dùng nhiều GPU, tức là các bộ
"vi xử lý hình ảnh" mà tác dụng chính nằm ở khả năng tính toán song
song rất nhiều phép tính cùng một lúc của chúng.
Không nên mua ngay quá nhiều bộ
vi xử lý GPU như kiểu của NVIDIA làm gì, cần đến đâu mua đến đấy thôi, bởi vì sắp
tới sẽ xuất hiện nhiều bộ vi xử lý song song khác nữa, ví dụ như kiểu TPU
(tensor processing unit), mạnh hơn và rẻ hơn, hoặc thậm chí tương lai còn hứa hẹn
những máy tính lượng tử nhanh gấp bội lần.
Nói đến hạ tầng cơ sở cho điện
toán và AI, chúng ta không nên quên sức mạnh của tính toán phi tập
trung (distributed computing): nhiều trung tâm máy tính nhỏ nằm ở nhiều
nơi nối vào với nhau có thể tạo thành hệ thống mạnh hơn và an toàn hơn là một
vài trung tâm lớn quá tập trung. Điều này thế giới đã nhận thấy khi xảy ra những
sự cố sập mạng dẫn đến phần lớn các khách hàng của AWS hay Google Cloud bị mất
dịch vụ trong khi những mạng lưới phi tập trung vẫn hoạt động tốt.
Khuyến khích mạng phi tập
trung cũng có nghĩa là nên khuyến khích nhiều công ty, tổ chức, cá nhân tham
gia vào hạ tầng AI chứ không nên chỉ trông cậy vào vài "ông lớn".
Tương tự như vấn đề năng lượng: một mạng điện phi tập trung với nhiều nguồn
phát rải rác khắp nơi sẽ không những giảm thiểu tiêu tốn điện trên đường tải mà
còn đỡ rủi ro mất điện hơn là một mạng quá tập trung.
Có một điểm rất quan trọng
khác không thể coi nhẹ, đó là hệ thống truyền tin, tức là hệ thống
telecom. Tầm quan trọng của nó cũng tương tự tầm quan trọng của hệ thống giao
thông trong nền kinh tế nói chung.
Trong nhiều vấn đề thực tế
dùng AI trên "đám mây", nút thắt cổ chai không nằm ở bản thân AI trên
đám mây mà là ở đường tải: thời gian để tải dữ liệu từ người dùng lên đám mây,
đặc biệt là những dữ liệu có dung lượng lớn như phim ảnh, lớn gấp nhiều lần thời
gian mà AI xử lý dữ liệu đó. Mấu chốt để tăng tiện ích cho người sử dụng khi đó
là làm sao tăng được vận tốc đường truyền.
Thế giới phát triển nhiều giải
pháp cho đường truyền cao tốc, từ cáp quang cho đến 5G/6G cho đến hệ thống vệ
tinh tầng thấp như là Starlink, và gần đây hơn là các khinh khí cầu truyền tin
(communication balloons) hứa hẹn nhanh và rẻ hơn các hệ thống phi tuyến khác.
Tốc độ truyền tải càng nhanh
thì AI đám mây càng trở nên tiện lợi, càng có nhiều ứng dụng AI trở nên hữu
ích, và sẽ càng thu hút được nhiều tài năng về AI đến Việt Nam làm việc.
Cách mạng AI sẽ
thay đổi căn bản giáo dục
Cuộc cách mạng AI sẽ không thể
thành công nếu không đi kèm một cuộc cách mạng giáo dục. Chúng ta đang bước vào
thời đại Giáo dục 4.0.
Giáo dục 1.0 là thời cổ xưa
không có trường lớp, chỉ có con nhà giàu mới có gia sư, còn phần lớn nhân dân
là mù chữ.
Giáo dục 2.0 là khi có trường
lớp, sách in, và hầu hết trẻ em được đi học.
Giáo dục 3.0 là khi có thể học
online, ngồi ở Huế mà nghe bài giảng ở Stanford nhờ có internet, lượng kiến thức
và giáo viên tốt mà mọi người có thể tiếp cận lớn hơn nhiều so với khi chưa có
internet.
Giáo dục 4.0 là khi từng bài học,
từng chương trình học đượccá nhân hóađể thích hợp nhất, tốt nhất đối với
từng cá nhân, nhờ có AI. Con người sẽ có điều kiện học nhiều hơn để trở nên hiểu
biết thông tuệ hơn, học mọi lúc mọi nơi, học suốt đời.
Ví dụ, khi một cô giáo giảng
bài cho một lớp học thì sẽ có học sinh hiểu học sinh không, có học sinh thấy
quá khó có học sinh thấy quá dễ, v.v., và cô giáo không thể thích ứng bài giảng
của mình với tất cả các học sinh của cùng một lớp, không có đủ thời gian hướng
dẫn từng học sinh. Nhưng AI có thể giúp cô giáo và học sinh nâng hiệu quả giảng
dạy và học tập lên nhiều lần.
Cuộc cách mạng AI sẽ tất yếu dẫn
đến cuộc cách mạng lớn trong giáo dục, Các học tập, thi cử, lấy chứng chỉ v.v.
sẽ thay đổi hoàn toàn. Không có nghĩa là trường lớp, thầy cô sẽ mất vị trí, mà
chỉ có nghĩa là cách hoạt động sẽ khác đi.
Đối với Việt Nam, đây cũng là
cơ hội lớn để đầu tư phát triển những sản phẩm giải pháp giáo dục dựa trên AI
nhằm phục vụ Việt Nam và toàn thế giới. Thị trường giáo dục thế giới không phải
tính bằng đơn vị tỷ đô, mà là đơn vị ngàn tỷ đô, và phần lớn thị trường đó đang
rộng mở hoặc đang mở ra./
Điều kiện để làm
AI thành công
Các công cụ để chế tạo AI ngày
nay (như là các môi trường luyện AI, hay các mô hình đã học trước –
"pretrained") trên thế giới có sẵn nhiều, ai cũng có thể đem chúng về
dùng, khiến cho nhiều vấn đề AI được cho là dễ quá, cứ dùng các công cụ có sẵn
luyện thêm một chút là giải quyết được. Có những trung tâm dạy nghề quảng cáo
chỉ cần học 3 tháng là làm được AI. Tương tự như khi có máy đánh chữ thì ai
cũng nghĩ mình có thể thành nhà văn.
Trên thực tế, để làm ra những
AI có chất lượng cao và được tin dùng là việc khó, và danh sách những lý do thất
bại thì rất dài:
– Lãnh đạo thiếu khả năng quản
lý, không đủ tầm nhìn
– Làm ra cái rất hay nhưng
không đúng cái thị trường cần
– Sản phẩm không đủ hấp dẫn để
có sức cạnh tranh
– Thiếu kiến thức chuyên ngành
– Nguồn tài chính không đủ, nửa
đường đứt gánh
– Nhân viên thiếu trình độ,
làm không ra sản phẩm
– Mâu thuẫn nội bộ
– Gặp rắc rối về mặt pháp lý
– Bị đối tác quan trọng bỏ rơi
– Phá hoại từ bên ngoài. v.v.
Ai muốn làm AI thành công thì
phải chú ý nhận diện được hết những rủi ro trên.