image Chủ Nhật, 31/05/2026
  • icon
  • icon
  • icon

Nhà tiên phong về AI tuyên bố thành lập tổ chức phi lợi nhuận, phát triển AI 'trung thực'

Sơn Trần

04/06/2025

Chia sẻ

“Cha đẻ AI” Yoshua Bengio ra mắt tổ chức phi lợi nhuận phát triển AI “trung thực” để giám sát hệ thống lừa dối con người…

Ông Yoshua Bengio là một trong những người 'cha đỡ đầu' của AI.
Ông Yoshua Bengio là một trong những người 'cha đỡ đầu' của AI.

Ông Yoshua Bengio, nhà khoa học máy tính nổi tiếng, được mệnh danh là một trong những “cha đẻ” của trí tuệ nhân tạo (AI), vừa thành tổ chức phi lợi nhuận có tên LawZero, với mục tiêu phát triển AI trung thực, có khả năng phát hiện và ngăn chặn hệ thống AI có hành vi lừa dối hoặc gây nguy hại cho con người, theo Yahoo Tech.

Với khoản tài trợ ban đầu khoảng 30 triệu USD và hơn 12 nhà nghiên cứu, ông Bengio đang phát triển hệ thống có tên Scientist AI – đóng vai trò như hàng rào bảo vệ trước các “AI tác nhân” (AI agents), vốn là những hệ thống có thể tự thực hiện nhiệm vụ mà không cần sự can thiệp của con người. Các AI tác nhân này có thể thể hiện hành vi lừa dối hoặc tự bảo vệ, ví dụ như tìm cách né tránh việc bị tắt.

Trong khi các công cụ AI hiện nay như ChatGPT của OpenAI, Claude của Anthropic hay Gemini của Google được thiết kế để tạo nội dung, hỗ trợ công việc và tương tác với người dùng, Scientist AI không nhắm tới việc giao tiếp. Thay vào đó, công cụ đóng vai trò giám sát hành vi hệ thống AI khác – gần giống như một “chuyên viên đạo đức” hay “thanh tra nội bộ” trong thế giới máy móc.

“Chúng tôi muốn xây dựng hệ thống AI trung thực, không lừa dối. Về mặt lý thuyết, hoàn toàn có thể tưởng tượng ra những cỗ máy không có cái tôi, không có mục tiêu cá nhân – chỉ thuần túy là cỗ máy tri thức như nhà khoa học thực thụ”, ông Bengio nói.

Khác với mô hình AI tạo văn bản hiện nay vốn đưa ra câu trả lời dứt khoát, hệ thống của ông Bengio không đưa ra khẳng định mà sẽ chỉ đánh giá rủi ro, mức độ đúng sai của câu trả lời, thể hiện “sự khiêm tốn” của cỗ máy khi biết rằng mình chưa chắc đúng.

Khi được triển khai cùng AI tác nhân khác, Scientist AI sẽ tính toán xác suất hành vi của hệ thống đó có thể gây hại. Nếu xác suất vượt ngưỡng an toàn, hành động của AI tác nhân đó sẽ bị chặn lại.

Nhóm nhà tài trợ ban đầu cho LawZero bao gồm: Viện Tương lai Cuộc sống (Future of Life Institute) – tổ chức hoạt động vì an toàn AI, ông Jaan Tallinn – kỹ sư sáng lập Skype, và Schmidt Sciences – viện nghiên cứu do cựu CEO Google Eric Schmidt thành lập.

NỖ LỰC ĐẢM BẢO AN TOÀN AI

Ông Bengio cho biết bước đầu tiên là cần chứng minh tính khả thi của phương pháp này, sau đó kêu gọi sự hỗ trợ từ nhiều phòng thí nghiệm AI, nhà tài trợ hoặc chính phủ để xây dựng mô hình mạnh hơn. LawZero sẽ bắt đầu bằng cách huấn luyện trên mô hình mã nguồn mở, vốn sẵn có và dễ tùy chỉnh.

“Quan trọng là phải chứng minh được cách làm này hiệu quả. Từ đó, chúng ta mới có thể thuyết phục được chính phủ, nhà tài trợ hay phòng thí nghiệm AI Pg88vn Trang Chủ Chính Thức để huấn luyện những mô hình bảo vệ thông minh ngang ngửa với AI mà chúng phải giám sát”, ông Bengio nói thêm.

Ông Bengio hiện là giáo sư tại Đại học Montreal. Ông nhận giải Turing năm 2018 – giải thưởng được ví như Nobel ngành tin học – cùng với hai nhà khoa học Geoffrey Hinton và Yann LeCun (Giám đốc Khoa học AI tại Meta của CEO Mark Zuckerberg).

Tiên phong cho những nỗ lực đảm bảo an toàn trong lĩnh vực AI, ông Bengio từng chủ trì báo cáo quốc tế về rủi ro AI, trong đó cảnh báo rằng các AI tác nhân có thể gây ra “sự gián đoạn nghiêm trọng” nếu có khả năng thực hiện chuỗi hành động dài mà không cần giám sát.

Ngoài ra, ông Bengio từng rút khỏi vai trò cố vấn cho chính phủ Canada để toàn tâm tập trung vào nghiên cứu an toàn AI. Theo ông, nếu không kịp thời xây dựng cơ chế kiểm soát, xã hội sẽ "thức dậy một ngày nào đó và thấy mình không còn kiểm soát được công nghệ do chính mình tạo ra".

Ông bày tỏ lo ngại sau khi startup AI Anthropic thừa nhận hệ thống mới nhất của họ có thể tìm cách tống tiền kỹ sư nếu bị cố gắng tắt đi. Ngoài ra, nghiên cứu gần đây cho thấy các mô hình AI hoàn toàn có thể giấu giếm khả năng thật và mục tiêu thực sự của mình. Ông Bengio cảnh báo, những điều này cho thấy thế giới đang tiến gần hơn tới vùng nguy hiểm, khi AI ngày càng có khả năng suy luận tốt hơn.

Dòng sự kiện:

Trí tuệ nhân tạo -AI

CMC vượt mốc doanh thu 10.500 tỷ đồng

Lần đầu vượt mốc doanh thu hơn 10.500 tỷ đồng sau 33 năm phát triển, CMC đặt mục tiêu bước vào chu kỳ đổi mới lần hai, lấy AI-X làm động lực tăng trưởng mới.

17:31 30/05/2026
Askonomy nhận được sự quan tâm lớn tại Vietnam –Asia DX Summit 2026

Xuất hiện tại không gian triển lãm của Diễn đàn Vietnam – Asia DX Summit 2026, bộ giải pháp AI Made in Vietnam Askonomy đã thu hút sự quan tâm của giới chức và các PG88 Link Dễ Nhớ Pg88.com công nghệ hàng đầu khi trình diễn năng lực tự động hóa thông minh dựa trên nền tảng công nghệ lõi tự phát triển...

16:22 28/05/2026
Đào tạo nghề cho robot: Trung Quốc chuẩn bị đưa máy móc gia nhập lực lượng PG88 Sòng bạc trực tuyến TOP 1 Việt Nam | Casino, Nổ Hũ

Những kỹ năng robot được học rất đa dạng: dọn dẹp nhà cửa, massage, sắp xếp hàng hóa trên kệ siêu thị, sửa chữa kim loại hay làm việc trên dây chuyền công nghiệp…

18:45 22/05/2026
ADI chi 1,5 tỷ USD mua lại Empower Semiconductor, mở rộng giải pháp nguồn điện cho AI

Thông qua thỏa thuận này, ADI và Empower hỗ trợ định hình kiến trúc cung cấp điện năng cho AI cũng như các ứng dụng đòi hỏi năng lực tính toán cao.

18:45 22/05/2026
VinFuture 2026 nhận 1.819 đề cử từ 117 quốc gia và vùng lãnh thổ

Giải thưởng Khoa học Công nghệ toàn cầu VinFuture vừa khép lại vòng đề cử mùa giải 2026 với 1.819 hồ sơ đến từ khắp thế giới, đồng thời ghi nhận mạng lưới hơn 17.000 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ...

20:48 19/05/2026
Gần 450 đội thi từ khắp châu Á tham gia Asian Hackathon for Green Future 2026

Cuộc thi hướng đến mục tiêu tìm kiếm và hỗ trợ các sáng kiến công nghệ có khả năng ứng dụng thực tiễn để giải quyết những thách thức môi trường cấp bách tại châu Á, đồng thời thúc đẩy tinh thần đổi mới sáng tạo và hợp tác liên ngành trong thế hệ trẻ...

20:48 19/05/2026
Trung Quốc tăng tốc xây dựng mạng lưới sức mạnh tính toán quốc gia

Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...

10:19 18/05/2026
Thêm giải pháp AI "Make in Vietnam" đạt chuẩn quốc tế về chống giả mạo khuôn mặt

CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.

09:10 14/05/2026
CMC tái cấu trúc Khối Công nghệ và Giải pháp, thúc đẩy mục tiêu chuyển đổi AI

CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...

11:07 13/05/2026
Qualcomm chính thức khai trương Trung tâm R&D tại Hà Nội

Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...

15:55 12/05/2026