Dall-E, hệ thống trí tuệ nhân tạo của OpenAI, có thể biến văn bản thành hình ảnh, nhưng bị lo ngại sẽ tạo ra thông tin sai lệch.

Tại OpenAI – một trong những công ty hàng đầu thế giới về trí tuệ nhân tạo, các nhà nghiên cứu đã xây dựng công nghệ cho phép người dùng tạo hình ảnh kỹ thuật số đơn giản bằng cách mô tả những gì bản thân muốn xem. Họ gọi AI đó là Dall-E, kết hợp giữa Wall-E – robot tự hành trong bộ phim hoạt hình cùng tên năm 2008 và Salvador Dalí – một họa sĩ thuộc trường phái siêu thực.

Alex Nichol, một trong những nhà nghiên cứu tại OpenAI, đã trình diễn cách hoạt động của Dall-E. Chẳng hạn, nếu muốn có hình ảnh về ấm trà hình quả bơ, người dùng chỉ cần nhập các từ đó vào và hệ thống sẽ tạo ra 10 ấm trà màu xanh đậm, một số có lỗ và một số không. Hay khi gõ từ khóa “mèo chơi cờ”, hệ thống sẽ tạo hình hai con mèo ở hai bên bàn cờ với 32 quân cờ được xếp ở giữa. Còn khi gõ “gấu bông thổi kèn dưới nước”, một hình ảnh cho thấy những bọt khí nhỏ bay lên từ chiếc kèn hướng lên mặt nước.

Dall-E cho ra hình ảnh với các từ khóa “ấm trà quả bơ”, “chó Shiba đội mũ beret và áo cổ lọ”, “bát súp trông như quái vật bằng len”, “mèo chơi cờ” và “căn phòng đầy cát có piano”.

Cách đây nửa thế kỷ, nhóm bảy nhà nghiên cứu của OpenAI đã xây dựng công cụ có thể xác định các chủ thể trong ảnh số và tạo ra hình ảnh của riêng chúng như hoa, ôtô… Về sau, công ty cải tiến những chức năng khác như ngôn ngữ văn bản, tóm tắt bài báo và kết hợp những công nghệ đó để tạo ra các dạng AI mới. Dall-E chính là kết quả của tiến trình đó, khi có thể kết hợp cả ngôn ngữ lẫn hình ảnh.

“Giờ đây, chúng ta có thể sử dụng nhiều luồng dữ liệu giao nhau để tạo ra công nghệ ngày càng tốt hơn”, Oren Etzioni, Giám đốc điều hành Viện Trí tuệ nhân tạo Allen ở Seattle, cho biết.

Tuy nhiên, công nghệ này hiện chưa hoàn hảo khi hiểu sai và tạo kết quả không mong muốn. Ví dụ với câu lệnh “đặt tháp Eiffel lên mặt trăng”, nó ra kết quả là đặt mặt trăng lên trên tháp. OpenAI đang tiếp tục cải tiến, tinh chỉnh kỹ năng của mạng nơ-ron bằng cách cung cấp một lượng dữ liệu lớn hơn.

Không chỉ tạo ảnh, Dall-E còn có thể chỉnh sửa ảnh nhanh chóng theo yêu cầu. Khi Nichol xóa từ khóa chiếc kèn của gấu bông và yêu cầu cây đàn guitar thay vào đó, hình ảnh xuất hiện ngay lập tức.

Tuy vậy, tính năng này cũng khiến một số chuyên gia cũng bày tỏ lo ngại. Khi được hoàn thiện hơn, nó có thể chỉnh ảnh và lan truyền thông tin sai lệch trên Internet, tiếp tay cho những chiến dịch có chủ đích trên nền tảng trực tuyến.

“Bạn có thể dùng nó cho những việc tốt, nhưng chắc chắn cũng có thể sử dụng vào những mục đích điên rồ, đáng lo ngại khác, như tạo hình ảnh và video sai lệch”, Subbarao Kambhampati, Giáo sư khoa học máy tính tại Đại học bang Arizona, nói.

Hiện OpenAI chưa cho phép người ngoài sử dụng Dall-E. Công ty có kế hoạch mở hệ thống, cung cấp AI này cho người có nhu cầu như họa sĩ, chuyên gia thiết kế đồ họa, người cần chỉnh sửa ảnh số… nhưng có thể chỉ ở quy mô nhỏ. Hệ thống cũng có các bộ lọc ngăn người sử dụng tạo hình ảnh không phù hợp. “Đây không phải là sản phẩm”, Mira Murati, trưởng bộ phận nghiên cứu của OpenAI cho biết. “Mục tiêu là có thể hiểu được những khả năng và hạn chế, trong khi cho phép chúng tôi giảm bớt khối lượng công việc”.

Dù vậy, một số công ty khác trên thế giới cũng có thể sớm tạo ra loại công nghệ tương tự Dall-E để ai cũng có thể tiếp cận. Boris Dayma, nhà nghiên cứu độc lập ở Houston, đã xây dựng và giới thiệu một phiên bản đơn giản hơn của công nghệ này, vốn chỉ dựa vào bài nghiên cứu đầu tiên của hệ thống DallL-E.

“Con người cần biết rằng những hình ảnh họ nhìn thấy có thể không phải là thật”, ông nói.

Trả lời

Email của bạn sẽ không được hiển thị công khai.