SỞ KHOA HỌC & CÔNG NGHỆ NGHỆ AN

CỔNG THÔNG TIN ĐIỆN TỬ

SỞ KHOA HỌC & CÔNG NGHỆ NGHỆ AN

Nghiên cứu công nghệ AI chuyển văn bản thành hình ảnh

Thứ hai - 17/10/2022 22:53 0

TS. Lương Minh Thắng cùng 10 chuyên gia tại Google Brain đang Nghiên cứu công nghệ AI chuyển văn bản thành hình ảnh, xây dựng mô hình Parti, dạy cho trí tuệ nhân tạo có thể vẽ tranh dựa trên từ ngữ mô tả.

TS. Lương Minh Thắng

Là người Việt duy nhất trong nhóm nghiên cứu chủ chốt về mô hình Parti (Pathways Autoregressive Text-to-Image) - tự chuyển văn bản thành hình ảnh tại Google Brain đầu năm 2021, TS. Lương Minh Thắng cho biết ngôn ngữ thường dùng trong giao tiếp của con người, nhưng nếu ứng dụng công nghệ để tạo ra các bức ảnh, tranh sáng tạo thì có thể coi là bước tiến mới của AI. Các mô hình AI hiện nay ứng dụng trong ngôn ngữ thông qua mô hình chatbot có thể tương tác với con người bằng văn bản. Còn trong lĩnh vực hình ảnh, AI có thể nhận diện các vật thể trong ảnh. Nếu kết hợp hai thứ này để chuyển hóa từ ngôn ngữ dạng văn bản thành hình ảnh sẽ tạo ra một mô hình AI rất hiện đại, hỗ trợ đắc lực cho con người trong lĩnh vực sáng tạo hình ảnh. Đây cũng là ý tương mà TS Lương Minh Thắng mong muốn được nghiên cứu thông qua mô hình Parti của anh và cộng sự.

Cụ thể, mô hình Parti cho phép tạo hình ảnh đúng như mô tả và mong muốn của người dùng. Công nghệ này có thể hỗ trợ những người chuyên làm công việc sáng tạo hình ảnh như nghệ sĩ, nhiếp ảnh gia, nhà thiết kế thời trang, đồ họa... Khi họ có ý tưởng về một bức ảnh, chỉ cần viết các chi tiết mong muốn, AI sẽ phân tích và cho ra bức ảnh gợi ý cho ý tưởng đó giúp họ tăng khả năng sáng tạo. Chỉ cần thay đổi một câu, từ, hay chi tiết trong văn bản có thể cho ra bức ảnh khác nhau.

TS. Lương Minh Thắng cùng các chuyên gia tại Google Brain đã sử dụng hàng trăm triệu cặp dữ liệu văn bản - hình ảnh tương ứng, huấn luyện cho mô hình AI. Dữ liệu được sử dụng từ các website, xử lý bằng mạng nơ-ron nhân tạo có dung lượng khoảng 20 tỷ nơ-ron. "Dựa trên những dữ liệu văn bản và hình ảnh, AI sẽ kết hợp lại để tạo ra một bức ảnh mới, giúp con người có những ý tưởng mới. Các chủ đề được mô hình Parti thể hiện nhiều nhất về thiên nhiên, động vật, đồ vật, cảnh vật... Trên website của Google Reseach giới thiệu nhiều hình ảnh được tạo từ AI như ảnh thật có thể được tham khảo với người dùng”.

Vấn đề lớn hiện này là với những văn bản quá dài, mô tả quá nhiều chi tiết, hay mô tả những hình ảnh có tính xung đột (như biển đặt cạnh sa mạc) thì AI có thể hiểu sai hoặc không cho ra kết quả. Do vậy, nhóm nghiên cứu sẽ khắc phục hạn chế này để xây dựng mô hình AI hoàn thiện. Bên cạnh đó, với những hình ảnh liên quan đến con người cần được xử lý cẩn trọng dựa trên nguyên tắc không gây ảnh hưởng tiêu cực đến cá nhân, cộng đồng, giới tính, sắc tộc...

TS. Lương Minh Thắng là tiến sĩ khoa học trẻ có tầm ảnh hưởng ở Google Brain, một bộ phận chuyên nghiên cứu về trí tuệ nhân tạo của Google. Với chuyên môn là ngôn ngữ tự nhiên và học sâu cùng hơn 20 đề tài nghiên cứu khoa học, đã giúp trình dịch thuật của Google trở nên chính xác hơn, giúp máy tính hiểu rõ hơn ngôn ngữ con người, đồng thời phát triển mô hình máy tự học.

Năm 2018, TS. Lương Minh Thắng được Forbes bình chọn vào top 30 người dưới 30 tuổi.

P.A.T (Tổng hợp)

Nguồn tin: www.vista.gov.vn

Tags: nghiên cứu, công nghệ, trí tuệ, xây dựng, mô hình, chuyên gia, thành hình

Ý kiến bạn đọc

Bạn cần đăng nhập với tư cách là Thành viên chính thức để có thể bình luận

Những tin mới hơn
Những tin cũ hơn
Tin liên quan

Danh mục

KHXHNV

Liên kết Website

Thống kê truy cập

Đang truy cập807
Hôm nay37,566
Tháng hiện tại1,017,240

EmagazineEmagazine

Bộ thủ tục hành chínhBộ thủ tục hành chính

Đường dây nóng - HotlineSĐT: 0238.3837448

Video thiết bị - công nghệVideo thiết bị - công nghệ

Nghiên cứu công nghệ AI chuyển văn bản thành hình ảnh

Nghiên cứu, thiết kế, chế tạo hệ thống lái tự động tàu thủy áp dụng phương pháp điều khiển thích nghi

Nghiên cứu chế tạo giáo cụ trực quan phục vụ giảng dạy STEM bằng công nghệ in 3D

Nghiên cứu và phát triển phần mềm tích hợp thông tin định vị, giám sát hành trình, xác định vận tốc, hướng lái cho các phương tiện thủy nội địa

Nghiên cứu công nghệ sản xuất tất mùa hè và tất thể thao từ sợi mộc có tính kháng khuẩn và khử mùi

Nghiên cứu ứng dụng công nghệ sinh học để chế biến và nâng cao hiệu quả kinh tế các sản phẩm từ dong đao làng nghề

Hoàn thiện quy trình sản xuất giống và nuôi thương phẩm giun nhiều tơ Perinereis nuntia var. brevicirris (Grube, 1857) quy mô hàng hóa làm thức ăn nuôi vỗ tôm bố mẹ

Nghiên cứu chế tạo vắc xin tái tổ hợp phòng bệnh tụ huyết trùng (Pasteurella multocida) ở lợn

Nghiên cứu chọn tạo giống khoai tây phục vụ chế biến và ăn tươi đạt năng suất cao

Nhà khoa học Việt tìm ra chất ức chế tế bào ung thư máu từ gạo

Tìm thấy vi khuẩn giúp giảm tác hại của thuốc lá

Sàng lọc do AI hướng dẫn sử dụng dữ liệu điện tâm đồ để phát hiện yếu tố nguy cơ tiềm ẩn gây đột quỵ

Các đại thực bào cư trú ở thận có các quần thể con riêng biệt và chiếm cứ các môi trường vi mô riêng biệt

Phát triển thành công viên nang robot cung cấp thuốc đến ruột

Đánh giá của nhiều nghiên cứu cho thấy hydro không phải là một lựa chọn tốt để sưởi ấm nhà

Lớp sơn trắng nhất thế giới đủ mỏng để phủ lên ô tô và máy bay

Hai khám phá mới làm sáng tỏ bí ẩn về cách các tế bào quản lý căng thẳng

Thử nghiệm mới tìm thấy loại thuốc Alzheimer đầu tiên giúp làm chậm quá trình suy giảm nhận thức

Nghiên cứu mới có thể giúp các công ty điện lực giải quyết vấn đề biến đổi khí hậu

Dụng cụ cho phép điều khiển thiết bị điện tử bằng lực cắn

Phát triển thành công 'lá nhân tạo' có khả năng tạo ra năng lượng sạch