Ứng dụng trí tuệ nhân tạo để dịch chữ Nôm sang chữ Quốc ngữ

Thứ năm - 31/08/2023 05:27 0
Một nhóm nghiên cứu gồm 10 giảng viên từ Khoa Công nghệ Thông tin, Đại học Khoa học Tự nhiên và Bộ môn Hán - Nôm, khoa Văn học, Đại học Khoa học Xã hội và Nhân văn (Đại học Quốc gia TP. Hồ Chí Minh) đã thành công xây dựng hệ thống ứng dụng trí tuệ nhân tạo (AI) để chuyển đổi chữ Nôm sang chữ Quốc ngữ. Sử dụng một kho dữ liệu hàng trăm triệu từ, hệ thống này hứa hẹn giúp gìn giữ và hiểu biết sâu hơn về di sản ngôn ngữ Hán - Nôm.
PGS.TS Đinh Điền, Giám đốc Trung tâm ngôn ngữ học tính toán, Đại học Khoa học Tự nhiên, đã thuyết minh và vận hành thị phạm tính năng chuyển đổi tự động từ chữ Nôm sang chữ Quốc ngữ. Ông cho biết ý tưởng về việc xây dựng hệ thống này đã được ấp ủ từ hơn 20 năm trước, tuy nhiên, thời điểm đó thiếu nguồn dữ liệu và mô hình máy học tiên tiến.
Ngày nay, với sự phát triển của trí tuệ nhân tạo và các mô hình học sâu, nhóm nghiên cứu đã phát triển mô hình phiên dịch tự động từ chữ Nôm sang chữ Quốc ngữ. Hệ thống này sử dụng mô hình lai (hybrid) bằng cách kết hợp giữa mô hình máy học dịch thống kê và mô hình máy dịch theo mạng nơron (NMT).
Thông qua việc xây dựng hệ thống trên trang web tools.clc.hcmus.edu.vn, người dùng có khả năng tra cứu và dịch chữ Nôm sang chữ Quốc ngữ. Hệ thống này có khả năng dịch chính xác trên 90% đối với văn bản thuộc lĩnh vực lịch sử, văn học và xã hội. Đối với các văn bản chuyên ngành như y học dân tộc, độ chính xác là 70%. Riêng với truyện Kiều, mô hình có khả năng dịch chính xác lên tới 99%.
Để nâng cao tính ứng dụng và tiện lợi, nhóm nghiên cứu đang phát triển chức năng dịch chữ Nôm trên ảnh chụp. Khi người dùng cung cấp ảnh chứa chữ Nôm, ứng dụng sẽ tự động chuyển thành văn bản tiếng Việt. Mặc dù đang trong giai đoạn thử nghiệm, nhưng mô hình đã cho thấy khả năng nhận dạng chính xác trên 95% với ảnh chữ có chất lượng thấp.
Dự án này không chỉ đơn thuần là một ứng dụng công nghệ, mà còn mang ý nghĩa gìn giữ và phát triển di sản ngôn ngữ Hán - Nôm. Sự đóng góp của cộng đồng thông qua việc cung cấp dữ liệu Hán - Nôm giúp nâng cao hiệu suất và chính xác của mô hình. Đồng thời, ứng dụng này giúp người dân không biết chữ Hán - Nôm vẫn có khả năng hiểu và tra cứu thông tin từ các tư liệu quý mang giá trị lịch sử và văn hóa./.
Phạm Hà (TH)

  Ý kiến bạn đọc

Thống kê truy cập
  • Đang truy cập285
  • Hôm nay29,852
  • Tháng hiện tại568,635
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây