1/ Thông tin bài báo
- Tên bài báo: XÁC ĐỊNH MÓN ĂN ĐẶC SẢN VIỆT NAM VỚI SỰ KẾT HỢP CỦA MẠNG HỌC SÂU VÀ BẢN THỂ HỌC
- Tác giả: Mã Trường Thành, Châu Ngân Khánh, Thạch Minh Hớn, Phạm Xuân Hiền, Phan Bích Chung
- Số trang: 93-101
- Năm: 2023
- Nơi xuất bản: Tạp chí Khoa học Đại học Cần Thơ
- Từ khoá: Ẩm thực, bản thể học, mạng học sâu, mô tả logic, trí tuệ nhân tạo
2/ Nội dung chính
Bài báo này trình bày một nghiên cứu về việc ứng dụng trí tuệ nhân tạo (AI), đặc biệt là mạng học sâu và bản thể học, để xác định và cung cấp thông tin chi tiết về các món ăn đặc sản Việt Nam, tập trung vào khu vực Đồng bằng sông Cửu Long. Nghiên cứu nhận thấy rằng, mặc dù có nhiều nghiên cứu về phân loại hình ảnh thực phẩm, nhưng lại thiếu các ứng dụng AI toàn diện, kết hợp cả phân loại hình ảnh và thông tin chi tiết của từng món ăn, đặc biệt là trong bối cảnh văn hóa ẩm thực đa dạng của Việt Nam. Do đó, bài báo đề xuất một khung AI mới, bao gồm: một bản thể luận (ontology) để lưu trữ thông tin chi tiết về các món ăn, một mô hình phân loại hình ảnh sử dụng mạng tích chập sâu (CNN), và một hệ thống truy vấn thông tin dựa trên bản thể luận. Mục tiêu là cung cấp một công cụ hữu ích cho du khách và những người quan tâm đến ẩm thực Việt Nam, giúp họ không chỉ nhận biết món ăn qua hình ảnh mà còn hiểu rõ hơn về nguồn gốc, cách chế biến, nguyên liệu, và các thông tin liên quan khác.
Để đạt được mục tiêu trên, các tác giả đã xây dựng một bộ dữ liệu hình ảnh gồm 5331 ảnh của 22 món ăn đặc sản khu vực Tây Nam Bộ, thu thập từ internet và sàng lọc để đảm bảo chất lượng. Bên cạnh đó, một bản thể luận về ẩm thực Việt Nam cũng được thiết kế bằng công cụ Protegé, với 124 khái niệm và 565 tiên đề, cho phép lưu trữ và quản lý thông tin về các món ăn một cách có cấu trúc. Mô hình phân loại hình ảnh được xây dựng dựa trên mạng nơ-ron tích chập sâu (CNN) với kiến trúc LeNet, đạt độ chính xác trên 96% trong việc nhận diện món ăn từ hình ảnh đầu vào. Hệ thống hoạt động theo quy trình ba bước: phân loại hình ảnh món ăn bằng CNN, nhận diện món ăn chính xác bằng cách kết hợp kết quả phân loại với thông tin vị trí và truy vấn bản thể luận, sau đó cung cấp thông tin chi tiết về món ăn cho người dùng thông qua giao diện.
Kết quả thực nghiệm cho thấy hệ thống hoạt động hiệu quả, đạt được độ chính xác cao trong việc phân loại hình ảnh món ăn và cung cấp thông tin chi tiết, hữu ích từ bản thể luận. Nghiên cứu cũng chỉ ra rằng, việc kết hợp thông tin vị trí và thông tin từ bản thể luận giúp cải thiện độ chính xác của việc nhận diện món ăn. Mặc dù vẫn còn một số hạn chế như sự sai lệch về số lượng ảnh của từng món ăn trong bộ dữ liệu huấn luyện và sự tương đồng về hình dạng, màu sắc giữa một số món ăn, nhưng nhìn chung, hệ thống đã chứng minh được tiềm năng trong việc ứng dụng AI để bảo tồn và quảng bá văn hóa ẩm thực Việt Nam. Trong tương lai, các tác giả dự định sẽ mở rộng phạm vi nghiên cứu, phát triển một hệ thống đa ngôn ngữ và tích hợp thêm nhiều thông tin chi tiết hơn về các món ăn truyền thống Việt Nam. Đồng thời, hệ thống thu thập hình ảnh từ khách du lịch cũng được xem xét để cải thiện chất lượng dữ liệu.