1/ Thông tin bài báo
- Tên bài báo: GIẢI PHÁP QUY HOẠCH QUẢN LÝ DỮ LIỆU HỖ TRỢ NÔNG NGHIỆP THÔNG MINH
- Tác giả: Trương Xuân Việt, Nguyễn Hoàng Việt, Lê Hoàng Thảo, Cù Vĩnh Lộc, Trần Hoàng Việt, Lê Thành Phiêu, Nguyễn Hiếu Trung
- Số trang: 30-41
- Năm: 2021
- Nơi xuất bản: Tạp chí Khoa học Trường Đại học Cần Thơ
- Từ khoá: Quy hoạch quản lý dữ liệu, data stewardship, nguyên lý FAIR, quản trị dữ liệu, chuẩn OGC, domain-based web service, web features service, kho dữ liệu, dữ liệu lớn
2/ Nội dung chính
Bài báo này tập trung vào việc phân tích thực trạng quản lý dữ liệu trong lĩnh vực nông nghiệp ở Việt Nam, đặc biệt là khu vực Đồng bằng Sông Cửu Long, từ đó đề xuất các giải pháp quy hoạch quản lý dữ liệu dựa trên nguyên lý FAIR (Findable, Accessible, Interoperable, Reusable) nhằm hỗ trợ phát triển nông nghiệp thông minh. Bài viết nhấn mạnh rằng việc đưa ra các quyết định chính xác và kịp thời trong nông nghiệp phụ thuộc rất lớn vào khả năng thu thập, quản lý và chia sẻ các nguồn dữ liệu cần thiết. Tác giả chỉ ra rằng việc thiếu hụt nguồn dữ liệu nghiên cứu nông nghiệp ở Việt Nam xuất phát từ hai nguyên nhân chính: thứ nhất là khả năng quản lý và chia sẻ dữ liệu công còn hạn chế, thứ hai là năng lực khai thác dữ liệu mở của cộng đồng nghiên cứu chưa cao. Do đó, bài báo đề xuất xây dựng một kế hoạch quản lý dữ liệu (DMP) dựa trên các nguyên tắc FAIR, hướng đến việc tạo ra một hệ thống dữ liệu có thể tìm kiếm, truy cập, tương tác và tái sử dụng một cách hiệu quả.
Bài báo phân tích sâu hơn về các khái niệm liên quan đến quản lý dữ liệu, bao gồm quản trị dữ liệu (data governance) và quản lý dữ liệu (data stewardship), đồng thời trình bày chi tiết về các nguyên lý FAIR trong chia sẻ dữ liệu. Tác giả cũng đề cập đến các khái niệm phân loại học (taxonomy), thực thể học (ontology) và dữ liệu liên kết (Linked Data) để làm rõ hơn về cách thức tổ chức dữ liệu một cách hệ thống và có khả năng tương tác cao. Bên cạnh đó, bài viết cũng xem xét vai trò của dữ liệu trong nông nghiệp thông minh, phân loại các nguồn dữ liệu nông nghiệp thành ba nhóm chính: dữ liệu về điều kiện tự nhiên và quy hoạch, dữ liệu về sản xuất và canh tác, và dữ liệu về thị trường. Tác giả cũng đưa ra quy trình phân tích dữ liệu thông minh và chỉ rõ tầm quan trọng của hai bước xác định nguồn dữ liệu và thu thập, chuẩn bị dữ liệu, đồng thời nhấn mạnh rằng để đảm bảo tính chính xác và hiệu quả của quy trình này, cần áp dụng các nguyên tắc FAIR trong quản lý dữ liệu.
Trên cơ sở đánh giá thực trạng quản lý dữ liệu tại Việt Nam, bài báo đề xuất một mô hình quy hoạch quản lý dữ liệu (DMP) áp dụng cho hai khối cơ quan chức năng: khối chính phủ và khối nghiên cứu, học thuật. Mô hình đề xuất này bao gồm các nhóm công nghệ máy chủ và nhóm công nghệ ứng dụng. Nhóm công nghệ máy chủ bao gồm các dịch vụ web chuẩn REST, cơ chế OLAP và các hệ truy vấn dữ liệu Impala/Hive. Nhóm công nghệ ứng dụng tập trung vào ba loại dịch vụ: dịch vụ dữ liệu không gian (sử dụng chuẩn OGC và phần mềm GeoServer), dịch vụ dữ liệu phi không gian (sử dụng các nền tảng Dataverse và Ckan) và dịch vụ dữ liệu ấn phẩm khoa học (sử dụng nền tảng OJS). Bài viết cũng khuyến nghị việc phân loại dữ liệu thành ba nhóm (điều kiện tự nhiên, sản xuất canh tác, thị trường) để quản lý và kết nối hiệu quả hơn. Cuối cùng, bài báo kết luận và đưa ra các kiến nghị cụ thể đối với Trường Đại học Cần Thơ, khuyến khích nhà trường đóng vai trò tiên phong trong việc triển khai DMP và áp dụng nguyên tắc FAIR trong các hoạt động nghiên cứu và chia sẻ dữ liệu.