Ứng dụng AI trong quan trắc và dự báo ô nhiễm không khí tại Việt Nam

Sự phát triển của công nghệ, kỹ thuật cùng với quá trình đô thị hóa đã mang tới cho cuộc sống con người sự tiện lợi hơn bao giờ hết. Tuy vậy, nó cũng gây ra những hệ lụy khôn lường, không chỉ cho hiện tại mà còn cho tương lai con cháu chúng ta. Đối với Việt Nam, cũng như nhiều nước phát triển khác trên thế giới, “ô nhiễm” bao gồm ô nhiễm không khí, nguồn nước, thực phẩm, tiếng ồn, v.v. là một trong những vấn đề nan giải, được nói tới đã nhiều năm nay. Bài viết này tập trung vào vấn đề ô nhiễm không khí (viết tắt ONKK), mà cụ thể là việc áp dụng các công nghệ cao vào việc quan trắc và dự báo ONKK.

Ô nhiễm không khí và các hệ thống quan trắc

Trong số các loại ô nhiễm, có lẽ ONKK là thứ chúng ta dễ nhận thấy và dễ cảm nhận nhất. Hầu hết chúng ta đều có thể nhìn thấy, cảm nhận được tình trạng ONKK ở các thành phố lớn của Việt Nam, hàng ngày, hàng giờ. Một cách trực quan, chúng ta đã và đang trải nghiệm tình trạng khói bụi trên khắp các nẻo đường, con phố của các thành phố lớn. Mong ước nhìn thấy bầu trời cao xanh vời vợi trở nên xa xỉ đối với người dân ở những thành phố lớn. Tổ chức Y tế Thế giới (WHO) ước tính, ONKK bên ngoài là nguyên nhân gây ra khoảng 4,2 triệu ca tử vong sớm mỗi năm trên toàn cầu, chủ yếu do các bệnh tim mạch, hô hấp và ung thư [1, 2]. Từ những thực trạng trên đây, có thể thấy rằng việc xây dựng các hệ thống theo dõi các chỉ số ONKK, và xa hơn nữa là dự báo ONKK hay phân tích các nguồn gây ONKK để tìm ra các giải pháp, chính sách can thiệp nhằm giảm thiểu ONKK là một trong những nhu cầu cấp thiết. Hoạt động quan trắc chất lượng không khí để cảnh báo tình trạng ONKK bao gồm hệ thống quan trắc thủ công và hệ thống quan trắc tự động liên tục.

Hệ thống quan trắc tự động liên tục chủ yếu dựa vào các trạm quan trắc cố định truyền thống để đo nồng độ các chất gây ô nhiễm như bụi mịn (PM2.5), PM10, CO, NO2, và SO2, O3 và các thông số khác (PM: particulate matter – vật chất dạng hạt) [3]. Tuy nhiên, hệ thống truyền thống thường có độ phủ không gian thấp cũng như có chi phí lắp đặt và vận hành cao. Để khắc phục các hạn chế này, nhiều nghiên cứu về mô hình đã được phát triển. Tại Việt Nam, hệ thống quan trắc ONKK vẫn đang được hoàn thiện với độ phủ về không gian cũng như thời gian thấp do các khó khăn về nguồn lực và kỹ thuật. Phần lớn các nghiên cứu của Việt Nam vẫn sử dụng những công thức đơn giản, với nhiều hệ số được dựa trên kinh nghiệm của các chuyên gia. Điều này đã làm chậm tốc độ nghiên cứu cũng như trong một số trường hợp làm giảm độ chính xác của các kết quả, dẫn tới hạn chế trong việc hình dung bức tranh tổng thể của ONKK cũng như hiểu rõ cơ chế của các vấn đề ô nhiễm phức tạp. Mặc dù đã có một số nghiên cứu ứng dụng trí tuệ nhân tạo trong việc quan trắc và dự báo ONKK, nhưng phạm vi ứng dụng vẫn còn hạn chế [4].

Từ thực trạng này, câu hỏi đặt ra với các nhà khoa học, là: “liệu chúng ta có thể xây dựng được một hệ thống quan trắc ONKK với độ phủ lớn, mật đồ dày mà không tốn chi phí quá lớn?” Nếu chỉ dựa trên các kỹ thuật truyền thống (tức là sử dụng các trạm quan trắc), rõ ràng bài toán này khó có lời giải. Thật may mắn là với sự tiến bộ của khoa học công nghệ, đặc biệt là sự phát triển vượt bậc của lĩnh vực trí tuệ nhân tạo, bài toán nêu trên không phải là không có giải pháp.

Trí tuệ nhân tạo có thể giúp ích gì cho quan trắc ONKK?

Trước hết, để giảm chi phí thì không có cách nào khác ngoài việc sử dụng các thiết bị có giá thành không quá cao, và giảm thiểu số lượng thiết bị cần lắp đặt. Đối với ý thứ nhất (giảm giá thành của thiết bị), chúng ta có thể sử dụng các thiết bị quan trắc ONKK giá thành thấp sử dụng cảm biến. Giá thành của các thiết bị này chỉ bằng phần trăm hay thậm chí phần nghìn giá thành của các trạm quan trắc truyền thống. Việc lắp đặt chúng lại tương đối đơn giản, không tốn quá nhiều không gian. Tuy vậy, các thiết bị này có một điểm hạn chế rất lớn, đó là độ chính xác không cao. Hơn nữa, cho dù chúng ta giảm được giá thành của một thiết bị, nếu chúng ta muốn có một mạng lưới thiết bị triển khai dày đặc, thì con số thiết bị cũng phải lên tới hàng nghìn, hàng triệu, dẫn tới tổng chi phí lắp đặt và vận hành vẫn là một con số đáng kể.

Vậy, làm thế nào để tăng được độ chính xác của các thiết bị quan trắc giá rẻ, và giảm thiểu được số lượng thiết bị?Câu hỏi này là động lực cho nhóm các nhà nghiên cứu người Việt đến từ Đại học Bách Khoa Hà Nội, Đại học Chiba, Nhật Bản, và Tập đoàn Toshiba, thực hiện đề tài “Fi-Mi: Hệ thống di động quan trắc và dự đoán chất lượng không khí ứng dụng trí tuệ nhân tạo” dưới sự tài trợ của Quỹ Đổi mới sáng tạo Vingroup (VinIF). Với hệ thống Fi-Mi, nhóm nghiên cứu ứng dụng trí tuệ nhân tạo nhằm giải quyết hai bài toán chính: 1) Tự động hiệu chỉnh các dữ liệu thu thập bởi các thiết bị quan trắc giá rẻ, nhằm tăng độ chính xác của dữ liệu; 2) Dự đoán dữ liệu quan trắc theo không-thời gian, nhằm xây dựng một bản đồ chất lượng không khí với độ mịn (fine-grainess) cao, trong khi không cần triển khai quá nhiều thiết bị.

Hình 1 biểu diễn mô hình tổng quan của hệ thống Fi-Mi, với cấu trúc ba tầng: tầng cảm biến, tầng thông tin, và tầng ứng dụng. Chức năng của mỗi tầng như sau: tầng cảm biến bao gồm các thiết bị quan trắc không khí. Các thiết bị này được đặt trên phương tiện giao thông (xe buýt), liên tục thu thập các chỉ số chất lượng không khí và gửi về hệ thống máy chủ; tầng thông tin bao gồm các giao thức truyền tin, đảm nhận việc truyền nhận dữ liệu giữa tầng cảm biến và tầng ứng dụng; tầng ứng dụng bao gồm hệ thống máy chủ có nhiệm vụ xử lý, lưu trữ dữ liệu; hiển thị dữ liệu trực quan hóa cho người dùng; sử dụng các mô hình học máy nhằm dự đoán chất lượng không khí theo không – thời gian.

***Hình 1: Mô hình tổng quan biểu diễn kiến trúc ba tầng của Fi-Mi***

Thiết kế chi tiết của thiết bị Fi-Mi

Các thiết bị quan trắc Fi-Mi có cấu trúc nhỏ gọn, được đặt trên xe buýt di chuyển quanh thành phố nhằm thu thập các chỉ số nhiệt độ, độ ẩm, PM2,5, SO2, NO2, CO. Thiết bị có khả năng giao tiếp với hai loại chuẩn truyền thông không dây là mạng không dây (wifi) và LTE (Long Term Evolution – Tiến hóa dài hạn) để liên tục cập nhật dữ liệu về hệ thống máy chủ theo thời gian thực. Bên cạnh các thông tin về quan trắc không khí và thời tiết, các thiết bị cũng gửi về máy chủ thông tin về độ mạnh/yếu của tín hiệu (RSSI) và vị trí thiết bị thu thập được qua mô-đun GPS. Toàn bộ hoạt động của mỗi thiết bị quan trắc Fi-Mi được điều khiển bởi bộ điều khiển trung tâm MCU. Bộ điều khiển này được lập trình bởi nhóm nghiên cứu tại Đại học Bách Khoa Hà Nội [5]. Thiết bị có cấu trúc nhỏ gọn, linh hoạt với các loại điều kiện môi trường khác nhau, phù hợp lắp đặt trên các xe bus hay ô tô và giá thành rẻ.

Kiểm thử hoạt động của các thiết bị Fi-Mi

Sau khi hoàn thành việc chế tạo thiết bị Fi-Mi, việc kiểm thử hoạt động của thiết bị được tiến hành bằng các hình thức sau: so sánh các số liệu thu thập được bởi thiết bị Fi-Mi với thiết bị tham chiếu là GRIMM 107, được vận hành bởi Viện Khoa học Môi trường – Đại học Bách Khoa Hà Nội. Thời gian thu thập dữ liệu từ 12/2020 đến 2/2021. Dữ liệu thu thập trong quá trình kiểm thử và báo cáo đánh giá độc lập được thực hiện bởi Viện Khoa học Môi trường. Kết quả cho thấy dữ liệu thu thập bởi thiết bị Fi-Mi có độ tin cậy cao, cụ thể: khi đối chiếu kết quả của LCS3 với kết quả của thiết bị tham chiếu, mức độ tuyến tính rất cao thể hiện xu thế biến thiên của hai LCS đánh giá tương đồng với xu thế biến thiên của thiết bị tham chiếu. Mức độ tuyến tính cao hơn nhiều mức khuyến nghị của US-EPA. Mặc dù độ dốc và đoạn chắn của đường tuyến tính của kết quả trung bình 24h không đạt mức khuyến nghị của US-EPA tuy nhiên sai số của kết quả đo (NRMSE) đạt yêu cầu về độ tin cậy. Kết quả đo của LCS có thể cải thiện thêm nếu sử dụng hệ số chuẩn hóa hoặc các phương pháp chuẩn hóa kết quả nâng cao khác.

*Hình 5*. Đồ thị tương quan của nồng độ PM2,5 đo bằng LCS và thiết bị tham chiếu trung bình 1h (a) và trung bình 24h (b) trong toàn bộ thời gian khảo sát

Hiệu chỉnh dữ liệu chất lượng không khí bằng mô hình học sâu

Kết quả thực nghiệm đối sánh với thiết bị mẫu cho thấy dữ liệu thu được từ các thiết bị Fi-Mi có sự sai khác so với các thiết bị mẫu, và sự sai khác này lại có tính phụ thuộc vào từng thiết bị, thể hiện trong Hình 6. Trong hình này, dữ liệu thu thập bởi các thiết bị Fi-Mi được thể hiện bởi các đường màu xanh, và dữ liệu thu thập bởi thiết bị tham chiếu được thể hiện bởi đường màu đỏ. Có thể thấy, các thiết bị Fi-Mi khác nhau cho các chỉ số không khí khác nhau. Vì vây, việc xây dựng một giải pháp hiệu chỉnh hoạt động tốt cho tất cả các thiết bị Fi-Mi không phải là đơn giản.

**Hình 6. Sai số của dữ liệu thu thập bởi các thiết bị Fi-Mi**

Kết quả khảo sát các phương pháp hiệu chỉnh dữ liệu hiện thời (ví dụ sử dụng các mô hình toán học, sử dụng hồi quy tuyến tính, v.v.) cho thấy độ chính xác của các phương pháp này không cao. Vì vậy, một mô hình hiệu chỉnh dữ liệu chất lượng không khí ứng dụng học sâu đã được ứng dụng. Cụ thể, mô hình mới với tên gọi là GAMMA, áp dụng phương pháp học đa nhiệm để giải quyết thách thức xử lý đồng thời dữ liệu của một số thiết bị. GAMMA cũng tận dụng kỹ thuật huấn luyện theo kiểu đối kháng để cải thiện độ chính xác của dữ liệu sau hiệu chỉnh. Kết quả thí nghiệm mô hình GAMMA trên bộ dữ liệu thu thập được từ 5 thiết bị Fi-Mi đã cho thấy GAMMA giảm sai số hiệu chuẩn từ 60,19% tới 74,09% so với các phương pháp tốt nhất hiện hành [6].

***Hình 7. Mô hình học sâu hiệu chỉnh dữ liệu quan trắc ONKK thu thập bởi thiết bị Fi-Mi***

Dự đoán chất lượng không khí bằng các mô hình học sâu

Việc ứng dụng học sâu để giải quyết các bài toán dự đoán không phải là chủ đề mới. Điểm mới trong dự án Fi-Mi là việc tập trung đề xuất các thuật toán tự động lựa chọn các đặc trưng có ích nhất trong bài toán dự đoán chỉ số PM2,5 trong tương lai. Đây cũng là dự án đầu tiên sử dụng học sâu trong dự đoán chỉ số PM2,5, thực hiện trên bộ dữ liệu của Việt Nam, do đó mang tầm quan trọng rất lớn. Các kết quả đánh giá trên bộ dữ liệu chất lượng không khí thu thập tại Hà Nội cho thấy mô hình Encoder – Decoder làm giảm sai số dự đoán 53,7% so với các giải pháp của các nghiên cứu khác. Hơn nữa, việc sử dụng thuật toán tự động lựa chọn đặc trưng đầu vào có thể giúp giảm sai số dự đoán thêm 13,7% so với các thuật toán khác [7].

***Hình 8. Mô hình học sâu ước lượng chất lượng không khí theo không gian***

Không chỉ dừng lại ở bài toán dự đoán chất lượng không khí theo thời gian, một trong những ứng dụng của Fi-Mi là việc nghiên cứu các phương pháp nhằm ước lượng phân bố của chất lượng không khí, tức là sử dụng dữ liệu chất lượng không khí thu được từ các vị trí của thiết bị quan trắc nhằm ước lượng chất lượng không khí tại những nơi không có thiết bị quan trắc. Đây là một bài toán thách thức và chưa được nghiên cứu nhiều, so với bài toán về dự đoán chất lượng không khí trong tương lai. Phần lớn các nghiên cứu trước đây sử dụng các phương pháp đơn giản như nội suy dựa trên khoảng cách để giải quyết bài toán dự đoán theo không gian. Tuy nhiên, phương pháp này cho độ chính xác không cao. Dự án Fi-Mi xây dựng mô hình học sâu, sử dụng mạng nơ-ron đồ thị để biểu diễn mối quan hệ về mặt không gian giữa các trạm quan trắc. Bên cạnh đó, sự kết hợp các thông tin về khí tượng, đặc biệt là gió, nhằm tăng độ chính xác cho việc dự đoán cũng là một điểm mạnh của Fi-Mi. Kết quả của các nghiên cứu thí nghiệm cho thấy, giải pháp của Fi-Mi đã giúp giảm sai số dự đoán từ 4,93% tới 34,88% so với các phương pháp hiện tại.

Hướng đi nào cho tương lai?

Dự án Fi-Mi đã được nghiệm thu vào năm 2023. Sau khi kết thúc dự án, các nhà khoa học tại Đại học Bách Khoa Hà Nội cùng với các nhà nghiên cứu trong cả lĩnh vực Trí tuệ nhân tạo và môi trường hiện vẫn đang tiếp tục theo đuổi các nghiên cứu liên quan, hướng đến việc xây dựng được một hệ thống hoàn chỉnh giúp theo dõi không chỉ các thông số ONKK, mà còn cả các nguồn phát thải gây ONKK, cũng như ảnh hưởng của ONKK tới sức khỏe con người.

Tác giả: PGS.TS. Nguyễn Phi Lê, Đại học Bách khoa Hà Nội.

Biên tập: Quỹ Đổi mới sáng tạo Vingroup (VinIF).

Tài liệu tham khảo
[1]. World Health Organization. (2016). Ambient Air Pollution: A Global Assessment of Exposure and Burden of Disease.
[2]. Kim, Ki-Hyun, Ehsanul Kabir, and Shamin Kabir. “A review on the human health impact of airborne particulate matter,” Environment international 74 (2015): 136-143.
[3]. Vélez-Guerrero, Angela Carolina, Mauro Callejas-Cuervo, and Andrea Catherine Alarcón-Aldana. “The Evolution of Air Quality Monitoring: Measurement Techniques and Instruments,” Journal of Hunan University Natural Sciences 50, no. 5 (2023).
[4]. Nguyen Dinh, Thuan, and Nam Phan Hoang. “Air Pollution Forecasting Using Regression Models and LSTM Deep Learning Models for Vietnam,” In Future Data and Security Engineering. Big Data, Security and Privacy, Smart City and Industry 4.0 Applications: 8th International Conference, FDSE 2021, Virtual Event, November 24–26, 2021, Proceedings 8, pp. 264-275. Springer Singapore, 2021.
[5]. Viet An Nguyen, Viet Hung , Van Sang Doan, Thanh Hung Nguyen, Phan Thuan Do, Kien Nguyen, Phi Le Nguyen, Minh Thuy Le, “Realizing Mobile Air Quality Monitoring System: Architectural Concept and Device Prototype”, Asia Pacific Conference on Communications (APCC 2021).
[6]. Nguyen, Anh Duy, Thu Hang Phung, Thuy Dung Nguyen, Huy Hieu Pham, Kien Nguyen, and Phi Le Nguyen. “GAMMA: A universal model for calibrating sensory data of multiple low-cost air monitoring devices,” Engineering Applications of Artificial Intelligence 128 (2024): 107591.
[7]. Nguyen Minh Hieu, Phi Le Nguyen, Kien Nguyen, Thanh-Hung Nguyen, and Yusheng Ji. “PM2. 5 prediction using genetic algorithm-based feature selection and encoder-decoder model.” IEEE Access 9 (2021): 57338-57350.
[8]. Viet Hung Vu, Duc Long Nguyen, Thanh Hung Nguyen, Nguyen Quoc Viet Hung, Phi Le Nguyen, and Huynh Thanh Trung, “Self-supervised air quality estimation with graph neural network assistance and attention enhancement,” Neural Computing and Applications Journal (NCAA), 2024.

TIN LIÊN QUAN

BÀI MỚI NHẤT

BÀI ĐỌC NHIỀU

Nghiên cứu

Sản phẩm

Blog

Tin tức

Vingroup Big Data Institute

Đăng ký để nhận email