Trang chủ Chuyên gia viết Ứng dụng AI trong quan trắc và dự báo ô nhiễm không...

Ứng dụng AI trong quan trắc và dự báo ô nhiễm không khí tại Việt Nam

Sự phát triển của công nghệ, kỹ thuật cùng với quá trình đô thị hóa đã mang tới cho cuộc sống con người sự tiện lợi hơn bao giờ hết. Tuy vậy, nó cũng gây ra những hệ lụy khôn lường, không chỉ cho hiện tại mà còn cho tương lai con cháu chúng ta. Đối với Việt Nam, cũng như nhiều nước phát triển khác trên thế giới, “ô nhiễm” bao gồm ô nhiễm không khí, nguồn nước, thực phẩm, tiếng ồn, v.v. là một trong những vấn đề nan giải, được nói tới đã nhiều năm nay. Bài viết này tập trung vào vấn đề ô nhiễm không khí (viết tắt ONKK), mà cụ thể là việc áp dụng các công nghệ cao vào việc quan trắc và dự báo ONKK.

Ô nhiễm không khí và các hệ thống quan trắc

Trong số các loại ô nhiễm, có lẽ ONKK là thứ chúng ta dễ nhận thấy và dễ cảm nhận nhất. Hầu hết chúng ta đều có thể nhìn thấy, cảm nhận được tình trạng ONKK ở các thành phố lớn của Việt Nam, hàng ngày, hàng giờ. Một cách trực quan, chúng ta đã và đang trải nghiệm tình trạng khói bụi trên khắp các nẻo đường, con phố của các thành phố lớn. Mong ước nhìn thấy bầu trời cao xanh vời vợi trở nên xa xỉ đối với người dân ở những thành phố lớn. Tổ chức Y tế Thế giới (WHO) ước tính, ONKK bên ngoài là nguyên nhân gây ra khoảng 4,2 triệu ca tử vong sớm mỗi năm trên toàn cầu, chủ yếu do các bệnh tim mạch, hô hấp và ung thư [1, 2]. Từ những thực trạng trên đây, có thể thấy rằng việc xây dựng các hệ thống theo dõi các chỉ số ONKK, và xa hơn nữa là dự báo ONKK hay phân tích các nguồn gây ONKK để tìm ra các giải pháp, chính sách can thiệp nhằm giảm thiểu ONKK là một trong những nhu cầu cấp thiết. Hoạt động quan trắc chất lượng không khí để cảnh báo tình trạng ONKK bao gồm hệ thống quan trắc thủ công và hệ thống quan trắc tự động liên tục.

Hệ thống quan trắc tự động liên tục chủ yếu dựa vào các trạm quan trắc cố định truyền thống để đo nồng độ các chất gây ô nhiễm như bụi mịn (PM2.5), PM10, CO, NO2, và SO2, O3 và các thông số khác (PM: particulate matter – vật chất dạng hạt) [3]. Tuy nhiên, hệ thống truyền thống thường có độ phủ không gian thấp cũng như có chi phí lắp đặt và vận hành cao. Để khắc phục các hạn chế này, nhiều nghiên cứu về mô hình đã được phát triển. Tại Việt Nam, hệ thống quan trắc ONKK vẫn đang được hoàn thiện với độ phủ về không gian cũng như thời gian thấp do các khó khăn về nguồn lực và kỹ thuật. Phần lớn các nghiên cứu của Việt Nam vẫn sử dụng những công thức đơn giản, với nhiều hệ số được dựa trên kinh nghiệm của các chuyên gia. Điều này đã làm chậm tốc độ nghiên cứu cũng như trong một số trường hợp làm giảm độ chính xác của các kết quả, dẫn tới hạn chế trong việc hình dung bức tranh tổng thể của ONKK cũng như hiểu rõ cơ chế của các vấn đề ô nhiễm phức tạp. Mặc dù đã có một số nghiên cứu ứng dụng trí tuệ nhân tạo trong việc quan trắc và dự báo ONKK, nhưng phạm vi ứng dụng vẫn còn hạn chế [4].

Từ thực trạng này, câu hỏi đặt ra với các nhà khoa học, là: “liệu chúng ta có thể xây dựng được một hệ thống quan trắc ONKK với độ phủ lớn, mật đồ dày mà không tốn chi phí quá lớn?” Nếu chỉ dựa trên các kỹ thuật truyền thống (tức là sử dụng các trạm quan trắc), rõ ràng bài toán này khó có lời giải. Thật may mắn là với sự tiến bộ của khoa học công nghệ, đặc biệt là sự phát triển vượt bậc của lĩnh vực trí tuệ nhân tạo, bài toán nêu trên không phải là không có giải pháp.

Trí tuệ nhân tạo có thể giúp ích gì cho quan trắc ONKK?

Trước hết, để giảm chi phí thì không có cách nào khác ngoài việc sử dụng các thiết bị có giá thành không quá cao, và giảm thiểu số lượng thiết bị cần lắp đặt. Đối với ý thứ nhất (giảm giá thành của thiết bị), chúng ta có thể sử dụng các thiết bị quan trắc ONKK giá thành thấp sử dụng cảm biến. Giá thành của các thiết bị này chỉ bằng phần trăm hay thậm chí phần nghìn giá thành của các trạm quan trắc truyền thống. Việc lắp đặt chúng lại tương đối đơn giản, không tốn quá nhiều không gian. Tuy vậy, các thiết bị này có một điểm hạn chế rất lớn, đó là độ chính xác không cao. Hơn nữa, cho dù chúng ta giảm được giá thành của một thiết bị, nếu chúng ta muốn có một mạng lưới thiết bị triển khai dày đặc, thì con số thiết bị cũng phải lên tới hàng nghìn, hàng triệu, dẫn tới tổng chi phí lắp đặt và vận hành vẫn là một con số đáng kể.

Vậy, làm thế nào để tăng được độ chính xác của các thiết bị quan trắc giá rẻ, và giảm thiểu được số lượng thiết bị?Câu hỏi này là động lực cho nhóm các nhà nghiên cứu người Việt đến từ Đại học Bách Khoa Hà Nội, Đại học Chiba, Nhật Bản, và Tập đoàn Toshiba, thực hiện đề tài “Fi-Mi: Hệ thống di động quan trắc và dự đoán chất lượng không khí ứng dụng trí tuệ nhân tạo” dưới sự tài trợ của Quỹ Đổi mới sáng tạo Vingroup (VinIF). Với hệ thống Fi-Mi, nhóm nghiên cứu ứng dụng trí tuệ nhân tạo nhằm giải quyết hai bài toán chính: 1) Tự động hiệu chỉnh các dữ liệu thu thập bởi các thiết bị quan trắc giá rẻ, nhằm tăng độ chính xác của dữ liệu; 2) Dự đoán dữ liệu quan trắc theo không-thời gian, nhằm xây dựng một bản đồ chất lượng không khí với độ mịn (fine-grainess) cao, trong khi không cần triển khai quá nhiều thiết bị.

Hình 1 biểu diễn mô hình tổng quan của hệ thống Fi-Mi, với cấu trúc ba tầng: tầng cảm biến, tầng thông tin, và tầng ứng dụng. Chức năng của mỗi tầng như sau: tầng cảm biến bao gồm các thiết bị quan trắc không khí. Các thiết bị này được đặt trên phương tiện giao thông (xe buýt), liên tục thu thập các chỉ số chất lượng không khí và gửi về hệ thống máy chủ; tầng thông tin bao gồm các giao thức truyền tin, đảm nhận việc truyền nhận dữ liệu giữa tầng cảm biến và tầng ứng dụng; tầng ứng dụng bao gồm hệ thống máy chủ có nhiệm vụ xử lý, lưu trữ dữ liệu; hiển thị dữ liệu trực quan hóa cho người dùng; sử dụng các mô hình học máy nhằm dự đoán chất lượng không khí theo không – thời gian.

Hình 1: Mô hình tổng quan biểu diễn kiến trúc ba tầng của Fi-Mi

Thiết kế chi tiết của thiết bị Fi-Mi

Các thiết bị quan trắc Fi-Mi có cấu trúc nhỏ gọn, được đặt trên xe buýt di chuyển quanh thành phố nhằm thu thập các chỉ số nhiệt độ, độ ẩm, PM2,5, SO2, NO2, CO. Thiết bị có khả năng giao tiếp với hai loại chuẩn truyền thông không dây là mạng không dây (wifi) và LTE (Long Term Evolution – Tiến hóa dài hạn) để liên tục cập nhật dữ liệu về hệ thống máy chủ theo thời gian thực. Bên cạnh các thông tin về quan trắc không khí và thời tiết, các thiết bị cũng gửi về máy chủ thông tin về độ mạnh/yếu của tín hiệu (RSSI) và vị trí thiết bị thu thập được qua mô-đun GPS. Toàn bộ hoạt động của mỗi thiết bị quan trắc Fi-Mi được điều khiển bởi bộ điều khiển trung tâm MCU. Bộ điều khiển này được lập trình bởi nhóm nghiên cứu tại Đại học Bách Khoa Hà Nội [5]. Thiết bị có cấu trúc nhỏ gọn, linh hoạt với các loại điều kiện môi trường khác nhau, phù hợp lắp đặt trên các xe bus hay ô tô và giá thành rẻ.

Hình 2. Bên trong thiết bị Fi-Mi
Hình 3. Bo mạch
Hình 4. Thiết bị Fi-Mi đóng gói

Kiểm thử hoạt động của các thiết bị Fi-Mi

Sau khi hoàn thành việc chế tạo thiết bị Fi-Mi, việc kiểm thử hoạt động của thiết bị được tiến hành bằng các hình thức sau: so sánh các số liệu thu thập được bởi thiết bị Fi-Mi với thiết bị tham chiếu là GRIMM 107, được vận hành bởi Viện Khoa học Môi trường – Đại học Bách Khoa Hà Nội. Thời gian thu thập dữ liệu từ 12/2020 đến 2/2021. Dữ liệu thu thập trong quá trình kiểm thử và báo cáo đánh giá độc lập được thực hiện bởi Viện Khoa học Môi trường. Kết quả cho thấy dữ liệu thu thập bởi thiết bị Fi-Mi có độ tin cậy cao, cụ thể: khi đối chiếu kết quả của LCS3 với kết quả của thiết bị tham chiếu, mức độ tuyến tính rất cao thể hiện xu thế biến thiên của hai LCS đánh giá tương đồng với xu thế biến thiên của thiết bị tham chiếu. Mức độ tuyến tính cao hơn nhiều mức khuyến nghị của US-EPA. Mặc dù độ dốc và đoạn chắn của đường tuyến tính của kết quả trung bình 24h không đạt mức khuyến nghị của US-EPA tuy nhiên sai số của kết quả đo (NRMSE) đạt yêu cầu về độ tin cậy. Kết quả đo của LCS có thể cải thiện thêm nếu sử dụng hệ số chuẩn hóa hoặc các phương pháp chuẩn hóa kết quả nâng cao khác.

Hình 5. Đồ thị tương quan của nồng độ PM2,5 đo bằng LCS và thiết bị tham chiếu trung bình 1h (a) và trung bình 24h (b) trong toàn bộ thời gian khảo sát

Hiệu chỉnh dữ liệu chất lượng không khí bằng mô hình học sâu

Kết quả thực nghiệm đối sánh với thiết bị mẫu cho thấy dữ liệu thu được từ các thiết bị Fi-Mi có sự sai khác so với các thiết bị mẫu, và sự sai khác này lại có tính phụ thuộc vào từng thiết bị, thể hiện trong Hình 6. Trong hình này, dữ liệu thu thập bởi các thiết bị Fi-Mi được thể hiện bởi các đường màu xanh, và dữ liệu thu thập bởi thiết bị tham chiếu được thể hiện bởi đường màu đỏ. Có thể thấy, các thiết bị Fi-Mi khác nhau cho các chỉ số không khí khác nhau. Vì vây, việc xây dựng một giải pháp hiệu chỉnh hoạt động tốt cho tất cả các thiết bị Fi-Mi không phải là đơn giản.

Hình 6. Sai số của dữ liệu thu thập bởi các thiết bị Fi-Mi

Kết quả khảo sát các phương pháp hiệu chỉnh dữ liệu hiện thời (ví dụ sử dụng các mô hình toán học, sử dụng hồi quy tuyến tính, v.v.) cho thấy độ chính xác của các phương pháp này không cao. Vì vậy, một mô hình hiệu chỉnh dữ liệu chất lượng không khí ứng dụng học sâu đã được ứng dụng. Cụ thể, mô hình mới với tên gọi là GAMMA, áp dụng phương pháp học đa nhiệm để giải quyết thách thức xử lý đồng thời dữ liệu của một số thiết bị. GAMMA cũng tận dụng kỹ thuật huấn luyện theo kiểu đối kháng để cải thiện độ chính xác của dữ liệu sau hiệu chỉnh. Kết quả thí nghiệm mô hình GAMMA trên bộ dữ liệu thu thập được từ 5 thiết bị Fi-Mi đã cho thấy GAMMA giảm sai số hiệu chuẩn từ 60,19% tới 74,09% so với các phương pháp tốt nhất hiện hành [6].

Hình 7. Mô hình học sâu hiệu chỉnh dữ liệu quan trắc ONKK thu thập bởi thiết bị Fi-Mi

Dự đoán chất lượng không khí bằng các mô hình học sâu

Việc ứng dụng học sâu để giải quyết các bài toán dự đoán không phải là chủ đề mới. Điểm mới trong dự án Fi-Mi là việc tập trung đề xuất các thuật toán tự động lựa chọn các đặc trưng có ích nhất trong bài toán dự đoán chỉ số PM2,5 trong tương lai. Đây cũng là dự án đầu tiên sử dụng học sâu trong dự đoán chỉ số PM2,5, thực hiện trên bộ dữ liệu của Việt Nam, do đó mang tầm quan trọng rất lớn. Các kết quả đánh giá trên bộ dữ liệu chất lượng không khí thu thập tại Hà Nội cho thấy mô hình Encoder – Decoder làm giảm sai số dự đoán 53,7% so với các giải pháp của các nghiên cứu khác. Hơn nữa, việc sử dụng thuật toán tự động lựa chọn đặc trưng đầu vào có thể giúp giảm sai số dự đoán thêm 13,7% so với các thuật toán khác [7].

Hình 8. Mô hình học sâu ước lượng chất lượng không khí theo không gian

Không chỉ dừng lại ở bài toán dự đoán chất lượng không khí theo thời gian, một trong những ứng dụng của Fi-Mi là việc nghiên cứu các phương pháp nhằm ước lượng phân bố của chất lượng không khí, tức là sử dụng dữ liệu chất lượng không khí thu được từ các vị trí của thiết bị quan trắc nhằm ước lượng chất lượng không khí tại những nơi không có thiết bị quan trắc. Đây là một bài toán thách thức và chưa được nghiên cứu nhiều, so với bài toán về dự đoán chất lượng không khí trong tương lai. Phần lớn các nghiên cứu trước đây sử dụng các phương pháp đơn giản như nội suy dựa trên khoảng cách để giải quyết bài toán dự đoán theo không gian. Tuy nhiên, phương pháp này cho độ chính xác không cao. Dự án Fi-Mi xây dựng mô hình học sâu, sử dụng mạng nơ-ron đồ thị để biểu diễn mối quan hệ về mặt không gian giữa các trạm quan trắc. Bên cạnh đó, sự kết hợp các thông tin về khí tượng, đặc biệt là gió, nhằm tăng độ chính xác cho việc dự đoán cũng là một điểm mạnh của Fi-Mi. Kết quả của các nghiên cứu thí nghiệm cho thấy, giải pháp của Fi-Mi đã giúp giảm sai số dự đoán từ 4,93% tới 34,88% so với các phương pháp hiện tại.

Hướng đi nào cho tương lai?

Dự án Fi-Mi đã được nghiệm thu vào năm 2023. Sau khi kết thúc dự án, các nhà khoa học tại Đại học Bách Khoa Hà Nội cùng với các nhà nghiên cứu trong cả lĩnh vực Trí tuệ nhân tạo và môi trường hiện vẫn đang tiếp tục theo đuổi các nghiên cứu liên quan, hướng đến việc xây dựng được một hệ thống hoàn chỉnh giúp theo dõi không chỉ các thông số ONKK, mà còn cả các nguồn phát thải gây ONKK, cũng như ảnh hưởng của ONKK tới sức khỏe con người.

Tác giả: PGS.TS. Nguyễn Phi Lê, Đại học Bách khoa Hà Nội.

Biên tập: Quỹ Đổi mới sáng tạo Vingroup (VinIF).

Tài liệu tham khảo
[1]. World Health Organization. (2016). Ambient Air Pollution: A Global Assessment of Exposure and Burden of Disease.
[2]. Kim, Ki-Hyun, Ehsanul Kabir, and Shamin Kabir. “A review on the human health impact of airborne particulate matter,” Environment international 74 (2015): 136-143.
[3]. Vélez-Guerrero, Angela Carolina, Mauro Callejas-Cuervo, and Andrea Catherine Alarcón-Aldana. “The Evolution of Air Quality Monitoring: Measurement Techniques and Instruments,” Journal of Hunan University Natural Sciences 50, no. 5 (2023).
[4]. Nguyen Dinh, Thuan, and Nam Phan Hoang. “Air Pollution Forecasting Using Regression Models and LSTM Deep Learning Models for Vietnam,” In Future Data and Security Engineering. Big Data, Security and Privacy, Smart City and Industry 4.0 Applications: 8th International Conference, FDSE 2021, Virtual Event, November 24–26, 2021, Proceedings 8, pp. 264-275. Springer Singapore, 2021.
[5]. Viet An Nguyen, Viet Hung , Van Sang Doan, Thanh Hung Nguyen, Phan Thuan Do, Kien Nguyen, Phi Le Nguyen, Minh Thuy Le, “Realizing Mobile Air Quality Monitoring System: Architectural Concept and Device Prototype”, Asia Pacific Conference on Communications (APCC 2021).
[6]. Nguyen, Anh Duy, Thu Hang Phung, Thuy Dung Nguyen, Huy Hieu Pham, Kien Nguyen, and Phi Le Nguyen. “GAMMA: A universal model for calibrating sensory data of multiple low-cost air monitoring devices,” Engineering Applications of Artificial Intelligence 128 (2024): 107591.
[7]. Nguyen Minh Hieu, Phi Le Nguyen, Kien Nguyen, Thanh-Hung Nguyen, and Yusheng Ji. “PM2. 5 prediction using genetic algorithm-based feature selection and encoder-decoder model.” IEEE Access 9 (2021): 57338-57350.
[8]. Viet Hung Vu, Duc Long Nguyen, Thanh Hung Nguyen, Nguyen Quoc Viet Hung, Phi Le Nguyen, and Huynh Thanh Trung, “Self-supervised air quality estimation with graph neural network assistance and attention enhancement,” Neural Computing and Applications Journal (NCAA), 2024.

BÀI MỚI NHẤT

Mạng nơ-ron tăng vọt trong hệ thống Neuromorphic hiện đại (Phần 1)

Mạng nơ-ron tăng vọt (Spiking Neural Network – SNN) được giới thiệu bởi các nhà nghiên cứu tại Đại học Heidelberg và Đại học Bern. Mạng nơ-ron tăng vọt bắt chước gần giống mạng nơ-ron tự nhiên, có khả năng xử lý thông tin theo thời gian thực và tiết kiệm năng lượng. SNN sử dụng các xung điện (spikes) để truyền thông tin giữa các nơ-ron. Thay vì truyền tín hiệu liên tục như các mạng nơ-ron truyền thống, SNN truyền các xung điện rời rạc tại các thời điểm cụ thể khi điện thế màng của nơ-ron vượt qua một ngưỡng nhất định. SNN lấy một tập hợp các xung tăng vọt làm ngõ vào và tạo ra một tập hợp các xung tăng vọt làm ngõ ra (một loạt các xung tăng vọt thường được gọi là các chuỗi xung tăng vọt). Tế bào thần kinh kích hoạt khi điện thế màng chạm ngưỡng, gửi tín hiệu đến các tế bào thần kinh lân cận, làm tăng hoặc giảm điện thế của chúng để đáp lại tín hiệu. Các thành phần quan trọng của mạng SNN là mô hình nơ-ron thần kinh, khớp thần kinh (synapse), STDP (spike-timing-dependent plasticity), v.v.

Tạo hình cục bộ liên tục có hỗ trợ nhiệt và rung siêu âm – Công nghệ sáng tạo cho sản phẩm thay thế...

Trong thời kỳ kinh tế số và toàn cầu hóa, các doanh nghiệp đang đối mặt với nhiều thách thức như giảm chi phí, nâng cao chất lượng sản phẩm và nhanh chóng đưa sản phẩm ra thị trường. Để giải quyết những vấn đề này, việc áp dụng các công nghệ sản xuất tiên tiến kết hợp với kỹ thuật số hiện đại là chìa khóa thành công.Một trong những công nghệ nổi bật hiện nay là công nghệ tạo hình cục bộ liên tục (ISF – Incremental Sheet Forming). Đây là phương pháp gia công kim loại độc đáo, trong đó một tấm kim loại được tạo hình từng bước nhờ chuyển động liên tục của một công cụ chuyên dụng. Điểm mạnh của ISF là khả năng tạo ra các hình dạng phức tạp mà các phương pháp truyền thống khó thực hiện, với độ chính xác cao và chi phí thấp hơn.

Hệ thống IOT theo dõi điện tim thai nhi với cảm biến không tiếp xúc

Trong bối cảnh tỷ lệ thai chết lưu do dị tật tim bẩm sinh ngày càng tăng cao, đặc biệt tại Việt Nam với con số báo động 6% so với mức trung bình toàn cầu 1% [1, 2], việc theo dõi sức khỏe thai nhi trở thành một trong những ưu tiên hàng đầu. Tỷ lệ sinh non gia tăng, chiếm từ 5 - 9%, đòi hỏi sự chăm sóc đặc biệt để bảo đảm sự sống và phát triển khỏe mạnh của trẻ. Do đó việc theo dõi sức khỏe thai nhi trở nên vô cùng cấp thiết nhằm giảm thiểu nguy cơ thai chết lưu và sinh non, đảm bảo sự phát triển toàn diện cho trẻ. Hệ thống thông tin y tế đóng vai trò then chốt trong việc hỗ trợ các cơ sở y tế còn hạn chế, giảm tải áp lực cho bệnh viện và đảm bảo xử lý kịp thời các tình huống khẩn cấp, đồng thời tối ưu hóa năng lực của đội ngũ y bác sĩ. Hơn thế nữa, xây dựng một cơ sở dữ liệu về bà mẹ mang thai người Việt là bước đi quan trọng, giúp tìm hiểu nguyên nhân của những vấn đề sức khỏe của trẻ em, từ đó góp phần cải thiện chất lượng chăm sóc sức khỏe cho thế hệ tương lai.

Giải pháp công nghệ IoTs/5G sử dụng kỹ thuật xử lý dữ liệu lớn và trí tuệ nhân tạo cho đô thị thông minh

Công nghệ Internet của vạn vật (Internet of Things - IoTs), mạng không dây thế hệ mới 5G, và kỹ thuật xử lý dữ liệu lớn (Big Data), trí tuệ nhân tạo (AI) đóng vai trò quan trọng trong việc tạo ra những đổi mới đột phá trong CNTT và truyền thông, và trong các lĩnh vực ứng dụng liên quan. Thành phố thông minh (Smart Cities) là một trong những ứng dụng như vậy, đã thu hút được sự chú ý lớn từ các chính phủ, cộng đồng ngành học thuật và CNTT tại nhiều quốc gia.

BÀI ĐỌC NHIỀU

Khái quát về mô hình dữ liệu quan hệ

Phần lớn hệ thống cơ sở dữ liệu hiện nay đều được xây dựng bằng mô hình dữ liệu quan hệ. Vậy mô hình...

Supervised Learning và Unsupervised Learning: Khác biệt là gì?

Supervised learning (Học có giám sát) và Unsupervised learning (Học không giám sát) là hai trong số những phương pháp kỹ thuật cơ bản...

Transformer Neural Network – Mô hình học máy biến đổi thế giới NLP

Năm 2017, Google công bố bài báo “Attention Is All You Need” thông tin về Transformer như tạo ra bước ngoặt mới trong lĩnh...

Khái quát về Data Pipeline

Dữ liệu là chìa khóa trong việc khám phá tri thức sâu rộng, nâng cao hiệu quả quy trình và thúc đẩy đưa ra...