¿Cómo se validan los datos de calidad del aire antes de publicarlos en la plataforma AirVisual?
La plataforma AirVisual tiene como objetivo centralizar y agregar toda la información sobre la calidad del aire disponible actualmente en un solo lugar, con el fin de proporcionar la visión general más completa de la calidad del aire global.
Las fuentes de datos que se informan a través de la plataforma AirVisual incluyen datos de sensores, de estaciones de monitoreo gubernamentales (generalmente consideradas "monitores de referencia" de alto costo), así como sensores de bajo costo, como estaciones públicas AirVisual Pro y sensores PurpleAir.
Todos los datos que se publican a través de la plataforma AirVisual están sujetos a validación de datos, y este proceso difiere entre estas dos fuentes de datos de sensores.
El sistema devalidación de datos de AirVisual está basado en la nube y está impulsado por el aprendizaje automático, y todas las mediciones pasan por este sistema antes de publicarlas en nuestra plataforma.
Datos de sensores de "referencia" gubernamentales
Aunque los sensores gubernamentales de alto costo suelen considerarse la fuente más precisa y confiable de datos medidos sobre la calidad del aire, a veces estos sensores también informan anomalías o datos inexactos. Las razones para esto pueden incluir períodos temporales de mantenimiento o defectos, o incluso fuentes de emisión hiperlocales temporales cercanas al sensor.
En consecuencia, todos los datos de los sensores gubernamentales están sujetos a un sistema de validación de datos antes de su publicación. Un ejemplo de esta validación es que el sistema basado en la nube identifica cualquier anomalía potencial publicada por una estación (por ejemplo, un pico alto repentino de PM2.5 de 10ug/m3 a 100ug/m3 de una hora a otra), y lo verificará con otras mediciones cercanas para verificar si dicho pico es representativo o una anomalía. El proceso de validación también se compara con los patrones históricos y otros parámetros, como las condiciones meteorológicas. A continuación, el valor se publicará o se descontará en consecuencia.
Sensores de bajo coste
Las mediciones de sensores de bajo coste también se someten a un proceso de calibración y corrección de datos, además del proceso de validación descrito anteriormente, que identificará y descartará las lecturas anómalas.
El sistema aplicado a sensores de bajo coste tiene en cuenta las condiciones cercanas como la temperatura, la humedad, la composición de la contaminación y aplica un algoritmo de calibración de datos basado en las condiciones ambientales. Por ejemplo, los altos niveles de humedad pueden, en algunas circunstancias, llevar a que los sensores de bajo costo informen sobre los niveles de PM2.5. Del mismo modo, la composición de la contaminación (contaminación generada por el transporte, tormentas de arena, contaminación basada en el carbón, etc.) afecta en gran medida a la medición y la plataforma AirVisual utiliza imágenes de satélite para determinar la composición de la contaminación que se utilizará en el mecanismo de calibración. Por lo tanto, este algoritmo de calibración y corrección tiene en cuenta los niveles de humedad local y otros parámetros ambientales, además de los patrones históricos regionales, y ajusta las mediciones de PM2.5 en consecuencia.
El nivel de ajuste está determinado por el sistema basado en la nube que se basa en inteligencia artificial y aprendizaje automático. A través de la agregación de miles de millones de puntos de datos de calidad del aire global durante muchos años, a partir de sensores de referencia, sensores AirVisual, datos meteorológicos y composición de la contaminación a partir de imágenes satelitales, este sistema ha estado aprendiendo las complejas relaciones históricas entre diferentes parámetros de calidad del aire en diferentes partes del mundo.
Dado que la composición de PM puede variar ampliamente entre diferentes áreas del mundo, es crucial distinguir entre las correlaciones de PM y factores como la humedad a nivel local / regional. Estas correlaciones pueden variar ampliamente dependiendo de las diferentes composiciones locales de PM y, por lo tanto, deben tenerse en cuenta para los algoritmos locales de calibración y corrección.