Assim como no Brasil, a dengue é um problema de saúde pública na China. Apesar do histórico da doença no país asiático, as análises de dados para prever surtos eram inconsistentes, dificultando o controle da área de expansão da doença e de pessoas contagiadas. Enquanto não há uma vacina efetiva, cientistas chineses desenvolveram um modelo preditivo a partir de Machine Learning para mapear surtos da doença.
O conceito é um tipo de inteligência artificial em que computadores usam dados coletados para identificar padrões e tendências, aprendendo com os comportamentos e assim fazendo previsões seguras. O estudo combinou e avaliou pela primeira vez algoritmos diferentes. Ou seja, as informações utilizadas para as previsões são de fontes distintas, que vão desde a temperatura local ao comportamento de busca da população sobre a doença na Internet.
Foram testadas diversas técnicas de Machine Learning para a formulação do estudo. Entre elas, o SVR – Support Vector Regression (Suporte de Regressão Vetorial), que utiliza teoria estatística, foi considerado superior, apresentando resultados consistentes sobre a dinâmica da doença.
A técnica analisou características da dengue na província de Cantão, entre 2011 e 2014, relacionando o número de pessoas contagiadas – por semana – à temperatura média, umidade relativa do ar e chuvas durante o período. Para complementar, foram comparadas as mesmas informações de mais outras cinco províncias.
Busca na Internet
O estudo também usou o comportamento de busca na Internet da população chinesa sobre a doença, como um dos pilares do mapeamento de surtos. De acordo com o 39º Relatório Estatístico sobre o Desenvolvimento da Internet, até 2016, existiam 73,1 milhões de usuários de internet na China, representando 53,2% da população nacional.
Foi possível identificar, entre diversos exemplos, que os termos de pesquisa específicos do Baidu (site de busca chinês) estão altamente correlacionados com a incidência de dengue na China.
Em particular, para Cantão, as palavras-chave de pesquisa incluídas mostraram uma correlação com a incidência de dengue em vários períodos, o que é bastante consistente em relação a estudos anteriores.
No entanto, as diferenças na penetração da internet, entre as áreas rurais e urbanas, ainda podem tornar essa fonte de dados duvidosa, afetando a previsão baseada somente em termos de pesquisa no meio digital.
Além das variáveis como o número de pessoas contagiadas pela dengue, dados de vigilância de pesquisa na internet e dados meteorológicos. Outros indicadores poderão ser incorporados em estudos futuros, como a densidade de mosquitos.
O estudo completo está disponível no periódico Plos.