MineraÇÃo de Dados
Voltar
Para identificação de condições favoráveis à gênese e evolução de tempestades.

Objetivo GERAL
Explorar técnicas de mineração de dados para buscar e validar correlações entre dados meteorológicos de fontes diversas associados à ocorrência de tempestades (severas), de forma que possam ser utilizadas na previsão desse tipo de evento. Estender esse processo para dados que variem espacial e temporalmente de forma a identificar tendências de ocorrência desses eventos que possibilitem alertas avançados.

Metodologia
A mineração de dados pode ser descrita como um conjunto de técnicas computacionais para a extração de informações desconhecidas e potencialmente úteis em grandes volumes de dados por meio de um resumo compacto dos mesmos. O grande volume de dados meteorológicos disponíveis tem características tais como sua heterogeneidade, diferentes resoluções espaciais e temporais, e diferentes formatos, incluindo imagens, sendo originados de modelos meteorológicos de previsão numérica de tempo, radares, satélites meteorológicos ou sensores de descargas elétricas atmosféricas. Essas características dificultam o estabelecimento de uma base de dados consistente, necessária à mineração de dados. A seleção dos dados que serão empregados é seguida de um pré-processamento e redução dos mesmos para tornar mais tratável a busca de correlações. Assim, variáveis contínuas podem ser representadas por valores discretos e dados faltantes podem ser, por exemplo, interpolados. Na etapa de mineração de dados propriamente dita, algoritmos convenientes estabelecerão correlações, as quais serão analisadas posteriormente pelos meteorologistas. Pretende-se usar um dos softwares abertos, gratuitos e bem conhecidos de mineração de dados, o Weka ou o Rosetta, sendo que a equipe proponente tem experiência em ambos. Esses softwares permitem a discretização e redução dos dados, além da geração de regras que irão expressar as possíveis correlações entre dados meteorológicos para o caso de atividade convectiva severa [1] [2]. Os diversos dados meteorológicos definem atributos de informação e de decisão a serem usados no processo de mineração. Os dados de ocorrências de descargas elétricas podem ser representados por campos cuja caracterização permite indicar atividade convectiva severa. Assim, esses dados podem ser usados como atributo de decisão, enquanto os dados de modelos meteorológicos, especificamente do modelo ETA e do ECMWF (European Center for Medium range Weather Forecasting, como atributos de informação. Finalmente, as correlações encontradas seriam analisadas pelos meteorologistas participantes do projeto e validadas estatisticamente para sua incorporação a ferramentas automáticas de previsão [3] e para sua posterior investigação.

JUSTIFICATIVA
Atualmente, há grande quantidade e diversidade de dados meteorológicos disponíveis, tais como dados de perfis atmosféricos derivados de estações de radiossondagem, dados de modelos meteorológicos de previsão numérica de tempo, índices de instabilidade, dados de radares e satélites meteorológicos, além de dados de descargas elétricas atmosféricas. Estes últimos devem-se à atividade elétrica intensa associada aos sistemas convectivos. O Brasil conta com uma rede de sensores de descargas elétricas nuvem-solo com alta resolução temporal e que tem grande abrangência geográfica. Em função da alta resolução espacial e temporal dos dados meteorológicos em geral e do conseqüente grande volume de dados gerados por modelagem ou sensores, sua análise requer o uso de ferramentas computacionais avançadas tais como a mineração de dados, a qual permite buscar correlações potencialmente úteis entre os dados meteorológicos disponíveis para a caracterização de atividade convectiva intensa, objetivando sua previsão. Essa grande quantidade e diversidade de dados meteorológicos, que incluem imagens, torna lenta, senão impossível, sua análise por parte de meteorologistas por meio de ferramentas tradicionais. Por sua característica espaço-temporal, a análise decorrente da mineração de dados pode complementar os métodos convencionais de investigação de sistemas convectivos, auxiliando na previsão meteorológica de curto prazo de tempestades severas. Paralelamente, a descoberta e validação das correlações entre dados meteorológicos permite sua inclusão em ferramentas automatizadas de previsão, inserindo-se no escopo do projeto.

RESULTADOS ESPERADOS
Software que implementa processo automatizado de aquisição a partir de dados gerados por modelo meteorológico, pré-processamento e mineração de dados como ferramenta de análise para meteorologistas e como agente de detecção de padrões temporais indicativos de gênese e evolução de atividade convectiva severa;
Padrões temporais indicativos de gênese e evolução de atividade convectiva severa compostos por gradientes discretizados de variáveis meteorológicas.

Pesquisadores:
- Nelson Jesus Ferreira (DOP-CPTEC/INPE)
- Giovanni Dolif Neto (DOP-CPTEC/INPE)
- José Carlos Becceneri (LAC/INPE)
- José Demísio Simões Silva (LAC/INPE)
- Margarete Oliveira Domingues (LAC/INPE)
- Rafael Duarte Coelho dos Santos (LAC/INPE)
- Stephan Stephany (LAC/INPE)
- Odim Mendes Junior (CPTEC/INPE)