UM MODELO PARA DETECÇÃO DE QUEDAS HUMANAS BASEADO EM VISÃO COMPUTACIONAL
Detecção de queda, Vídeo vigilância, Reconhecimento da ação
humana, Visão de máquina, Redes profundas, Detecção de ação.
No âmbito da detecção de ações e reconhecimento de atividades humanas, a
detecção de quedas emerge devido à sua excelente aplicação para o bem-estar
público. A detecção de quedas pode ser implementada em instalações como
asilos, áreas com câmeras públicas e residências de idosos que moram
sozinhos, pois a grande maioria das fatalidades relacionadas a quedas
ocorre nesses locais. Desta forma, esta tese explora o problema da detecção
de quedas em humanos, apenas por meio de imagens de vídeos. Sendo esse um
problema importante e de aplicações praticas, devido ao crescimento da
população mais velha e a alta taxa de pessoas que sofrem lesões em virtude
de quedas. A maioria dos sistemas atuais tem inspiração em modelos de
detecção de ações humanas, tais modelos são computacionalmente caros, e
sujeitos a alarmes falsos, devido a incorporação de características de
movimentos que as pessoas usam no dia a dia, os quais podem ser confundidas
com os de quedas. Assim, aborda-se o problema com dois modelos. O primeiro
utiliza um detector um objetos combinado com modelos de classificação
temporal e um algoritmo de rastreamento, que são usados para detectar
quedas individualmente em fluxos de vídeo. Os seguintes passos são tomados
na utilização desta da abordagem proposta: (i) a região da imagem em que
ocorreu a queda é localizada; (ii) são rastreadas e extraídas as regiões
que compõem a queda em uma sequência temporal de imagens, formando-se uma
série de ações associadas a uma determinada pessoa; e (iii) um modelo é
construído para classificar a sequência consecutiva de imagens e agregar a
informação temporal. O segundo modelo utiliza um detector de pontos chaves
inspirado na arquitetura dos detectores de objetos, mas substituindo o
modelo pré-treinado e alterando a estrutura do algoritmo para torná-lo um
detector de pontos chaves, mudando a forma como a função de perda é
calculada no processo de aprendizagem e alterando o algoritmo de filtragem
na última camada, também foi adicionado o fluxo ótico para aferir a
velocidade e direção dos pontos detectados para ao final serem utilizados
em um modelo temporal. Ambos os modelos propostos são comparados com outros
métodos da literatura utilizando métricas conhecidas.
Simulações experimentais com várias bases de dados e modelos da literatura,
mostram que os melhores resultados na maioria das métricas avaliadas são
alcançados usando as abordagens propostas.