Padrões de fala em conversas telefônicas podem detectar Alzheimer

Os padrões de fala em conversas telefônicas podem detectar pessoas com demência de Alzheimer em seu início ou em estado moderado, sugeriu um estudo japonês.

Um modelo preditivo de aprendizado de máquina identificou corretamente pessoas com demência de Alzheimer com cerca de 90% de precisão usando arquivos de áudio de conversas telefônicas de 24 pessoas com Alzheimer confirmado e 99 controles saudáveis, relatou Akihiro Shimoda, MPH, da McCann Health Worldwide Japan em Tóquio, e coautores, para o PLOS ONE.

Pessoas com doença de Alzheimer são mais propensas a falar mais devagar com pausas mais longas do que outras, Shimoda e coautores observaram, explicando que pessoas com Alzheimer passam mais tempo encontrando a palavra correta, o que produz mensagens interrompidas e sem fluência de fala.

O que diferenciou este estudo de outros é que ele se concentrou nas características vocais da fala cotidiana.

“Não usamos dados de texto extraídos de dados de voz”, disse Shimoda. “Não usamos dados de voz de testes cognitivos em um ambiente clínico, mas de conversas telefônicas diárias.”

Os pesquisadores também avaliaram o tom e a intensidade para identificar as características da voz de pacientes com demência.

“Os resultados mostram a possibilidade de incorporar um modelo de previsão em um aplicativo de telefone para realizar uma avaliação inicial do risco de demência em adultos mais velhos”, disse Shimoda. “Ele fornece uma maneira possível de identificar o risco de demência usando dados de voz de adultos mais velhos, que são mais fáceis de obter do que os testes cognitivos convencionais, biomarcadores ou imagens cerebrais.”

No entanto, um aplicativo baseado neste modelo está “longe de ser algo que possa substituir os métodos atuais de rastreamento de demência”, enfatizou. “Seria uma ferramenta inicial acessível e de baixo custo”.

Detalhes do estudo

O estudo avaliou dados de pessoas com 65 anos ou mais que participaram de um programa de prevenção de demência na cidade de Hachioji de março a maio de 2020. O programa incluiu 1 a 2 meses de ligações durante a semana de um programa de computador de inteligência artificial (IA) com o objetivo de melhorar a dieta, atividade física e participação social.

A interação por telefone incluiu uma avaliação da função cognitiva com base na versão japonesa da Entrevista por Telefone para Status Cognitivo (TICS-J) no primeiro dia, em seguida, pediu aos participantes que falassem livremente sobre a vida diária por 1 minuto e respondessem a perguntas como: “O que fez você fez ontem?”.

O Alzheimer foi diagnosticado utilizando os critérios do National Institute on Aging-Alzheimer’s Association ou do Diagnostic and Statistical Manual of Mental Disorders, antes do programa começar. O diagnóstico de Alzheimer foi usado como uma variável binária para prever o resultado.

Pessoas com Alzheimer grave foram excluídas do programa. Pessoas no grupo de Alzheimer tinham doença de Alzheimer leve/moderada ou deficiência cognitiva leve.

Os 99 controles saudáveis ​​e 24 pacientes com Alzheimer renderam 1.465 e 151 arquivos de áudio, respectivamente, com 81% alocados aleatoriamente para o conjunto de dados de treinamento e 19% para dados de validação. Depois de extrair recursos vocais dos arquivos de áudio, os pesquisadores desenvolveram modelos baseados em aumento de gradiente extremo (XGBoost), floresta aleatória e regressão logística.

A previsão com base em cada arquivo de áudio mostrou uma área sob a curva de característica de operação do receptor (AUC) de 0,863 para XGBoost, 0,882 para floresta aleatória e 0,893 para regressão logística.

A previsão baseada em cada participante mostrou uma AUC de 1,000 para XGBoost, 1,000 para floresta aleatória e 0,972 para regressão logística. A previsão com base na avaliação cognitiva TICS-J foi de 0,917.

A avaliação cognitiva XGBoost e TICS-J teve 100% de sensibilidade. XGBoost teve 100% de especificidade, enquanto TICS-J teve 83,3% de especificidade.

O estudo teve várias limitações, reconheceram Shimoda e coautores. A variável de resultado foi binária – doença de Alzheimer ou controles saudáveis ​​- e ignorou variações nas características da fala em diferentes estágios da demência. Além disso, o tamanho da amostra foi pequeno, a qualidade do áudio diferiu para alguns participantes e, como a avaliação TICS-J foi realizada por um programa de IA, sua capacidade limitada de reconhecimento de fala pode ter afetado os resultados.

Os pesquisadores também confiaram em características vocais superficiais, como altura e intensidade. “Pesquisas adicionais podem incluir processamento de linguagem natural do conteúdo da fala e análise da estrutura da frase para reduzir a perda de informações e aumentar o desempenho de previsão do modelo”, escreveu a equipe.

______________________________

O estudo original foi publicado no PLOS ONE

“Dementia risks identified by vocal features via telephone conversations: A novel machine learning prediction model” – 2021

    Autores do estudo: Shimoda A, et al – Estudo

    4Medic

    As informações publicadas no site são elaboradas por redatores terceirizados não profissionais da saúde. Este site se compromete a publicar informações de fontes segura. Todos os artigos são baseados em artigos científicos, devidamente embasados.