Univasf – Pesquisa aponta requisitos para aprimorar IA em descrições de imagens para deficientes visuais

27 de nov. de 20243 min de leitura

O que acontece quando o usuário se depara com uma imagem que não pode ser convertida em texto?

Por: Andifes

Pesquisadores: Larissa Rocha, Ricardo Ramos, Rosalvo Ferreira e Milton Carvalho.

Com a popularização de dispositivos como smartphones e tablets, mais pessoas com deficiência visual têm a possibilidade de navegar de maneira autônoma pelo mundo digital, graças ao auxílio de leitores de tela. No entanto, o que acontece quando o usuário se depara com uma imagem que não pode ser convertida em texto?

Com o objetivo de identificar os requisitos de software necessários para uma ferramenta de legendagem de imagens adaptada a usuários com deficiência visual, foi realizado um estudo por pesquisadores da Universidade Federal do Vale do São Francisco (Univasf), cujos resultados foram publicados na Assistive Technology, da Taylor & Francis, um dos principais periódicos em tecnologias assistivas do mundo. A pesquisa analisou os modelos de Inteligência Artificial (IA) utilizados em soluções de image caption, capazes de receber uma imagem e gerar automaticamente um texto descritivo.

O artigo publicado, intitulado “Addressing Visual Impairments: Essential software requirements for image caption solutions” (Abordando Deficiências Visuais: Requisitos Essenciais de Software para Soluções de Legenda de Imagens, em tradução livre), tem como autores os docentes do Colegiado de Engenharia da Computação (Cecomp), Rosalvo Ferreira de Oliveira Neto e Ricardo Argenton Ramos, o revisor de texto Braille da Univasf, Milton Pereira de Carvalho Filho, e a egressa do curso de Engenharia da Computação, Larissa Almeida Rocha. A pesquisa indicou que as ferramentas atuais de legendagem não são totalmente eficazes para pessoas com deficiência visual e apontou três áreas cruciais que precisam ser aprimoradas para garantir maior eficácia dos sistemas de legendagem de imagens voltados para deficientes visuais.

Foram conduzidas duas investigações para identificar esses requisitos. A primeira consistiu em uma pesquisa online, cujo objetivo foi compreender as principais preferências dos usuários com deficiência visual em relação aos softwares audiodescritivos. Em seguida, um estudo avaliou a eficácia dos modelos atuais de legendagem baseados em aprendizagem profunda, analisando sua capacidade de atender aos requisitos estabelecidos. A análise destacou os seguintes requisitos essenciais: descrição enriquecida dos elementos humanos nas imagens, com ênfase em atributos como idade estimada, expressões faciais e etnia; exposição detalhada das cores que caracterizam os objetos no conteúdo visual, aprimorando a compreensão geral da imagem; e descrição centrada no contexto, destacando a natureza adaptativa dos requisitos de descrição com base no cenário situacional da imagem.

“Identificar a importância de uma descrição mais rica de elementos humanos, detalhes de cores e uma descrição centrada no contexto oferece um direcionamento claro para que os desenvolvedores incorporem funcionalidades que aumentem a compreensão visual desses usuários. Esses requisitos podem influenciar o design de sistemas de Inteligência Artificial (IA) mais sensíveis e personalizados, promovendo uma inclusão mais efetiva e autonomia para pessoas com deficiência visual no uso de conteúdos visuais digitais”, afirma um dos pesquisadores, o docente Rosalvo Ferreira de Oliveira Neto.

A pesquisa não apenas destaca as limitações das tecnologias existentes, mas também aponta para um futuro promissor. Segundo Oliveira Neto, as soluções encontradas no estudo já são valiosas para pessoas com deficiência visual. Contudo, muitas ferramentas ainda precisam de ajustes para realmente atender às necessidades específicas desse público, especialmente em ambientes acadêmicos e profissionais. “Acreditamos que as descobertas deste estudo podem impactar diretamente o desenvolvimento de novas tecnologias assistivas, ao orientar o aprimoramento de ferramentas de legendagem de imagens com foco nas necessidades específicas de pessoas com deficiência visual”, afirma o professor.

Oliveira Neto também ressalta a relevância de ter o estudo publicado em um periódico de prestígio na área de tecnologias assistivas. “Publicar neste periódico destaca o valor e a contribuição da pesquisa para o campo de tecnologias assistivas. No contexto acadêmico, esse trabalho reforça a importância de ouvir o usuário final, no nosso caso, a pessoa com deficiência visual. Além disso, demonstra o potencial da Inteligência Artificial para o desenvolvimento de soluções inovadoras e eficazes em tecnologias assistivas”, conclui o pesquisador.

Univasf – Pesquisa aponta requisitos para aprimorar IA em descrições de imagens para deficientes visuais

Posts recentes

Comentarios