Como a IA está melhorando a internet para deficientes visuais
[ad_1]
Estamos empolgados em trazer o Turn out to be 2022 de volta pessoalmente em 19 de julho e virtualmente de 20 a 28 de julho. Junte-se aos líderes de IA e dados para conversas perspicazes e oportunidades de networking empolgantes. Registre-se hoje!
Existem quase 350 milhões pessoas em todo o mundo com cegueira ou alguma outra forma de deficiência visible que precisam usar a web e aplicativos móveis como qualquer outra pessoa. No entanto, eles só podem fazer isso se websites e aplicativos móveis forem criados com acessibilidade em mente – e não como uma reflexão tardia.
O problema
Considere estes dois botões de exemplo que você pode encontrar em uma página da Internet ou aplicativo móvel. Cada um tem um fundo simples, então eles parecem semelhantes.
Na verdade, eles são um mundo à parte quando se trata de acessibilidade.
É uma questão de contraste. O texto no botão azul claro tem baixo contraste, portanto, para alguém com deficiência visible, como daltonismo ou doença de Stargardt, a palavra “Olá” pode ser completamente invisível. Acontece que existe uma fórmula matemática padrão que outline a relação adequada entre a cor do texto e seu plano de fundo. Bons designers sabem disso e usam calculadoras on-line para calcular essas proporções para qualquer elemento em um projeto.
Até agora tudo bem. Mas quando se trata de texto em um complexo como uma imagem ou um gradiente, as coisas começam a ficar complicadas e ferramentas úteis são raras. Antes de hoje, os testadores de acessibilidade precisavam verificar esses casos manualmente, amostrando o plano de fundo do texto em determinados pontos e calculando a taxa de contraste para cada uma das amostras. Além de trabalhosa, a medição também é inerentemente subjetiva, uma vez que diferentes testadores podem amostrar diferentes pontos dentro da mesma área e chegar a diferentes medições. Esse problema – medições laboriosas e subjetivas – vem retardando os esforços de acessibilidade virtual há anos.
Acessibilidade: IA para o resgate
Algoritmos de inteligência synthetic, ao que parece, pode ser treinado para resolver problemas como esse e até mesmo melhorar automaticamente à medida que são expostos a mais dados.
Por exemplo, a IA pode ser treinada para fazer resumos de texto, o que é útil para usuários com deficiências cognitivas; ou fazer reconhecimento de imagem e rosto, o que auxilia pessoas com deficiência visible; ou legendas em pace actual, o que ajuda as pessoas com deficiência auditiva. da Apple VoiceOver integração no iPhone, cujo foremost uso é pronunciar e-mails ou mensagens de texto, também united states of america IA para descrever ícones de aplicativos e relatar níveis de bateria.
Princípios orientadores para acessibilidade
As empresas sábias estão se apressando para cumprir as Lei dos Americanos com Deficiência (ADA) e dar a todos acesso igual à tecnologia. Em nossa experiência, as ferramentas de tecnologia certas podem ajudar a tornar isso muito mais fácil, mesmo para os websites modernos de hoje com seus milhares de componentes. Por exemplo, o design de um website pode ser escaneado e analisado por meio de aprendizado de máquina. Ele pode então melhorar sua acessibilidade por meio de reconhecimento facial e de fala, navegação pelo teclado, tradução de áudio de descrições e até reajustes dinâmicos de elementos de imagem.
Em nosso trabalho, encontramos três princípios orientadores que, acredito, são críticos para a acessibilidade virtual. Vou ilustrá-los aqui com referência a como nossa equipe, em um esforço liderado por nossa líder de equipe de ciência de dados, Asya Frumkin, resolveu o problema de texto em fundos complexos.

Divida o grande problema em problemas menores
Se olharmos o texto da imagem abaixo vemos que há algum tipo de problema de legibilidade, mas é difícil quantificar no geral, olhando apenas para a frase inteira. Por outro lado, se nosso algoritmo examinar cada uma das letras da frase separadamente – por exemplo, o “e” à esquerda e o “o” à direita – podemos dizer mais facilmente para cada uma delas se é legível ou não.
Se nosso algoritmo continuar percorrendo todos os caracteres do texto dessa maneira, podemos contar o número de caracteres legíveis no texto e o número overall de caracteres. No nosso caso, há quatro caracteres legíveis em oito no overall. A fração a seguir, com o número de caracteres legíveis como numerador, nos dá uma razão de legibilidade para o texto geral. Podemos então usar um limite pré-estabelecido acordado, por exemplo, 0,6, abaixo do qual o texto é considerado ilegível. Mas o ponto é que chegamos lá executando operações em cada pedaço do texto e, em seguida, contar a partir daí.

Reaproveite as ferramentas existentes sempre que possível
Todos nos lembramos do Reconhecimento Óptico de Caracteres (“OCR”) dos anos 1970 e 80. Essas ferramentas eram promissoras, mas acabaram sendo muito complexas para o propósito originalmente pretendido.
Mas havia uma parte dessas ferramentas chamada modelo CRAFT (Personality-Area Consciousness For Textual content) que prometia IA e acessibilidade. O CRAFT mapeia cada pixel na imagem para sua probabilidade de estar no centro de uma letra. Com base neste cálculo, é possível produzir um mapa de calor em que as áreas de alta probabilidade serão pintadas de vermelho e as áreas de baixa probabilidade serão pintadas de azul. A partir deste mapa de calor, você pode calcular as caixas delimitadoras dos caracteres e cortá-las da imagem. Usando esta ferramenta, podemos extrair caracteres individuais de um texto longo e executar um modelo de classificação binária (como em #1 acima) em cada um deles.
Encontre o equilíbrio certo no conjunto de dados
O modelo do problema classifica caracteres individuais de forma binária direta – pelo menos em teoria. Na prática, sempre haverá exemplos desafiadores do mundo actual que são difíceis de quantificar. O que complica ainda mais é o fato de que cada pessoa, deficiente visible ou não, tem uma percepção diferente do que é legível.
Aqui, uma solução (e a que adotamos) é enriquecer o conjunto de dados adicionando tags objetivas a cada elemento. Por exemplo, cada imagem pode ser carimbada com um texto de referência em um fundo fixo antes da análise. Dessa forma, quando o algoritmo rodar, ele terá uma base objetiva para comparação.
Para o futuro, para um bem maior
À medida que o mundo continua a evoluir, todos os websites e aplicativos móveis precisam Ser construído com acessibilidade em mente desde o início. A IA para acessibilidade é uma capacidade tecnológica, uma oportunidade de sair de cena e engajar e uma probability de construir um mundo onde as dificuldades das pessoas sejam compreendidas e consideradas. Em nossa opinião, a solução para a tecnologia inacessível é simplesmente uma tecnologia melhor. Dessa forma, tornar websites e aplicativos acessíveis é parte integrante de tornar websites e aplicativos que funcionam – mas desta vez, para todos.
Navin Thadani é cofundador e CEO da Evidenciado.
Tomadores de decisão de dados
Bem-vindo à comunidade VentureBeat!
DataDecisionMakers é onde especialistas, incluindo o pessoal técnico que trabalha com dados, podem compartilhar insights e inovações relacionadas a dados.
Se você quiser ler sobre ideias de ponta e informações atualizadas, práticas recomendadas e o futuro dos dados e da tecnologia de dados, junte-se a nós no DataDecisionMakers.
Você pode até considerar contribuindo com um artigo de sua autoria!
[ad_2]
Fonte da Notícia



