GEEKS

As legendas do YouTube inserem linguagem explícita em vídeos infantis

Publicidade

[ad_1]

Quase 400.000 pessoas inscreva-se no YouTube conta Rob the Robotic – Vídeos de aprendizagem para crianças. Em um vídeo de 2020, o humanóide animado e seus amigos visitam um planeta com tema de estádio e tentam feitos inspirados em Heracles. Suas aventuras são adequadas para o ensino elementary, mas os jovens leitores que ativam as legendas automatizadas do YouTube podem expandir seu vocabulário. A certa altura, os algoritmos do YouTube interpretam mal a palavra “corajoso” e legendam um personagem que aspira ser “area of expertise e estupro como Heracles.”

UMA novo estudo das legendas algorítmicas do YouTube em vídeos destinados a crianças documenta como o texto às vezes se transforma em linguagem muito adulta. Em uma amostra de mais de 7.000 vídeos de 24 canais infantis de primeira linha, 40% exibiram palavras em suas legendas encontradas em uma lista de 1.300 termos “tabus”, extraídos em parte de um estudo sobre xingamentos. Em cerca de 1% dos vídeos, as legendas incluíam palavras de uma lista de 16 termos “altamente inapropriados”, com o YouTube algoritmos mais propensos a adicionar as palavras “cadela”, “bastardo” ou “pênis”.

Alguns vídeos postados no Ryan’s Global, um dos principais canais infantis com mais de 30 milhões de inscritos, ilustram o problema. Em um deles, a frase “Você também deve comprar milho” é traduzida nas legendas como “você também deve comprar pornografia”. Em outros vídeos, uma “toalha de praia” é transcrita como “toalha de vadia”, “buster” se torna “bastardo”, um “caranguejo” se torna uma “porcaria” e um vídeo de artesanato sobre como fazer uma casa de bonecas com tema de monstro apresenta um “ cama para pênis.”

“É surpreendente e perturbador”, diz Ashique KhudaBukhsh, professor assistente do Rochester Institute of Generation que pesquisou o problema com os colaboradores Krithika Ramesh e Sumeet Kumar na Indian Faculty of Industry em Hyderabad.

Publicidade

As legendas automáticas não estão disponíveis no YouTube Children, a versão do serviço voltada para crianças. Mas muitas famílias usam a versão padrão do YouTube, onde podem ser vistas. Centro de Pesquisa Pew informado em 2020 que 80% dos pais de crianças de 11 anos ou menos disseram que seus filhos assistiam ao conteúdo do YouTube; mais de 50% das crianças o faziam diariamente.

KhudaBukhsh espera que o estudo chame a atenção para um fenômeno que ele diz ter recebido pouca atenção de empresas de tecnologia e pesquisadores e que ele chama de “alucinação de conteúdo impróprio” – quando algoritmos adicionam subject material inadequado que não está presente no conteúdo authentic. Pense nisso como o outro lado da observação comum de que o preenchimento automático em smartphones geralmente filtra a linguagem adulta para um abaixando o grau irritante.

A porta-voz do YouTube, Jessica Gibby, diz que crianças menores de 13 anos são recomendadas a usar o YouTube Children, onde as legendas automáticas não podem ser vistas. Na versão padrão do YouTube, ela diz que o recurso melhora a acessibilidade. “Estamos trabalhando continuamente para melhorar as legendas automáticas e reduzir erros”, diz ela. Alafair Corridor, porta-voz do Pocket.watch, um estúdio de entretenimento infantil que publica o conteúdo do Ryan’s Global, disse em comunicado que a empresa está “em contato próximo e imediato com nossos parceiros de plataforma, como o YouTube, que trabalham para atualizar legendas de vídeo incorretas”. O operador do canal Rob the Robotic não foi encontrado para comentar.

Alucinações inapropriadas não são exclusivas do YouTube ou legendas de vídeo. Um repórter da WIRED descobriu que uma transcrição de uma ligação telefônica processada pela startup Trint tornava Negar, nome feminino de origem persa, uma variante da palavra N, embora soe distintamente diferente para o ouvido humano. O CEO da Trint, Jeffrey Kofman, diz que o serviço possui um filtro de palavrões que edita automaticamente “uma lista muito pequena de palavras”. A grafia específica que apareceu na transcrição da WIRED não estava nessa lista, disse Kofman, mas será adicionada.

.

[ad_2]

Fonte da Notícia

Publicidade

Osmar Queiroz

Osmar é um editor especializado em tecnologia, com anos de experiência em comunicação digital e produção de conteúdo voltado para inovação, ciência e tecnologia.

Artigos relacionados

Verifique também
Fechar
Botão Voltar ao topo
HexTec News