TECNOLOGIA

O que é visão computacional (ou visão de máquina)?

O que é visão computacional (ou visão de máquina)?

[ad_1]

Estamos empolgados em trazer o Grow to be 2022 de volta pessoalmente em 19 de julho e virtualmente de 20 a 28 de julho. Junte-se aos líderes de IA e dados para conversas perspicazes e oportunidades de networking empolgantes. Registre-se hoje!




O processo de identificação de objetos e compreensão do mundo através das imagens coletadas de câmeras digitais é muitas vezes referido como “visão computacional” ou “visão de máquina”. Continua sendo uma das áreas mais complicadas e desafiadoras da inteligência synthetic (IA), em parte devido à complexidade de muitas cenas capturadas do mundo actual.

A área conta com uma mistura de geometria, estatística, ótica, aprendizado de máquina e, às vezes, iluminação para construir uma versão virtual da área vista pela câmera. Muitos algoritmos focam deliberadamente em um objetivo muito restrito e focado, como identificar e ler placas de carros.

Principais áreas de visão computacional

Os cientistas de IA geralmente se concentram em objetivos específicos, e esses desafios específicos evoluíram para subdisciplinas importantes. Muitas vezes, esse foco leva a um melhor desempenho porque os algoritmos têm uma tarefa mais claramente definida. O objetivo geral da visão de máquina pode ser intransponível, mas pode ser viável responder a perguntas simples como, digamos, ler todas as placas de carros que passam por um pedágio.

Algumas áreas importantes são:

  • Reconhecimento facial: Localizar rostos em imagens e identificar as pessoas usando proporções das distâncias entre os traços faciais pode ajudar a organizar coleções de fotos e vídeos. Em alguns casos, pode fornecer uma identificação precisa o suficiente para fornecer segurança.
  • Reconhecimento de objeto: Encontrar os limites entre os objetos ajuda a segmentar imagens, inventariar o mundo e orientar a automação. Às vezes, os algoritmos são fortes o suficiente para identificar com precisão objetos, animais ou plantas, um talento que forma a base para aplicações em plantas industriais, fazendas e outras áreas.
  • Reconhecimento estruturado: Quando a configuração é previsível e facilmente simplificada, algo que costuma acontecer em uma linha de montagem ou em uma planta business, os algoritmos podem ser mais precisos. Os algoritmos de visão computacional fornecem uma boa maneira de garantir o controle de qualidade e melhorar a segurança, especialmente para tarefas repetitivas.
  • Iluminação estruturada: Alguns algoritmos usam padrões especiais de luz, geralmente gerados por lasers, para simplificar o trabalho e fornecer respostas mais precisas do que podem ser geradas a partir de uma cena com iluminação difusa de muitas fontes, muitas vezes imprevisíveis.
  • Análise estatística: Em alguns casos, estatísticas sobre a cena podem ajudar a rastrear objetos de pessoas. Por exemplo, rastrear a velocidade e o comprimento dos passos de uma pessoa pode identificá-la.
  • Análise de cores: Uma análise cuidadosa das cores em uma imagem pode responder a perguntas. Por exemplo, a frequência cardíaca de uma pessoa pode ser medida rastreando a onda ligeiramente mais vermelha que varre a pele a cada batida. Muitas espécies de aves podem ser identificadas pela distribuição de cores. Alguns algoritmos contam com sensores que podem detectar frequências de luz fora do alcance da visão humana.

Os melhores aplicativos para visão computacional

Embora o desafio de ensinar os computadores a ver o mundo permaneça grande, algumas aplicações restritas são bem compreendidas o suficiente para serem implantadas. Eles podem não oferecer respostas perfeitas, mas estão certos o suficiente para serem úteis. Eles atingem um nível de confiabilidade que é bom o suficiente para os usuários.

  • Reconhecimento facial: Muitos websites e pacotes de device para organizar fotos oferecem algum mecanismo para classificar as imagens pelas pessoas dentro delas. Eles podem, digamos, tornar possível encontrar todas as imagens com um rosto específico. Os algoritmos são precisos o suficiente para esta tarefa, em parte porque os usuários não exigem precisão perfeita e fotos mal classificadas têm pouca consequência. Os algoritmos estão encontrando alguma aplicação nas áreas de aplicação da lei e segurança, mas muitos temem que sua precisão não seja certa o suficiente para apoiar processos criminais.
  • Reconstrução de objetos three-D: Digitalizar objetos para criar modelos tridimensionais é uma prática comum para fabricantes, designers de jogos e artistas. Quando a iluminação é controlada, geralmente usando um laser, os resultados são precisos o suficiente para reproduzir com precisão muitos objetos suaves. Alguns alimentam o modelo em uma impressora three-D, às vezes com alguma edição, para criar efetivamente uma reprodução tridimensional. Os resultados das reconstruções sem iluminação controlada variam muito.
  • Mapeamento e modelagem: Alguns estão usando imagens de aviões, drones e automóveis para construir modelos precisos de estradas, edifícios e outras partes do mundo. A precisão depende da precisão dos sensores da câmera e da iluminação no dia em que foi capturada. Os mapas digitais já são precisos o suficiente para planejar viagens e são continuamente refinados, mas geralmente exigem edição humana para cenas complexas. Os modelos de edifícios são muitas vezes precisos o suficiente para a construção e remodelação de edifícios. Os telhadores, por exemplo, costumam oferecer trabalhos com base em medições de modelos digitais construídos automaticamente.
  • Veículos autônomos: Carros que podem seguir pistas e manter uma boa distância de seguimento são comuns. Capturar detalhes suficientes para rastrear com precisão todos os objetos na iluminação instável e imprevisível das ruas, no entanto, levou muitos a usar iluminação estruturada, que é mais cara, maior e mais elaborada.
  • Varejo automatizado: Donos de lojas e operadores de buying groceries costumam usar algoritmos de visão de máquina para rastrear padrões de compras. Alguns estão experimentando cobranças automáticas de clientes que pegam um merchandise e não o devolvem. Robôs com scanners montados também rastreiam o inventário para medir a perda.

[Related: Researchers find that labels in computer vision datasets poorly capture racial diversity]

Como os gamers estabelecidos estão lidando com a visão computacional

Todas as grandes empresas de tecnologia oferecem produtos com alguns algoritmos de visão de máquina, mas estes são amplamente focados em tarefas restritas e muito aplicadas, como classificar coleções de fotos ou moderar postagens de mídia social. Alguns, como a Microsoft, mantêm uma grande equipe de pesquisa que está explorando novos tópicos.

Google, Microsoft e Apple, por exemplo, oferecem websites de fotografia para seus clientes que armazenam e catalogam as fotos dos usuários. Usar o device de reconhecimento facial para classificar coleções é um recurso valioso que facilita a localização de fotos específicas.

Alguns desses recursos são vendidos diretamente como APIs para outras empresas implementarem. A Microsoft também oferece um banco de dados de características faciais de celebridades que podem ser usadas para organizar imagens coletadas pela mídia ao longo dos anos. As pessoas que procuram sua “celebridade gêmea” também podem encontrar a correspondência mais próxima na coleção.

Algumas dessas ferramentas oferecem detalhes mais elaborados. A API da Microsoft, por exemplo, oferece uma recurso “descrever imagem” que pesquisará em vários bancos de dados detalhes reconhecíveis na imagem, como a aparência de um marco importante. O algoritmo também retornará descrições dos objetos, bem como uma pontuação de confiança que mede a precisão da descrição.

Plataforma de nuvem do Google ofertas aos usuários a opção de treinar seus próprios modelos ou confiar em uma grande coleção de modelos pré-treinados. Há também um sistema pré-construído focado em fornecer pesquisa visible de produtos para empresas que organizam seu catálogo.

o Reconhecimento O serviço da AWS é focado na classificação de imagens com métricas faciais e modelos de objetos treinados. Ele também oferece opções de marcação de celebridades e moderação de conteúdo para aplicativos de mídia social. Um aplicativo pré-construído foi projetado para aplicar as regras de segurança no native de trabalho assistindo a vídeos para garantir que todos os funcionários visíveis estejam usando equipamentos de proteção particular person (EPI).

As grandes empresas de computação também estão fortemente envolvidas na exploração de viagens autônomas, um desafio que depende de vários algoritmos de IA, mas especialmente algoritmos de visão de máquina. O Google e a Apple, por exemplo, são amplamente divulgados como desenvolvendo carros que usam várias câmeras para planejar uma rota e evitar obstáculos. Eles contam com uma mistura de câmeras tradicionais e algumas que usam iluminação estruturada, como lasers.

Cena de inicialização de visão de máquina

Muitas das startups de visão de máquina estão se concentrando em aplicar o tópico à construção de veículos autônomos. Startups como Waymo, Pony AI, Wayve, Sim, Automação de cruzeiro e Argo são algumas das startups com financiamento significativo que estão construindo o device e os sistemas de sensores que permitirão que carros e outras plataformas naveguem pelas ruas.

Alguns estão aplicando os algoritmos para ajudar os fabricantes a melhorar sua linha de produção, orientando a montagem robótica ou examinando as peças em busca de erros. Visão Sacadapor exemplo, cria escaneamentos tridimensionais de produtos para procurar defeitos. Veo Robotics criou um sistema visible para monitorar “células de trabalho” para observar interações perigosas entre humanos e aparelhos robóticos.

Rastrear humanos enquanto eles se movem pelo mundo é uma grande oportunidade, seja por motivos de segurança, proteção ou conformidade. VergeSensepor exemplo, está construindo uma solução de “análise do native de trabalho” que espera otimizar a forma como as empresas usam escritórios compartilhados e sizzling desks. Kairós cria ferramentas de reconhecimento facial com experiência em privacidade que ajudam as empresas a conhecer seus clientes e aprimorar a experiência com opções como quiosques mais conscientes. AiCure identifica os pacientes pelo rosto, dispensa os medicamentos corretos e os observa para garantir que eles tomem o medicamento. Trueface observa clientes e funcionários para detectar altas temperaturas e aplicar os requisitos de máscara.

Outras empresas de visão de máquina estão se concentrando em tarefas menores. Reminipor exemplo, oferece um “AI Picture Enhancer” como um serviço on-line que adiciona detalhes para aprimorar as imagens aumentando sua resolução aparente.

O que a visão de máquina não pode fazer

A lacuna entre a IA e a capacidade humana é, talvez, maior para algoritmos de visão de máquina do que algumas outras áreas, como reconhecimento de voz. Os algoritmos são bem-sucedidos quando são solicitados a reconhecer objetos que são em grande parte imutáveis. Os rostos das pessoas, por exemplo, são em grande parte fixos e a coleção de proporções de distâncias entre as principais características, como o nariz e os cantos dos olhos, raramente muda muito. Portanto, os algoritmos de reconhecimento de imagem são adeptos de pesquisar em vastas coleções de fotos por rostos que exibem as mesmas proporções.

Mas mesmo conceitos básicos, como entender o que uma cadeira pode ser, são confundidos pela variação. Existem milhares de diferentes tipos de objetos onde as pessoas podem se sentar, e talvez até milhões de exemplos. Alguns estão construindo bancos de dados que procuram réplicas exatas de objetos conhecidos, mas muitas vezes é difícil para as máquinas classificarem corretamente novos objetos.

Um desafio specific vem da qualidade dos sensores. O olho humano pode trabalhar em uma ampla faixa de luz, mas as câmeras digitais têm problemas para igualar o desempenho quando a luz é mais baixa. Por outro lado, existem alguns sensores que podem detectar cores fora do alcance dos bastonetes e cones nos olhos humanos. Uma área ativa de pesquisa está explorando essa capacidade mais ampla de permitir que algoritmos de visão de máquina detectem coisas que são literalmente invisíveis ao olho humano.

Consulte Mais informação: Como a IA será usada eticamente no futuro? O AI Accountability Lab tem um plano

[ad_2]

Fonte da Notícia: venturebeat.com

Artigos relacionados

Botão Voltar ao topo