Historicamente, a capacidade de enxergar foi considerada uma habilidade exclusiva dos seres vivos. Humanos e animais têm a habilidade de observar o ambiente, reconhecer rostos e evitar obstáculos de forma quase instantânea. Atualmente, no entanto, máquinas estão começando a replicar esses comportamentos, graças aos AVANÇOS em Inteligência Artificial e VISÃO computacional.
A VISÃO computacional é uma área tecnológica que capacita computadores e robôs a interpretar imagens e vídeos. Ao contrário de câmeras comuns, que apenas capturam o que veem, esses sistemas analisam e interpretam o conteúdo visual, permitindo a identificação de pessoas, objetos e movimentos, além de comportamentos e distâncias.
Embora a percepção de máquinas ainda não alcance a complexidade da VISÃO humana, essa tecnologia tem transformado robôs em sistemas autônomos que conseguem perceber seu ambiente, reagir a mudanças e tomar decisões em tempo real. Essa inovação já se faz presente em diversas APLICAÇÕES, como em carros autônomos, drones para uso agrícola, sistemas de segurança, monitoramento ambiental, hospitais e linhas de produção industrial.
O processo de VISÃO COMEÇA com a instalação de câmeras e SENSORES nos robôs, que capturam imagens do ambiente em tempo real, funcionando de maneira análoga aos olhos humanos. Dependendo da finalidade, diferentes tipos de SENSORES são utilizados. Entre os mais comuns estão as câmeras RGB, que registram cores como uma câmera convencional, e os SENSORES infravermelhos, que detectam calor ou podem operar em ambientes com pouca luz. Câmeras térmicas são também utilizadas para visualizar variações de temperatura.
Entretanto, enxergar não é o bastante. É necessário que o robô compreenda profundidade e posição espacial, para o que são empregados SENSORES de profundidade. Modelos mais simples, como os usados em robôs aspiradores, são capazes de estimar a distância entre objetos, permitindo que se desviem de móveis e escadas.
Modelos mais sofisticados utilizam tecnologia LiDAR, que emprega feixes de laser para criar mapas tridimensionais do ambiente. Essa tecnologia é capaz de reconhecer placas de trânsito, faixas de pista, pedestres e obstáculos à frente, além de monitorar condições climáticas e a movimentação de outros veículos, tudo isso em milissegundos enquanto o veículo se desloca.