TSAI (1987) informa que em visão artificial existem câmeras unidimensionais (câmeras de varredura de linhas) e bidimensionais (câmeras de área), sendo que a grande maioria das aplicações utiliza este segundo modelo. Dentro das classes de câmeras, existem inúmeras escolhas a serem feitas como por exemplo, se esta vai obter imagens monocromáticas ou coloridas, qual o ângulo e o campo de visão, resolução, entre outras características.
A resolução refere-se ao número de linhas e colunas na imagem, sendo determinada pela câmera, em que as de varredura de área sua resolução é expressa como linhas e colunas de pixels, como por exemplo 640x480, já no caso de varredura por linha sua resolução é expressa apenas por colunas de pixels, as linhas possuem sempre o valor 1.
Para tornar possível a análise computacional sobre imagens, é necessário que os dados estejam na forma digital, isto é, a luminosidade deve ser convertida em sinais elétricos distribuídos espacialmente. Para que o processo de aquisição de imagem seja bem compreendido é necessário tratar da imagem em si e suas formas de representação.
O fotodetector é capaz de transformar luz (fótons) que são sinais ópticos em sinais elétricos e pode ser construído utilizando materiais semicondutores. O dispositivo necessário para a aquisição da imagem é um elemento físico sensível à energia luminosa, ou seja, a câmera, é um transdutor que é responsável por transformar a energia luminosa em sinal elétrico. Este sinal de saída é proporcional à intensidade luminosa incidente no dispositivo fotossensível. A sensibilidade da câmera é uma unidade fotométrica usada para medir o nível de iluminação, e é definida como sendo a iluminação sobre uma superfície quando o fluxo luminoso de 1 lúmen
incide sobre uma área de 1 metro quadrado, é também conhecido por candela, e está diretamente relacionada com a quantidade de luz mínima necessária para garantir a qualidade de imagem. Porém, é aconselhável que o local a ser instalado a câmera tenha luminosidade aceitável para os olhos, assim o transdutor não irá apresentar nenhum problema.
O principal objetivo da iluminação é a otimização do contraste, que pode ser considerado como a qualidade do sinal. O contraste é uma medida da diferença entre duas regiões: o objeto e o fundo da imagem. O primeiro passo na determinação da iluminação é escolher como diferenciar estas duas regiões, afirma GONZALES (1993).
Uma câmera colorida tem menor sensibilidade do que as monocromáticas, porque precisam processar mais cores para gerar a imagem, portanto precisam de mais luz para gerar boas imagens. As câmeras com sensores de imagem funcionam de maneira similar a câmeras com filme. Em ambas, a luz é focalizada por uma lente (ou conjunto delas) e incide sobre o sensor de imagem sensível à luz CCD ou CMOS, que convertem a luz em elétrons através do efeito fotoelétrico, já a câmera com filme, existe uma película fotossensível, LITWILLER (2001).
Na fotografia digital a imagem formada pela objetiva dentro da câmera não atinge uma emulsão fotossensível (o filme em câmeras antigas) e sim o dispositivo eletrônico sensível à luz, que é responsável por interpretar os impulsos luminosos da imagem quanto à sua intensidade (luminância) e coloração (crominância). Estas informações são codificadas de forma digital e armazenadas numa memória temporária (buffer memory) e posteriormente enviadas para um dispositivo de armazenagem (memory stick, hard disk, ou outro).
O sensor fotossensível é composto por milhares de elementos sensíveis a luz, e a imagem formada sobre ele é dividida em vários elementos de imagem, chamados pixels. Cada pixel contém informações correspondentes a aquela área da imagem. O principio de funcionamento pode ser explicado por analogia a um tabuleiro de damas, onde cada quadrado representa um pixel, e em cada ponto existe uma informação. Quando a imagem está colocada sobre a superfície do tabuleiro, cada quadrado é lido de forma sequencial por um circuito eletrônico que faz a conversão dos dados analógicos para digitais, A/D e transforma o valor de cada pixel em um valor digital por meio da quantidade de carga de cada pixel e converte essa medição para a forma binária, segundo GONZALES (2004).
A FIG. 2.7 mostra o esquema de um sistema de aquisição de imagem. Pode-se perceber que o sensor é uma matriz de elementos fotossensíveis. Assim a imagem de saída do sensor é uma discretização da cena do mundo real. Quanto maior for o número de elementos do sensor, melhor será a resolução da imagem obtida, já que cada elemento irá resultar em um pixel. Havendo uma maior quantidade de elementos significa que uma menor parte da cena do mundo será representada por um único valor de nível de cinza, fazendo com que não se perceba a transição entre um pixel e outro.
FIGURA 2.7 - Aquisição de imagem. FONTE: GONZALES, 2004.
Os sensores de captação de imagem são susceptíveis a ruídos, sendo os mais comuns:
a. os que ocorrem quando a capacidade de carga de um pixel é excedida; b. os associados à chegada aleatória de fótons;
c. os que ocorrem na conversão de carga elétrica para tensão e na conversão A/D; d. os que ocorrem mesmo na ausência de luz. E os elétrons gerados termicamente
são coletados no CCD.
Algumas são características das câmeras, e estas serão apresentadas a seguir, começa-se pelo ganho que é uma função normalmente implementada pelo hardware. A carga extraída de cada um dos condensadores do sensor é amplificada antes de ser quantizada. Isto tem o efeito de tornar as imagens mais claras, mas também mais ruidosas, visto que o ruído também é amplificado. Normalmente, o ganho pode ser colocado em modo automático, ou seja, a própria câmera regula a quantidade de ganho a ser aplicado através de um algoritmo implementado por
software que avalia a claridade de cada imagem precedente antes de regular o ganho da seguinte. Outra característica é o tempo de exposição, que é o tempo em que o diafragma, responsável por deixar entrar a luz para o sensor, se encontra aberto. Este tempo é limitado pela velocidade de transmissão das imagens adquiridas. Por exemplo, se a velocidade for de 15 imagens por segundo, o diafragma apenas pode estar aberto 1/15 segundo. Quanto mais tempo estiver aberto, mais clara fica a imagem obtida, mas ao contrário do ganho, este processo baixa a SNR da imagem. O tempo de abertura pode também por vezes ser posto em modo automático, no qual o software da câmera avalia, tal como para o ganho, o tempo que deve ser usado para obter a frame seguinte, baseado na quantidade de claridade que ficou submetida na captura anterior, de modo a não torná-las ruidosas, conforme JÜNGEL et al. (2003).
A claridade e o contraste são implementados apenas pelo software da câmera. Para o primeiro, cada pixel é adicionado um valor fixo de claridade o que tem o efeito de tornar a imagem mais clara (valor positivo) ou mais escura (valor negativo). Em casos extremos, este processo tem o efeito de torná-la ou completamente preta ou completamente branca. Este parâmetro da câmera não pode normalmente ser colocado em modo automático. Já para o contraste, cada pixel, subtrai metade do máximo valor possível, multiplica o resultado pelo valor de contraste escolhido e volta a somar metade do valor máximo possível. Esta operação tem o efeito de aproximar as cores claras do branco e as escuras do preto. Num caso extremo, a imagem ficaria branca e preta. Esta função serve para se poder distinguir melhor as cores. A saturação de uma cor refere-se ao quão mais vibrante esta é. Uma cor pouco saturada aproxima-se do cinzento, enquanto se for muito saturada torna-se brilhante. Os algoritmos, implementados por software, variam de câmera para câmera. A coloração algumas vezes é erroneamente confundida com a saturação. Alterar este parâmetro na câmera tem o efeito de alterar completamente as cores de uma imagem e, como tal, não é usado por defeito pela câmera e também não pode ser posto em modo automático.
O balanço de brancos é uma das funções mais importantes da câmera. Costuma ser implementada por software. Diferentes fontes de iluminação dão tonalidades a uma imagem capturada que não seja tratada. Por exemplo, a luz do sol dá uma tonalidade azul às imagens, enquanto que a luz de uma lâmpada comum (tungstênio) dá-lhes uma tonalidade vermelha. Para compensar este problema, a câmera pode ajustar as tonalidades vermelha e azul (e por vezes até a verde, mas não é comum) da imagem de forma a que esta tenha um aspecto 'natural'.