Você está na página 1de 4

Universidade de São Paulo

Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto


Departamento de Psicologia e Educação

Psicologia Cognitiva – Prof. Dr. César Alexis Galera

Suposições Visuais

Trabalho de Conclusão de Disciplina

Thiago Favaretto Tazinafo – no. USP: 3461150


endereço eletrônico: thitazinafo@gmail.com

08/12/05
O leitor já deve ter sentido que uma das maneiras mais ricas de se
aprender é justamente ensinando. É quando se ensina que, eventualmente, dá-se
conta de que seu conhecimento sobre o assunto em questão não é completo e
preciso como se supunha.

Com o perdão pela analogia prosaica, mas foi nesse tipo de situação em
que se encontraram os pioneiros da inteligência artificial quando se deram conta
de que o avanço nas ciências da computação dependeria de um feedback da
neurociência. Em outras palavras, é preciso investigar melhor o cérebro se
quisermos construir máquinas cada vez mais inteligentes. Por outro lado, essa
reflexão se desdobra na contemplação de um horizonte igualmente profícuo:
explicar a cognição humana por meio de modelos matemáticos – verdadeiros
algoritmos – que sejam suficientes. Tal é a via de mão dupla em que se
relacionam as ciências cognitivas e computacionais.

Num âmbito biológico, entretanto, essas explicações suficientes não


bastam. Esses modelos cognitivos matemáticos – ou seja, modelos
computacionais de mente – requerem plausibilidade biológica; devem, portanto,
ser apreciados à luz do pensamento neo-darwiniano. É justamente nisso que
consiste a psicologia evolucionista: construir modelos computacionais da mente
consistentes com a teoria da evolução, isto é, biologicamente plausíveis.

Somos seres basicamente visuais. Porque enxergamos desde o nascer – mas


também principalmente porque o processo visual ocorre num nível não cognitivo,
“low-level” – não nos distanciamos o suficiente, no cotidiano, para estranhar a
visão, refletir sobre a espantosa complexidade dos cálculos que o córtex visual
executa alheio a nossa consciência. Realizamos cálculos de gradientes, detecção
de bordas, e percepção de fundo que não são trivialmente implementáveis num
algoritmo.

O cômputo que o córtex visual executa é um procedimento de engenharia


reversa. Na formação de imagens na retina, o problema é relativamente simples: o
input é o estímulo luminoso externo e o output é uma representação 2-D – a
imagem retiniana – de um espaço ou cenário tridimensional. Evidentemente,
portanto, há perda de informação nesse procedimento. Já a percepção visual
ocorre de modo inverso: o input é a imagem retiniana e o output é uma
reconstrução visual do cenário. Portanto, os dados de saída contêm mais
informação que os de entrada!

Pensando por esse lado, a ótica reversa é um problema impossível. Como


analogia, pensemos numa multiplicação de números reais. Dados, digamos, três
números reais, pode-se facilmente obter o produto desses três números. Se
considerarmos, de modo inverso, que dispomos de um número e nos é requisitado
determinar quais três números reais multiplicados entre si o gerou, o problema se
torna impossível porque há infinitas soluções. Grosso modo, é esse tipo de
problema que o córtex visual resolve. Sendo assim, parece razoável supor que o
cérebro disponha de informações prévias que possibilitem uma solução unívoca.
Concluindo, portanto, que o cérebro completa os dados com as informações
faltantes, damos abertura à abordagem evolucionista da cognição.

Em filmes como “O Exterminador do Futuro” e “Robocop” algumas cenas


mostram imagens em primeira pessoa do ponto de vista dos robôs, ou seja, cenas
que nos revelam como seria o mundo do ponto de vista dos protagonistas
cibernéticos dos filmes: imagens em vermelho, como em “O Exterminador...” ou
parecidas como as de uma câmera amadora, como em “Robocop”. Em ambos,
diretrizes, cálculos e processos de tomada de decisão ocupam os cantos da tela,
revelando aos telespectadores em que estão pensando as máquinas naquele
momento. Essa linguagem inocente e didática, tão conveniente ao cinema de
entretenimento, carrega uma dose tão excessiva de antropocentrismo que chega a
ser desinformadora e enganadora. Não sou rabugento e cientificista a ponto de
esperar compromisso cientifico no cinema comercial – que eu próprio tanto
aprecio – mesmo porque a tal “ficção cientifica” desapareceria quase que por
completo. Entretanto, a simplificação hollywoodiana não-raro mina e seca o
precioso senso critico.

Quero mesmo, no entanto, tratar da visão e não de cinema. Numa projeção


mais realista, o que uma dessas máquinas inteligentes veria seria algo como uma
disposição de centenas de números de três ou quatro dígitos por todo o seu
campo visual. Cada um desses números correspondem a uma determinada
freqüência e intensidade luminosa.

Como ensinar ao Exterminador do Futuro diferenciar um pedaço de carvão


de um floco de neve? Primeiramente, determinamos que o floco de neve tem
brilho maior que o carvão. Entretanto, um pedaço de carvão ao sol pode ter mais
brilho que um floco de neve dentro de casa. Como nós o fazemos? O
procedimento de reconhecimento de padrões e objetos é contextualizado. Para
esse exemplo visual a psicologia cognitiva propõe o seguinte modelo: primeiro,
obtém-se o brilho médio da cena inteira; depois, calcula-se ponto-a-ponto a
diferença de brilho com relação à média. Os maiores valores são interpretados
como objetos brancos, os menores valores são objetos negros e valores
intermediários situam-se ao longo de uma escala de tons de cinza. Partindo-se do
pressuposto de que a luz-ambiente é uniformemente distribuída, tanto em termos
de freqüência quanto à intensidade luminosa, esse modelo matemático é
satisfatório. Tal é a suposição visual que viabiliza nossa percepção.

Se, por um lado, partir de suposições visuais tão gerais habilita-nos a


discriminar o ambiente natural com razoável competência, isso implica uma
especialização perceptória com relação a nosso mundo às custas de
suscetibilidade extrema a ilusões perceptivas caso expostos a estímulos
“alienígenas”: caso, por algum motivo, nos encontrarmos num ambiente em que
haja distribuição heterogênea de luz – luminosidade irregular e distribuição de
freqüências não-uniforme – estaremos sujeitos a reconhecer objetos que não
estão lá. Mas isso é exatamente o que acontece quando assistimos a uma
projeção de slides, de cinema, à televisão ou a uma tela de computador! Quando
da primeira exibição pública de uma película cinematográfica os espectadores
corrreram desesperados para fugir da locomotiva que chegava à estação
ferroviária. É a ironia de tirarmos benefício daquilo que é, a princípio, uma
deficiência ou imperfeição perceptória. Talvez isso seja indício de como filmes e
programas de TV podem influenciar nosso comportamento, um processamento
“low-level” induzindo padrões de comportamento num nível mais complexo de
cognição.

Adaptado de Como a Mente Funciona, de Steven Pinker. Cia. das Letras, 2a. Ed.
1997