Você está na página 1de 56

PERCEÇÃO, ATENÇÃO E MEMÓRIA

IRENE CADIME
imcadime@braga.ucp.pt

LICENCIATURA EM PSICOLOGIA
2018-2019
Reconhecimento de
objetos
Processos envolvidos no reconhecimento
de objetos (RO)
 Principais processos envolvidos no RO
Objetos cobrem outros ou são cobertos por outros no ambiente: decidir onde
cada objeto começa e acaba
 Objetos reconhecidos com precisão à distância e com orientações diferentes
 Alocar estímulos visuais díspares a um mesmo objeto: Reconhecimento do
objeto apesar das suas variações em termos de cor, tamanho, etc (e.g. livro)
Reconhecimento de
padrões
Reconhecimento de padrões (2D)
 Identificação ou categorização de padrões bidimensionais
Reconhecimento de símbolos alfabéticos e numéricos

Reconhecimento de padrões (RP)


Concordância: Combinação de informação do estímulo visual com informação
armazenada na memória
RP: Teorias do molde/“template”
 Existe uma cópia/molde dos padrões que conhecemos armazenada na MLP
 RP por emparelhamento do melhor molde ao estímulo visual

Limitações:
Variabilidade dos estímulos visuais

Melhorias:
Normalização do estímulo visual
Existe mais do que um molde para cada estímulo visual
RP: Teoria das características
 Padrão: conjunto específico de características ou atributos

 Processo de RP: extração de características dos estímulos visuais apresentados


que são, posteriormente, combinadas e comparadas com informação
armazenada na memória

Acomoda as questões da variação nos estímulos, p. ex. tamanho


RP: Teoria das características
 Evidência experimental
Neisser (1964): identificação de uma letra alvo (Z)
VI: características das letras
VD: tempo de identificação da letra alvo

Da análise detalhada de um padrão


ou objeto para uma análise mais
global ou geral?
Teoria das características
 Evidência experimental
Navon (1977)
 Inconsistência: performance mais lenta nas letras
pequenas; sem efeitos no reconhecimento da letra
maior
 Do processamento global à análise detalhada:
“uma cena é decomposta e não construída”

Kinchla & Wolfe (1979)


 Evidência contrária à obtida por Navon (apenas
quando uma estrutura pode ser observada com
uma única fixação do olhar)
Teoria das características
 Neurociência cognitiva
 Existirão células especializadas em responder a aspetos específicos do
estímulo visual?
Teoria das características
 Neurociência cognitiva
 Hubel & Wiesel (1979): vários tipos de neurónios no campo recetor do córtex
visual primário
1. Células simples
- Deteção (e.g. barras brancas em fundo preto)
- Cada uma responsiva a estímulos com determinada orientação
2. Células complexas
- Em maior nr e campos recetivos + extensos
- Boa resposta a contornos em movimento
3. Células hipercomplexas
- Responsivas a padrões complexos (e.g. cantos e ângulos)
Teoria das características
 Células corticais fornecem informação ambígua: respondem da mesma forma
a estímulos diferentes

Sekule & Blake (1994)


“os neurónios no córtex visual não podem ser designados de ‘detetores de
características’… porque as células individuais não podem sinalizar com certeza
a presença de uma característica visual particular”
Teoria das características
 Neurociência cognitiva
 Harvey, Roberts & Gervais (1983)
 Frequência espacial (contraste) é mais importante do que as características na
representação de letras no sistema visual
Teoria das características
 Avaliação - Alguns aspetos negligenciados na teoria:
•Efeito do contexto e da expectativa no reconhecimento de padrões
• Weisstein & Harris (1974): “efeito da superioridade do objecto” (inconsistente com a
teoria)
•RP depende também da relação entre as características
•Limitações na explicação de RO tridimensionais
•Processamento global precede frequentemente o processamento das
características (Ex: Navon, 1977)
Teoria computacional de
Marr
Teoria computacional de Marr
 Três tipos de representação (ou descrição) sobre o ambiente visual

1. Esboço primitivo (primal sketch)


 Descrição bidimensional das principais alterações da intensidade da luz,
incluindo informação sobre arestas e contornos
 Representação centrada no observador
Teoria computacional de Marr
 Três tipos de representação (ou descrição) sobre o ambiente visual

2. Esboço 2 ½ -D (2 ½ -D sketch)
 Incorpora descrição de profundidade e orientação das superfícies visíveis,
utilizando informação proveniente da sombra, textura, movimento, disparidade
binocular
 Representação centrada no observador
Teoria computacional de Marr
 Três tipos de representação (ou descrição) sobre o ambiente visual

3. Representação do modelo 3-D


Descreve as formas tridimensionalmente e a sua posição relativa
Independe do ponto de observação
Teoria computacional de Marr
Esboço primitivo “Bruto” (raw primal sketch)
SIMBÓLICOS

• Informação sobre mudanças de intensidade luminosa


• Informação falível (outras razões: ângulo incidência da luz,
sombras, textura dos objetos)

Esboço primitivo “Completo” (full primal sketch)


• Usa informação do esboço anterior para identificar o
número e formas dos objetos visuais
Teoria computacional de Marr
 Esboço primitivo
 Marr forneceu uma das primeiras considerações sobre os processos
iniciais da perceção visual (agrupamento)
Não consideração de conhecimento prévio sobre o objeto ou
expectativas
Defende que o agrupamento se baseia em representações
bidimensionais
 Rock & Palmer (1990): agrupamento pode também basear-se em
representações tridimensionais
Teoria computacional de Marr
 Esboço 2 ½ -D
Do esboço primitivo ao Esboço 2 ½ -D: estádios
 Construção de um mapa de extensão/alcance: informação sobre a profundidade
ponto a ponto das superfícies da cena
 Descrições de nível elevado: combinação da informação de partes relacionadas do
mapa de alcance

Que tipos de informação levam do esboço primitivo ao 2 ½-D?


 Uso de informação relativa à sombra, movimento, textura, forma e disparidade
binocular
Teoria computacional de Marr
Modelo 3-D
Esboço 2 ½-D é base deficitária para identificação dos objetos: ponto de vista centrado,
dependente do ângulo de observação

Marr & Nishiara (1978): critérios desejáveis para a 3-D


•Acessibilidade - uma representação pode ser facilmente construída
•Extensão - a representação pode ser aplicada a todas as formas numa determinada
categoria
•Unicidade - todos os diferentes pontos de vista de um objeto produzem a mesma
representação
•Estabilidade e sensibilidade - uma representação incorpora as semelhanças entre
objetos e as diferenças salientes
Teoria computacional de Marr
 Marr & Nishiara (1978)

 Unidades primitivas de descrição dos objetos são cilindros com maior eixo

Organizados hierarquicamente

Eixos principais dos objetos são fáceis de estabelecer (independe do ponto de


vista)
Teoria computacional de Marr
Teoria computacional de Marr
 Modelo 3-D

 RO: correspondência entre representação 3D elaborada a partir do estímulo


visual com a representação 3D armazenada na memória:

 Identificação das concavidades (divisão da imagem em segmentos)


 Identificação dos eixos principais de cada segmento
 Permite RO, independentemente do ângulo de observação
Teoria computacional de Marr

concavidades
Teoria de RO por
componentes
Teoria de reconhecimento por componentes
 Biederman (1987, 1990)
 Objetos consistem em formas básicas ou componentes “geons” (iões
geométricos)
 Exs: blocos, cilindros, esferas, arcos e contornos possíveis
Possibilidade de diferentes relações espaciais entre os “geons”
Comparação da informação recolhida com a representação ou modelo
estrutural que contenha informação sobre a natureza dos geons relevantes, suas
orientações, tamanhos, etc
Reconhecimento pelo melhor “encaixe”
Teoria de reconhecimento por componentes
Como são determinados os geons?

Extração de contornos
Pontos em curvatura
Pontos em paralelo Deteção de propriedades Análise das regiões
Cantos em co-
não acidentais côncavas (segmentação)
terminação
Pontos em linha reta
Determinação de
componentes

Emparelhamento de
componentes com as
representações de objetos
Teoria de reconhecimento por componentes
 Reconhecimento por componentes de Biederman
 Porque é que o RO nem sempre ocorre em situações normais?
 Propriedades invariantes podem ser detetadas só em parte do objeto
 Desde que as concavidades estejam visíveis, é possível reconstruir a parte
omissa
 Informação redundante disponível

O problema da ligação (binding problem)


 Hummel & Biederman (1992): modelo conexionista
Teoria de reconhecimento por componentes
Teorias de Marr e de RO por componentes
 Avaliação:
Humphreys & Riddoch (1994): RO por vários processos
 Codificação de contornos
 Agrupamento em características de ordem superior
 Correspondência com conhecimento estrutural armazenado
 Acesso ao conhecimento semântico

Mais realista para RO tridimensionais, mas muito limitada…


Teorias de Marr e de RO por componentes
Avaliação:
 Nem sempre é possível identificar as partes constituintes dos objetos
Nem sempre o processo de extração de contornos fornece informação
suficiente para RO
Nem sempre o RO envolve comparação de uma representação do objeto
(independente do ponto de observação) com informação do objeto armazenada
na MLP
Teorias de Marr e de RO por componentes
Avaliação
Não explicam como
decorrem discriminações
percetivas subtis dentro
de uma classe de objetos
Não consideram a
importância do papel do
contexto no RO
Classificação das teorias de RO
 Teorias do ponto de vista invariante
 A facilidade do RO não é afetada pelo ponto de vista do observador
Biederman (1987)

 Teorias do ponto de vista dependente


As modificações do ponto de vista reduzem a rapidez e/ou a precisão no RO
Tarr (1985); Tarr & Bulthoff (1995, 1998)

Suporte experimental para ambas as teorias


Teorias do ponto de vista dependente e
invariante
 Phinney & Siegel (1999): RO baseia-se quer em representações internas
bidimensionais quer tridimensionais dos objetos

Eficácia diferenciada em tarefas de RO (Tarr & Bulthoff, 1995, 1998)


 Ponto de vista invariante (3D) mais eficaz para tarefas fáceis de discriminação
entre categorias
 Ponto de vista dependente (2D) mais eficaz para tarefas que envolvam
discriminações dentro de categorias
Abordagem da
Neuropsicologia Cognitiva
Abordagem da neuropsicologia cognitiva
Anomia categorial
Agnosia visual Afasia ótica
específica
Incapacidade de RO, Incapacidade para Incapacidade seletiva
embora a informação nomear objetos para nomear certas
visual atinja o córtex apresentados categorias de objetos
visualmente embora a (mais frequente para
Agnosia apercetiva função do objeto possa categorias de elementos
Agnosia associativa ser mimetizada vivos do que para
inanimados)
Abordagem das ciências
cognitivas
Modelo de Farah e McClelland (1991)
 Modelo computacional baseado numa rede conexionista

Semântico

Arquitectura Visual Funcional


do modelo

Sistema de Sistema de
input verbal input visual
Modelo de Farah e McClelland (1991)
 Sistema semântico dividido em:
 Unidades visuais – informação sobre as características visuais dos objetos (3x
mais)
 Unidades funcionais ou semânticas – informação semântica sobre a utilidade
ou forma apropriada de interação com o objeto

Simulação de agnosia visual pela introdução de “lesões” no sistema


semântico
 Lesões nas unidades visuais prejudicam mais o RO vivos do que inanimados
 Lesões nas unidades funcionais são menos prejudiciais (afetam RO
inanimados)
Modelo de Farah e McClelland (1991)
 Avaliação
Vantagens
• Simplicidade da teoria
• Explica a dupla dissociação no RO vivos e inanimados
• Explica maior RO inanimados do que vivos

Desvantagens
• Processo de RO mais complexo do que o sugerido
• Unidades visuais e percetivas do sistema semântico interligadas?
• Riddoch & Humphreys (1993): pacientes apresentam memória funcional intacta mas défice
na memória visual para os mesmos objetos
Modelo de Farah e McClelland (1991)
 Avaliação
Desvantagens
• Sistema semântico organizado em subsistemas
visual e funcional?
• Sistema semântico organizado segundo uma
base categorial?

Damasio et al. (1996)


Modelo de Humphreys et al. (1995)
 Modelo de ativação interativa e de competição do RO e nomeação, também
aplicado à agnosia visual
Modelo de Humphreys et al. (1995)
 Características
Ligações excitatórias bidirecionais entre unidades de níveis adjacentes
Ligações mutuamente inibitórias entre unidades de cada nível
Alguma ativação de descrições estruturais de objetos semelhantes ao objeto
apresentado visualmente
Coisas vivas visualmente mais semelhantes a outros membros da mesma
categoria que coisas inanimadas
Modelo de Humphreys et al. (1995)
 Evidências
 Tempo de identificação de coisas vivas mais lento, mas categorização mais rápida
Humphreys, Riddoch e Quinlan (1988, 1995)
 Objetos com nomes comuns nomeados mais rapidamente (> ativação semântica)
 Este efeito de frequência é maior para objetos inanimados que para vivos
Pacientes com agnosia associativa: maior dificuldade em identificar objetos
vivos que inanimados (mas bons a categorizar)
Modelo interativo: maior ativação de representações estruturais irrelevantes
dificultam a nomeação de objetos
Modelo de Humphreys et al. (1995)
 Avaliação: Vantagens
 Descreve RO em indivíduos normais e com várias desordens visuais
 Detalha o processo, é aplicável ao RO, à nomeação de objetos e à
categorização de objetos
 Boa explicação para casos em que existe informação funcional ou semântica
intacta, mas informação visual sobre os objetos deteriorada
 Lesões nas conexões entre as descrições estruturais e representações
semânticas permite acesso à informação visual, mas dificuldade no acesso à
informação semântica
Modelo de Humphreys et al. (1995)
 Avaliação: Desvantagens
 Não explica fenómenos dos pacientes com pior capacidade em nomear e
aceder à informação semântica para coisas inanimadas do que para coisas
vivas
Teoria geral da visão de nível elevado
 “General theory of high-level vision”, Kosslyn et al. (1990)
Modelo de processamento visual que envolve o uso de informação previamente
armazenada
Uso de informação sobre o funcionamento cerebral como base
Construção de um modelo de simulação computacional
Integração de informação sobre várias lesões do sistema visual
Teoria geral da visão de nível elevado
 Pressuposto: Codificação da informação ocorre em subsistemas separados
Comparação da informação recolhida com a informação armazenada para RO
Criação de uma hipótese para RO
Procura descendente (top-down) testa a hipótese
Processo interativo entre processos
Teoria geral da visão de nível elevado
 Rede paralela de funcionamento

Integração da
informação
Identificação das propriedades
não acidentais
Teoria geral da visão de nível elevado
 Simulação computacional

Porque é que algumas desordens da perceção visual podem ser produzidas de


tantas formas?
 Natureza inter-relacional do sistema de processamento visual

 Simultagnosia
 Dano parcial no sub-sistema de propriedades espaciais responsável pela produção de
representação espacioscópica
Teoria geral da visão de nível elevado
 Avaliação
Vantagens
• Primeira teoria a propor sub-sistemas de processamento computacional
subjacentes a um nível de visão elevada
• Base de trabalho para os neuropsicólogos cognitivos perceberem as
observações em pacientes com dano cerebral
• Integra fenómenos atencionais e percetivos
Desvantagens
• Nível geral
• Reduzida operacionalização dos processos que ocorrem em cada sub-sistema
Leituras recomendadas
Eysenck, M. W. & Keane, M. T. (2010). Cognitive Psychology: A Student’s
Handbook. New York: Psychology Press. (capítulo 4)

Você também pode gostar