Escolar Documentos
Profissional Documentos
Cultura Documentos
- Índices: são signos que tem uma relação causal ou factual com o objeto que
representam (há uma relação mais natural e não convencional, do que nos
símbolos)
“aqueles cuja relação com o objeto consiste numa relação de facto”
ex: o fumo é um índice de fogo, relação entre assassino e vítima
O sistema de troca de turnos tem uma série de propriedades básicas (com pequenas
diferenças entre as linguagens):
● os turnos não tem um tamanho fixo mas tendem a ser curtos
(com cerca de 2 s de duração em média, embora possam ser turnos mais longos,
como, por exemplo, para contar uma história)
● as respostas são extremamente rápidas
● o sistema organiza os falantes de modo a minimizar a sobreposição
● o sistema é altamente flexível no que respeita ao número de falantes ou à
duração dos turnos
● muitas vezes, os turnos têm uma construção muito complexa, de tal modo que o
processamento cognitivo subjacente é altamente comprimido
Para além de compreender simplesmente o sinal à medida que este chega, as condições
prévias para que B dê uma resposta sensata a tempo (cerca de 200 ms após o fim da vez
de A) são as seguintes:
(i) B deve tentar prever o ato de fala (detetar se o enunciado de A é uma pergunta, uma
oferta, um pedido, etc.) o mais cedo possível, porque é a isso que B vai responder
(ii) B deve começar imediatamente a formular uma resposta, passando por todas as fases
de conceptualização, recuperação de palavras, construção sintática, codificação fonológica,
articulação
(iii) Entretanto, B deve usar a sintaxe e a semântica do turno de A para estimar a sua
duração provável, escutando pistas prosódicas para o fecho;
(iv) assim que essas pistas forem detetadas, B deve dar a resposta.
Recentemente, tornou-se disponível alguma informação sobre cada uma destas fases, com
o EEG.
O reconhecimento de atos de fala não é trivial, porque não existe um mapeamento unívoco
da forma para a função: "Eu tenho um carro" pode funcionar como resposta a uma
pergunta, prelúdio de uma oferta de boleia ou recusa de uma oferta de boleia, tudo
dependendo do contexto (ex, respetivamente, "Vai de comboio?", "Acabei de perder o último
comboio", "Precisa de boleia?"). No entanto, neste tipo de contexto limitativo, o
reconhecimento do ato de fala demonstrou ser muito rápido, utilizando o EEG, nos primeiros
400 ms após o início do turno.
4. Saber relacionar o conceito de turn-taking com evidência empírica que justifica que
seja entendido por Levinson como sendo a expressão de um instinto- algo inato
(interactional engine).
Levinson argumenta a favor da existência de uma capacidade interacional distinta,
subjacente ao nosso comportamento comunicativo e à linguagem em particular. As
capacidades comunicativas podem ser dissociadas da linguagem: são antecedentes na
ontogénese e na filogenia e permitem que os seres humanos comuniquem eficazmente sem
linguagem, quando estão privados dela. Estas capacidades são, nas suas propriedades
cruciais, universais - relativamente invariantes - em todos os grupos culturais, em forte
contraste com a especificidade cultural da codificação linguística. Além disso, é esta
capacidade interaccional que está na base da própria possibilidade da linguagem: as
línguas são aprendidas no nicho interaccional, no âmbito da estrutura que este proporciona,
com atenção conjunta aos referentes que estão a ser nomeados, com o exercício da
reparação iniciada pelo outro e com todo o quadro funcional que as sequências de acções
(actos de fala) proporcionam. É a esta capacidade de interação que chamou "o motor da
interação".
Poderá ser feita a objeção de que esta capacidade de interação não é uma coisa única,
mas antes um conjunto de vários talentos e propensões, com diferentes origens
filogenéticas e diferentes padrões ontogenéticos de desenvolvimento.
Tudo isto é indubitável - o motor da interação não é um módulo Fodoreano, ou uma
mutação milagrosa única Chomskyana, ou uma faculdade psicológica. É antes um conjunto
de várias capacidades, instintos e motivações que trabalham em conjunto para tornar
possível o milagre da comunicação humana. É o apanhado de elementos úteis reunidos ao
longo de uma longa filogenia, parte da qual pode ser reconstruída por comparação entre
espécies, culturas e antepassados evolutivos.
. Uma das razões pelas quais Levinson apoia a ideia de que a tomada de turnos é um
instinto é a quase universalidade das práticas de tomada de turnos em diferentes
culturas. Ele argumenta que, se a tomada de turnos fosse apenas um comportamento
aprendido, esperaríamos ver uma variação significativa nas normas e práticas de tomada de
turnos entre as culturas. No entanto, os padrões observados na tomada de turnos são
notavelmente consistentes, indicando uma base instintiva compartilhada.
- Embora exista um padrão cultural substancial no comportamento conversacional, a
sua organização fundamental demonstrou recentemente ser fortemente universal. A
alternância de turnos, tem propriedades distintivas recorrentes em todas as línguas
que foram examinadas:
- o tempo é preciso, com intervalos de ~200 ms, a sobreposição de falas tende
a ser mínima e breve (~5% do fluxo de fala < 100 ms)
- Um falante recebe uma unidade mínima semelhante a uma frase como turno
inicial, que pode ser estendida por acordo tácito ou explícito a outra unidade
semelhante, mas depois de cada uma dessas unidades, pode ocorrer a
transição de falante (a menos que um falante seja especificamente
selecionado, o primeiro a começar torna-se o falante seguinte). Um estudo
de 10 línguas de cinco continentes mostrou apenas pequenas diferenças no
tempo (Stivers et al., 2009).
- De facto, a tomada da vez parece pertencer a um conjunto de propensões
subjacentes à comunicação humana, incluindo o carácter presencial que
permite a utilização de gestos e do olhar, bem como a motivação e o
interesse por outras mentes, que designaram "o motor da interação". Estas
tendências geram um grande número de universais de utilização da língua,
incluindo princípios de inferência pragmática e de reparação. A grande
proporção de horas de vigília passadas neste tipo de comunicação é também
notável (tendemos a passar 2 horas por dia, produzindo cerca de 1500
turnos). Embora haja variações e limitações culturais e individuais em todas
estas questões, todo o sistema de interação tem um carácter pan-humano.
Se a tomada de turno humana for homóloga à de outros primatas, isso sugeriria uma
evolução estratificada da comunicação humana.
- Os primeiros H. erectus herdam o sistema interacional gestual (turn taking gestual)
…e começam a inserir vocalizações “na máquina interacional”. Um “novo modo de
vida” ter-se-ia estruturado nas comunidades H. erectus, co-emergindo com ele o uso
de símbolos vocais linearmente organizados. Hipoteticamente, o processo culmina
com a otimização estrutural do cérebro humano para o uso desta linguagem nas
comunidades H. heidelbergensis.
- No H. heidelbergensis (talvez a origem do turn taking vocal tenha sido há 1 Milhão
A) consolida-se um léxico mental e o plano da “vez” gestual serve de matriz para a
organização temporal das produções vocais.
- As capacidades linguísticas modernas terão surgido há 500 Mil A, com genes
modernos, controlo respiratório e caixa vocal.
A variedade africana do Homo erectus (cerca de 1,6 Milhões A) parecia não ter o controlo
da respiração necessário para a fala moderna, mas pode (tal como os outros grandes
primatas) ter tido um sistema de gestos desenvolvido que ainda é visível na comunicação
humana. Algures antes do ancestral comum dos humanos modernos e dos neandertais
(600 000 A) todos os pré-requisitos genéticos e fisiológicos para a fala parecem ter sido
criados.
- Durante os milhões de anos que se passaram, o simples turn taking vocal pode ter
fornecido a estrutura para uma complexidade linguística em evolução, exatamente
como acontece com os bebés de hoje.
- As propriedades temporais da tomada de turno podem ter permanecido fixas,
enquanto material linguístico cada vez mais complexo foi sendo
progressivamente incluído nos turnos, com a diversidade linguística a ser
agora influenciada pela evolução cultural. Isto explicaria, de certa forma, como
o sistema moderno evoluiu com o processamento intensivo forçado pela
produção e resposta rápidas de turnos vocais breves.
NOTA!
Gentilucci e Corballis (2006) propõem que, em particular com os primeiros H. erectus, se
instalou o uso de uma linguagem gestual complexa, baseada num léxico mental que
associava por um lado movimentos manuais a significados (denotação de referentes) e,
por outro, gestos faciais sobretudo a elementos modificadores desses conteúdos,
talvez mesmo, especulativamente, a uma protossintaxe.
De acordo com a teoria motora da percepção dos sons da fala, o processamento da fala
humana envolve mecanismos percetivos que são influenciados pela gestualidade,
sugere que os movimentos articulatórios envolvidos na produção da fala são essenciais
para a percepção e compreensão dos sons da fala.
- Núcleo motor nas aves é semelhante ao córtex motor laryngeal dos humanos
- Núcleo estriatal nas aves é semelhante às partes do estriado que controlam a
produção e aprendizagem da fala nos humanos
“A Área X das aves canoras, uma região estriatal necessária para a aprendizagem vocal,
era mais semelhante a uma parte do estriado humano ativada durante a produção da fala.
O análogo da AR (núcleo robusto do arcopálio) das aves, necessário para a produção de
canções, era mais semelhante às regiões do córtex motor da laringe em humanos que
controlam a produção da fala. Mais de 50 genes contribuíram para a sua especialização
convergente e foram enriquecidos em funções de controlo motor e de conectividade neural.
Estes padrões não foram encontrados nos não-aprendentes vocais, mas o AR das aves
canoras era semelhante à camada 5 do córtex motor dos primatas para outro conjunto de
genes, apoiando hipóteses anteriores sobre a semelhança destes tipos de células entre os
cérebros das aves e dos mamíferos.”
Em The Descent of Man (1871), o próprio Darwin apresentou uma teoria "Caruso" para a
evolução da linguagem: os machos que cantavam melhor eram selecionados
sexualmente pelas fêmeas [como nas aves canoras, mas a direção oposta na seleção
sexual é igualmente possível para os seres humanos], o que, por sua vez, levou ao
aperfeiçoamento do aparelho vocal, como a cauda do pavão. Uma melhor competência
vocal foi acompanhada por um aumento geral do tamanho do cérebro que, por sua
vez, conduziu à linguagem - linguagem usada para o pensamento mental interno:
"Uma longa e complexa linha de pensamento não pode ser levada a cabo sem palavras,
faladas ou silenciosas, tal como um longo cálculo sem o uso de números ou álgebra"
(Darwin, 1871).
10. Saber relacionar a operação Merge com a capacidade expressiva das línguas
humanas nos níveis de organização morfológico, sintático e discursivo.
A operação Merge desempenha um papel essencial na capacidade expressiva das línguas
humanas nos níveis morfológico, sintático e discursivo, possibilitando a criação de novas
palavras, a formação de estruturas sintáticas complexas e a organização do discurso
de maneira coerente e coesa.
. No nível sintático, o Merge é responsável pela formação de estruturas de frases. Por via
da combinação de palavras, frases e constituintes, a operação Merge gera hierarquias
sintáticas complexas. Essa capacidade expressiva permite a construção de frases com
diferentes estruturas, como perguntas, negações, orações relativas, etc. O Merge também
permite a expressão de relações gramaticais, como sujeito-verbo-objeto, adjetivo-nome,
entre outras, fornecendo um meio para organizar as informações dentro da frase.
12. Compreender o papel do momento da inserção da voz (Voice Onset Time, VOT) e
da duração das turbulências na codificação da identidade dos fonemas da fala
humana.
- VOT (é uma variável contínua): o breve instante que decorre entre o movimento
inicial dos órgãos da fala, quando se começa a articular um som vocal, e a vibração
da corda vocal.
- Por outras palavras, é o tempo que decorre entre a libertação do fecho e o início da
vocalização da vogal seguinte; é um tempo relativo, tempo que torna como
referência a libertação da oclusão, momento em que o som sai para o exterior.
- Se o início da vocalização ocorrer antes da oclusão, o VOT é negativo. Caso
contrário, o VOT é positivo.
- Consoantes oclusiva sonoras: VOT <25 ms (ex: b,d,g) - as cordas vocais começam
a vibrar muito cedo, antes do movimento articulatório
- Consoantes oclusivas surdas: VOT >25 ms (ex: p,t,k)- as cordas vocais começam a
vibrar tardiamente, tem um momento inicial de turbulência, o impacto do ar no
exterior, pelo que não há uma intervenção das cordas vocais no processo de
identificação. (com cordas vocais o f torna-se um v)
- A duração das turbulências serve de base para a codificação de
diferentes consoantes.
- Consoantes oclusivas surdas: 10-15 ms (travo a saída do ar e acumulo
pressão) (ex: p, t, k)
- Consoantes constritivas fricativas: 100 ms (não impeço completamente a
saída do ar mas restrinjo-a de forma significativa, é algo tipo assobio) (ex: f,
s, c, ç, x, ch)
- Presença de voz (vibração das pregas vocais) e consoantes
constritivas fricativas: distinção entre consoantes constritivas fricativas
surdas (/f/, /s/, /x/) e sonoras (/v/, /z/, /j/).
- Assume-se que estas simulações são ativadas de forma automática e rápida, mas
podem não dominar a cognição consciente deliberada, de forma imediata.
- Assim que a palavra é reconhecida, assume-se que as formas linguísticas
associadas são geradas como inferências, e como apontadores para a informação
conceptual associada.
Nota: inputs – é o processo de entrada no léxico mental. É um processo que vai estar
constantemente à procura de uma correspondência entre a lista de entidades de fonemas e
entradas no nosso dicionário mental. Por exemplo, o processo de acesso lexical, mal
aparece a sequência “ra” vai logo procurar no léxico mental se há uma entrada com isso.
● Sistema sintático: discurso agramático e telegráfico, visto que não são capazes de
produzir frases completas. Os indivíduos podem ter dificuldades com a ordem das
palavras, muitas vezes dizem palavras soltas (substantivos, adjetivos e verbos)
as palavras funcionais estão ausentes e são incapazes de usar frases
complexas.
○ agramatismo
- A Linguística Taxonómica nasce nos EUA nos anos 50, os departamentos das
Universidades confrontaram-se com uma questão prática que motivou um
crescimento dos estudos linguísticos: começou a tornar-se evidente nessa época
que muitas das línguas nativas dos EUA estavam prestes a desaparecer
completamente (algumas delas eram faladas por escassas centenas de pessoas) e
assim percebeu-se que estavam condenadas ao desaparecimento, se não houvesse
uma forma de registar o conhecimento linguístico correspondente a essas línguas.
- E será esse o propósito: encontrar métodos que permitam registar de
forma exaustiva o conhecimento que permite produzir e compreender
essas línguas (entrevistas às pessoas, por exemplo). A partir desse
momento, seria possível preservá-las para sempre na história. O
conhecimento não desapareceria. Neste esforço estes cientistas procuram
instrumentos na biologia (subdisciplina taxonomia - descrições sistemáticas
dos seres vivos).
- Taxonomia é o método de descrição que parte de um nível base e
sistematiza essas observações organizando classes. Observando diferentes
seres vivos posso constatar que há um conjunto de seres vivos que partilham
características e assim agrupo-os por classes (espécies - 1a classe).
estruturadas por hierarquia de classes, depois passa-se para género (várias
espécies com base nas mesmas semelhanças), etc. Depois agrupar vários
géneros semelhantes, agrupar em Famílias, depois ordens, depois Filos…
Tudo em função da criação de classes (nível básico) encontrando
semelhanças e fazendo assim a hierarquia de agrupamento.
- Há um som que é parecido com o [d], o [t]. Quando chego a estes sons d vs t, constato
que há pelo menos uma língua humana onde esta diferença já não é irrelevante. Assim
posso encontrar no português onde a diferença entre d e t pode por si só encontrar
contraste de significado (Drama / Trama) - palavras iguais, o que as diferencia é d ou t.
- Uma vez que existe pelo menos uma língua onde estes sons podem criar um contraste e
diferença, não podem pertencer ao mesmo fonema (classe), terei de criar uma classe
diferente para o t.
FONEMA- não é universal, classes de fones, que na língua em estudo não diferenciam
quaisquer palavras (fones distintos diferenciam pelo menos uma) - /d/, /t/
Distingue uma palavra (ou elemento de palavra) de outra, como o elemento /p/ em "tap",
que separa essa palavra de "tab", "tag" e "tan".
- Um fonema pode ter mais do que uma variante, chamada alofone (diferentes
fones que representam o mesmo fonema), que funciona como um som único;
por exemplo, os /p/ de "pat", "spat" e "tap" diferem ligeiramente foneticamente, mas
essa diferença, determinada pelo contexto, não tem significado em inglês, ou o
/d/ e /teta/ em português.
- Nalgumas línguas, onde os sons variantes do p podem alterar o significado, são
classificados como fonemas separados - por exemplo, em tailandês, o p aspirado
(pronunciado com um sopro de ar que o acompanha) e o p não aspirado
distinguem-se um do outro.
MORFO- classes ordenadas de fonemas, que na língua em estudo tem significado estável
(são pedaços isolados de fonemas).
/ˈto.ɾu/, /ˈtow.ɾu/, /ʃ/, /ʒ/, /z/ = touroS pretos/loucos/árabes
MORFEMA- classes de morfos, que na língua em estudo diferem apenas por fonemas em
variação livre (a sua permutação não altera o significado do morfo) ou distribuição
complementar (um está sistematicamente excluído dos contextos fonéticos do outro). É a
menor unidade portadora de significado. Cada palavra é formada por um ou mais
morfemas.
ex: {/mar/}, {/gat/./o/}
/ˈto.ɾu/ = alomorfos {/ˈto.ɾu/, /ˈtow.ɾu/}, /PT/ = alomorfos {/ʃ/, /ʒ/, /z/} - vários morfos
do mesmo morfema
SINTAGMA- classes formadas por classes lexicais ordenadas, que na língua em estudo,
partilham privilégios de ocorrência, ou seja, podem ser permutadas sem que a frase deixe
de estar bem formada.
“[o rato] [comeu o queijo]” / “[um gato] [fugiu para o jardim]
[syntagma nominal] + [syntagma verbal] = SN + SV
FRASE- classes formadas por sintagmas ordenados, que na língua em estudo, formam
frases bem formadas.
para “o rato fugiu para o jardim” e “o rato que o gato mordeu fugiu para o jardim”
F = SN + SV + SP; F = SN + RelPr + F + SV + SP
26. Entender o critério que determina a inclusão de morfemas na mesma classe
lexical ou em classes lexicais diferentes.
Os morfemas que estão na mesma classe lexical são os que se podem substituir uns pelos
outros numa mesma frase sem alterar o caráter bem formado da frase. Esta particularidade
de livre substituição em contexto frásico, designada partilha de privilégios de ocorrência,
permite identificar a classe dos morfemas.
- Por exemplo: O, UM e ESTE podem ser trocados livremente entre si sem alterar o
caráter bem formado da frase: pertencem à mesma classe lexical.
- ex: verbos, nomes, adjetivos, substantivos, advérbios
O gato caçou o rato - parece que o pack de sons é divisível em 5 unidades, 5 palavras com
significado. No entanto, se pegarmos no espectrograma do sinal acústico, verificamos que
não existem interrupções entre cada um dos 5 elementos que percebemos como separados
(na dialética das frases) - fluxo contínuo de sons sem qualquer interrupção…
A ilusão de descontinuidade é um artefacto no sistema de codificação da linguagem.
Quando ouvimos uma língua desconhecida, parece que ouvimos grandes pacotes de
informação auditiva que não são segmentadas, são contínuos.
Será que noutras sílabas vou encontrar a presença do mesmo elemento acústico que
identifiquei na sílaba du (assobio descendente do mais agudo para o grave)?
• Di - cifra. Transformado na identidade da consoante d? - Experiência com outras sílabas
que se iniciam com o mesmo som. Nos primeiros cortes os participantes dizem ouvir a
sílaba com uma duração mais compacta, tal como na 1a experiência. “I” consegue ser
identificada sem problemas também. Também chega ao momento crítico em que os
participantes referem deixar de ouvir uma língua humana.
• Mas em di é diferente da silaba du. Na du era descrito um silvo descendente, agora na di é
descrita um silvo ascendente, de grave para agudo. Sugere que de facto a perceção das
consoantes não corresponde a nada que esteja objetivamente presente no sinal acústico, é
uma perceção, resultado de uma ativação de um código. E trata-se de facto de um
verdadeiro código e não de uma cifra, demonstrado pelo facto de, em circunstâncias
diferentes, sinais que aparentemente não tem nada a ver um com outros (silvo descendente
e silvo ascendente) participarem na identificação exatamente da mesma consoante (d) -
verdadeiro código que extrai do sinal acústico a identidade dos fonemas, neste caso o
fonema d.
31. Compreender a relação dos sons periódicos e aperiódicos com diferentes tipos de
fonemas.
- Os sons periódicos estão associados principalmente aos fonemas vocálicos e às
consoantes nasais sonoras (m, n, nh) - durante a produção destas consoantes, o
ar passa pelas vias vocais e pelas cavidades nasais, resultando em sons com
ressonância nasal. Os fonemas vocálicos são sons em que o ar passa livremente
pelas vias vocais sem obstrução significativa, resultando num padrão harmónico
regular e contínuo. Esses fonemas são caracterizados por uma estrutura
harmónica clara, com formantes distintos representando diferentes
frequências de ressonância vocal.
Alguns idiomas podem ter fonemas vocálicos que apresentam características aperiódicas,
como nasalização ou tremor vocal, enquanto outros idiomas podem ter consoantes sonoras
que possuem propriedades aperiódicas.
NOTA!
A frequência fundamental (F0) refere-se à taxa de vibração das pregas vocais durante a
produção da voz. É a frequência mais baixa e fundamental presente no espectro do som
vocal. Ela está relacionada à percepção da altura do tom da voz e é responsável por
distinguir se um som é agudo ou grave.
33. Saber caraterizar a relação entre as posições relativas dos formantes no sinal
acústico e a identificação percetiva das vogais.
Cada formante representa uma região de energia acústica concentrada numa frequência
específica. Normalmente, os primeiros formantes são os mais proeminentes e são os
principais responsáveis pela identificação das vogais.
Por outro lado, as informações articulatórias fornecem uma base mais robusta e consistente
para a identificação dos fonemas. Os movimentos articulatórios envolvidos na
produção da fala, como a posição dos articuladores, a abertura e fechamento dos
pontos de articulação, e a coarticulação, fornecem pistas mais confiáveis e distintivas
para a identificação dos fonemas.
NOTA:
Devido à coarticulação (a articulação de dois ou mais sons da fala em conjunto, de modo a
que um influencie o outro), o sinal da fala caracteriza-se pela transmissão paralela de
informação sobre segmentos fonémicos. Ou seja, o sinal da fala transmite mais do que 1
unidade fonológica em simultâneo. Conseguimos perceber que isto acontece quando
examinamos um espectrograma.
A estrutura acústica (+ informação visual, como os movimentos articulatórios) constitui um
código sobre a estrutura fonémica
Por outro lado, a distinção entre consoantes oclusivas e constritivas refere-se à forma como
o fluxo de ar é obstruído durante a produção do som.
- Consoantes oclusivas são aquelas em que há uma obstrução completa do
fluxo de ar em algum ponto da cavidade oral, seguida de uma libertação
explosiva, ou seja, há acumulação de pressão. Por exemplo, as consoantes /p/ e
/b/ são oclusivas, pois o fluxo de ar é completamente bloqueado pelos lábios e, em
seguida, libertado.
- Consoantes constritivas envolvem uma obstrução parcial do fluxo de ar, em
que o ar passa através de um estreitamento na cavidade oral. Por exemplo, as
consoantes /s/ e /z/ são constritivas, pois o ar passa por um estreitamento na região
dos dentes.
- VOT e consoantes oclusivas: distinção entre consoantes oclusivas sonoras (VOT <
25 ms: /b/, /d/, /g/) e consoantes oclusivas surdas (VOT > 25 ms: /p/, /t/, /k/)
- TEORIA AUDITIVA: A perceção dos sons da fala é realizada pelo sistema auditivo
de forma inespecífica.
- A PSF deverá ser semelhante à humana para qualquer espécie com um
sistema auditivo semelhante (amplitude auditiva 20 a 20000 Hz).
- A PSF poderá apresentar as suas características adultas muito cedo, na
medida em que o sistema auditivo se encontra já muito desenvolvido logo após o
nascimento.
- Mas haviam pessoas que ouviam dos 2 lados: ou o hemisfério direito também teria
uma função importante, ou o hemisfério direito realmente não tinha um papel no
processamento dos sons da fala, e a informação transitava, pelo corpo caloso, para
o hemisfério esquerdo…
- No caso dos sujeitos comissurotomizados (não pode haver a transição de
informação de um lado para o outro), nenhum declarou ter conseguido
ouvir o que lhe foi apresentado ao ouvido esquerdo, confirmando a ideia
que o hemisfério esquerdo é superior no processamento dos sons da fala.
- Isto vai contra a Teoria Auditiva, então talvez exista mesmo um
sistema especializado para a PSF.
- Estas experiências ainda não fornecem dados suficientes para concluir que o
sistema de PSF estará de facto a utilizar informação motora/articulatória para chegar
à identidade dos sons da fala a que está a ser exposto.
- 9 estímulos variando entre /ba/ (VOT < 25 ms) e /pa/ (VOT > 25 ms), em
incrementos de VOT de 10ms, de 0 a 80 ms.
As chinchilas foram expostas a 9 estímulos sonoros distintos, produzidos, através de
espectrogramas sintéticos. A consoante “b” e “p” distinguem-se porque “b” (a vibração das
cordas vocais começa muito cedo) é uma consoante sonora e a segunda (p é mais tardio
porque as cordas vocais vibram pelo menos 25 ms após a libertação da oclusão) é surda -
tem exatamente o mesmo ponto de articulação, pois são produzidas criando uma
oclusão/obstrução completa à saída do ar, utilizando os 2 lábios- são consoantes oclusivas
bilabiais.
Nestes estímulos é manipulado o VOT, ou seja, o momento em que as cordas vocais
começam a vibrar após a libertação da oclusão, e essas variações vão dos 0ms (as cordas
vocais vibram exatamente ao mesmo tempo da libertação da oclusão) aos 80ms (por
incrementos de 10 em 10).
Este resultado foi replicado num protocolo experimental ainda mais exigente, no que diz
respeito à discriminação de material fonético, tendo sido usado um animal filogeneticamente
ainda mais distante de nós- as codornizes japonesas- mas têm uma acuidade auditiva
semelhante à nossa.
- Nesta investigação foram usadas 3 consoantes oclusivas sonoras: /b/, /d/ e /g/.
- Na fase de treino estas aparecem conjugadas com vogais e a fase de teste é feita
com 8 vogais diferentes (as características das consoantes mudam de acordo com o
contexto vocálico, com as vogais que lhes seguem).
- As codornizes são capazes de generalizar a aprendizagem de discriminação
destas 3 consoantes apresentadas inicialmente no treino com 4 vogais, e são
capazes de generalizar esta discriminação das 3 consoantes na fase de testes feitas
com 8 novas vogais (é ainda mais impressionante que as chinchilas).
Os participantes que eram músicos profissionais ouviram sons e não foram afetados
pelos movimentos articulatórios (sem efeito McGurk).
O sistema auditivo dos músicos “reaprendeu” processos que continuam naturalmente
presentes em espécies com acuidade auditiva semelhante à nossa?
Temos que conciliar estas evidências. Uma possibilidade é que nos momentos iniciais da
nossa espécie para as línguas humanas é possível que o sistema auditivo estivesse
implicado de forma mais poderosa na discriminação dos sons da fala. Ao longo desta
evolução surge um processo mais eficaz, que deixa de usar apenas o sistema auditivo e
passa a usar um sistema multimodal (usando também informação visual articulatória). Há
uma investigação que sugere que isto aconteceu: Proverbio, A., Massetti, G., Rizzi, E. &
Alberto Zani (2016). Skilled musicians are not subject to the McGurk effect: foram
comparados os efeitos diferentes em músicos e pessoas normais.
O problema na interpretação dos dados acima é que, por um lado, vamos ser forçados a
admitir que um sistema auditivo com a mesma capacidade que o nosso é capaz de fazer a
mesma discriminação (pelo menos de algumas consoantes- sonoras) de forma
praticamente idêntica à que caracteriza o sistema auditivo humano. No entanto,
continuamos a ter evidência medida nos seres humanos que sugere de uma forma bastante
poderosa que de facto há utilização de informação motora durante a percepção de sons da
fala (efeito McGurk).
- Neurónios espelho - APOIA A TEORIA MOTORA DA PSF- uso de info motora para
identificar os fonemas
- a área F5 (área parieto-frontal, PF) dos macacos nemestrina, estruturalmente
análoga à área de Broca em humanos, incluiu neurónios motores ativos
quer no desempenho de uma ação, quer na observação da ação
realizada por outro indivíduo, quer na audição de sons associados com
a ação (Rizzolatti & Arbib, 1998 -- investigações com técnicas invasivas, não
reproduzíveis em humanos, por razões éticas (single-cell recording); RMf e
gravação EEG com encéfalo exposto mostram envolvimento da área de
Broca na PSF- St. Heim, Opitz, & Friederici, 2003)
- É o mesmo neurónio ativo na realização da ação que se ativa na observação
dessa ação. Neurónios motores da área de Broca estão ativos na percepção
de sons da fala. Ou seja, deverá haver envolvimento de áreas motoras
quando estamos a realizar tarefas relacionadas com a percepção de
sons da fala.
Podemos considerar que a Teoria Motora da percepção dos sons da fala recebe suporte
empírico de investigações que mostraram que:
Com sons da fala, o desempenho em tarefas de discriminação de estímulos não é superior
ao desempenho em tarefas de identificação de estímulos.
A percepção dos sons da fala é categorial e não contínua.
A localização da fronteira fonética é influenciada por informação visual relativa ao modo de
articulação.
39. Compreender de que forma o efeito McGurk pode ser informativo na comparação
das teorias motora e auditiva da perceção da fala.
- APOIA A TEORIA MOTORA DA PSF
- Nos indivíduos não-músicos: A info visual afeta a localização da fronteira
fonémica (efeito McGurk) e não há consciência de discrepâncias entre inf.visual
e auditiva (tb: Fowler & Deckle, 1991 – efeito Mcgurk áudio-háptico).
- Sugerindo que o sistema de PSF é multimodal: não usa apenas a experiência
auditiva, mas também outras modalidades perceptivas, como a visão, que possam
informar sobre os movimentos articulatórios para produzir os sons
percepcionados.
- Estudos têm mostrado que músicos treinados têm uma capacidade aprimorada
de integração audiovisual e percepção da fala em comparação com indivíduos
não músicos. Isso pode ser atribuído à sua habilidade em processar e interpretar
informações auditivas e visuais de maneira mais precisa e eficiente. A prática
musical intensiva pode levar a uma maior sensibilidade aos detalhes acústicos e
visuais da fala.
- Além disso, estudos também têm mostrado que músicos podem ter uma maior
capacidade de atenção seletiva e controlo inibitório, o que pode contribuir para a
habilidade de filtrar informações irrelevantes e focarem-se nas informações auditivas
relevantes para a percepção da fala.
- A pesquisa de Proverbio et al. (2016) mostrou que músicos profissionais têm menor
suscetibilidade ao efeito McGurk em comparação com não músicos. Isso sugere que
a prática musical pode ter um efeito modulador na percepção da fala. Os
músicos são treinados para discriminar e integrar diferentes estímulos auditivos e
visuais de forma mais precisa, o que pode influenciar a habilidade para evitar a
fusão incorreta dos sinais auditivos e visuais no efeito McGurk.
- Esta descoberta tem relevância para a teorização da percepção da fala, pois indica
que a experiência musical pode ter um impacto na forma como processamos e
integramos informações audiovisuais na percepção da fala. Isso sugere que a
plasticidade do sistema perceptual pode ser influenciada por fatores como
treinamento musical, e que as habilidades desenvolvidas num domínio
específico, como a música, podem ter transferências para outros aspetos da
percepção da fala.
42. Compreender a possível função dos neurónios espelho na perceção dos sons da
fala.
- O homólogo da área de Broca no macaco é F5, que é o local dos
"neurónios-espelho", estes estão relacionados com a percepção e a produção do
alcance e da preensão manual. Nos macacos, o sistema de neurónios-espelho
parece ser bilateral.
- No entanto, nos seres humanos, o sistema é maioritariamente hemisférico esquerdo
e, nos seres humanos, a área de Broca está obviamente envolvida na
vocalização, e na atividade manual. Além disso, há evidências de que a área de
Broca no hemisfério cerebral esquerdo em humanos é maior do que a área
homóloga no hemisfério direito. A área de Broca inclui as áreas 44 e 45 de
Brodmann, e também há evidências de que a assimetria pode estar restrita à área
44. Mas, independentemente do facto de as assimetrias anatómicas refletirem ou
não assimetrias funcionais, há poucas dúvidas de que a área de Broca, na grande
maioria dos seres humanos, é notoriamente assimétrica, com apenas o lado
esquerdo a desempenhar um papel na fala e, talvez, na sintaxe. A região
homóloga do lado direito pode estar envolvida no que se designa por sintaxe
musical. A área de Broca pode então ter sido o local da interação entre a
programação manual e vocal que permitiu que a assimetria vocal criasse uma
assimetria manual.
No contexto da percepção dos sons da fala, acredita-se que os neurónios espelho também
desempenhem um papel relevante. Propõe que a observação de outra pessoa a falar
ativa os mesmos circuitos neurais envolvidos na produção desses sons. Isso permite
que o ouvinte mapeie as informações visuais e auditivas recebidas durante a fala do
interlocutor numa representação interna, que é usada para compreender e interpretar a
mensagem.
- Ao ativar os neurónios espelho durante a percepção da fala, é possível que ocorra
uma simulação interna da produção dos sons da fala. Isso pode facilitar a
compreensão dos sons articulatórios e ajudar na identificação de fonemas e padrões
de fala. Os neurónios espelho podem permitir que o ouvinte mapeie os movimentos
articulatórios e a sequência temporal dos sons da fala, contribuindo para a
percepção e discriminação precisa dos fonemas.
Os neurónios motores da área de Broca estão ativos na perceção dos sons da fala.
Pelo que deve haver envolvimento de áreas motoras quando estamos a realizar
tarefas relacionadas com a perceção de sons da fala. APOIA A TEORIA MOTORA
Gentilucci & Corballis sugerem que os 2 sistemas convergiram para dar origem às línguas
humanas. Ou seja, o padrão de atividade nas zonas motoras articulatórias serve de base ao
processo de identificação dos fonemas a que estamos a ser expostos através da interação
com o interlocutor, sugerem ainda que se passou na espécie humana o que terá dado
origem às línguas humanas que conhecemos.
Há uma possibilidade de resposta alternativa, que diz que existe um sistema de correção
dos nossos movimentos articulatórios durante a produção da fala (falamos sempre a corrigir
os nossos movimentos articulatórios e os sons que produzimos). Esta auto-monitorização
faz retro-avaliação no sistema motor (ouço-me e o sistema motor ativa-se a partir desta
informação).
- … ou a resposta das regiões motoras durante a PSF resultará apenas da ativação
do circuito de automonitorização-correção da articulação, com significando funcional
apenas na produção? (correção articulatória de discurso electronicamente alterado
com latência inferior a 150 ms: Tourville, Reilly, & Guenther, 2007). quando estamos
a ouvir sons da fala de outras pessoas também ativamos o circuito da
auto-monitorização (isto pode ser um efeito secundário).
O acesso lexical e o acesso semântico são dois processos cognitivos distintos, mas
relacionados, envolvidos no processamento de palavras. Estes processos ocorrem em
sequência e são essenciais para a compreensão e produção da linguagem.
47. Saber prever as manifestações numa tarefa de decisão lexical das diferenças no
acesso ao léxico para palavras muito frequente e palavras pouco frequentes.
Frequência lexical: contagem das ocorrências de uma palavra numa amostra extensa de
uso de uma língua (corpus linguístico: e.g. transcrições de interações linguísticas orais;
textos escritos).
CORLEX, o corpus de referência para o português europeu tem 16.210.438 de ocorrências
de palavras.
Mecanismo do priming positivo: Quando o primeiro estímulo (dito prime, numa tarefa
experimental) é processado, é ativada uma representação mental que lhe corresponde. O
processo de busca por essa representação específica ativa também outras representações
associadas à do estímulo em causa. Essas outras representações vão assim encontrar-se
“preparadas” (primed) para processamento subsequente, facilitando o reconhecimento e
resposta a um estímulo que lhes corresponda (dito alvo, numa tarefa experimental).
Quando um prime e um alvo estão em línguas diferentes, uma relação semântica entre
ambos facilita a recuperação da palavra alvo.
EX: pessoa que fala inglês e francês- o acesso a “cat” é facilitado por “dog” e por
“chien”.
- A força do priming pode ser assimétrica, geralmente é mais forte para a língua
dominante do indivíduo bilíngue (que costuma ser a língua-mãe). Isto porque o
léxico dominante é maior, visto que foi aprendido primeiro, fazendo as ligações para
as representações dos conceitos (não-linguísticos) mais fortemente para palavras na
língua dominante.
49. Saber prever as manifestações numa tarefa de decisão lexical das diferenças no
acesso ao léxico para palavras homónimas e palavras polissémicas e as razões que
justificam essas diferenças.
Ambiguidade lexical: Uma palavra é lexicalmente ambígua quando, mantendo-se
fisicamente constante (mesma sequência de fonemas/grafemas), pode ativar dois ou mais
significados distintos. Existem dois tipos de palavras ambíguas:
Teoria Holística ou Lexicalista: o nosso léxico mental tem entradas distintas/exaustivas para
cada uma das várias palavras complexas esgotando todas as possibilidades de afixos ou
radicais. Esta teoria enfatiza o processamento das palavras como unidades inteiras,
sem uma decomposição em constituintes menores. Segundo essa visão, as palavras são
armazenadas no léxico mental como unidades completas e a sua identificação ocorre
de forma global.
- Prevê-se que os efeitos contrastantes estejam relacionados com a familiaridade
e frequência das palavras.
- Efeito de frequência: Palavras complexas que são frequentes, são processadas
mais rapidamente do que aquelas que as que não são frequentes ou que
apresentam formas irregulares ou exceções.
- ex: representação lexical exaustiva para a combinar 3 bases e 3 afixos: 9 entradas