Você está na página 1de 3

Prof. Engº.

Mauricio Raymundo de Cunto


Restaurador e cientista forense em materiais multimídia (áudio, vídeo, imagem), voz & documentos

A VOZ HUMANA E AS SUAS CARACTERÍSTICAS – UM RESUMO


ESCLARECIMENTOS SOBRE A METODOLOGIA DO EXAME DE IDENTIFICAÇÃO FORENSE DE VOZ/FALA
PROF. ENGº MAURÍCIO R. DE CUNTO (OUTUBRO DE 2023 – VERSÃO 4)

O SOM DA VOZ ‐ A voz humana possui várias características que envolvem informações
cerebrais, neurológicas e motoras. Ela resulta de ações, tanto voluntárias quanto involuntárias
que se originam em nosso cérebro, percorrem as células nervosas e afetam diversos músculos
responsáveis pela geração de informações mecânicas e acústicas. Em essência, o ar contido nos
pulmões é impulsionado pelo músculo do diafragma em direção às pregas vocais da laringe. Essas
pregas, em um movimento de abertura e fechamento, produzem um som áspero, que é então direcionado
para uma caixa de ressonância acústica conhecida como trato vocal. Esse trato é composto pelas
cavidades oral e nasal, incluindo os dentes, lábios e a língua. FONÉTICA é a ciência que estuda
as características acústicas da voz, onde um programa de computador pode ser utilizado para medir
freqüências, intensidades e períodos, trazendo uma grande riqueza de informações numéricas na
forma de gráficos e tabelas.

SUBDIVISÕES DA VOZ – O som da voz tem grande importância e identidade, entretanto existe
uma infinidade de elementos sofisticados que diferenciam uma pessoa de outra, principalmente
porque alguém que mora na França pode ter o mesmo som da voz de alguém que mora na Inglaterra, no
Brasil ou na Rússia. A LINGUÍSTICA é a ciência que estuda as características da língua, e suas
variações e sobre as nuances que fazem da voz uma ferramenta de comunicação sonora, extremamente
rica e diversificada, onde a FONÉTICA é uma das subdivisões da Lingüística. A seguir uma lista
das principais características da voz e sua relação com a linguagem:

 FONÉTICA: A fonética é a área da lingüística que se concentra nos sons da fala, incluindo como os sons
são produzidos, transmitidos e percebidos e ajuda a explicar por que pessoas de diferentes regiões do
mundo podem ter sotaques diferentes, mesmo falando a mesma língua.
 FONOLOGIA: A fonologia está relacionada à organização dos sons em sistemas de linguagem, e é crucial para
entender por que algumas palavras têm pronúncias diferentes em diferentes contextos lingüísticos. A
fonologia se relaciona com o regionalismo e o vocabulário, sendo complexa e fundamental para entender
como as línguas evoluem e se diversificam em diferentes regiões geográficas e culturais.
 PROSÓDIA: A prosódia engloba elementos como entonação, ritmo e ênfase na fala. Ela desempenha um papel
fundamental na comunicação, pois tais variações produzem emoções, intenções e nuances na linguagem oral.
A prosódia também varia entre idiomas e influencia o tom e o significado das frases. O ritmo traduz
padrões de duração e pausas na fala, que influenciam a cadência e o fluxo da linguagem. Ele envolve a
variação no tempo entre as sílabas, palavras e frases pronunciadas, contribuindo para a expressão e o
significado da comunicação oral.
 ACENTO e ENTONAÇÃO: O acento e a entonação são aspectos essenciais da fala que contribuem para a
identificação de padrões lingüísticos e significados nas frases. A forma como uma pessoa coloca o acento
em uma palavra ou frase pode resultar em diferentes mensagens, como surpresa, dúvida ou afirmação.
 SOTAQUES: Os sotaques são variações na pronúncia e na entonação que ocorrem devido a influências
regionais, culturais e individuais. Eles podem revelar informações sobre a origem geográfica ou social de
uma pessoa e desempenham um papel importante na identidade lingüística.
 VPA: VPA (Voice Profile Analysis) é um método subjetivo de qualificação por meio do preenchimento de uma
tabela com vários aspectos da voz, com índices entre “‐5” e “+5”.

Resumindo, a voz é muito mais do que apenas um som que produzimos. A voz é uma janela para
a riqueza da diversidade lingüística e cultural que existe em todo o mundo. A lingüística nos
ajuda a desvendar os segredos por trás dessas variações e a compreender como a voz humana se
torna uma ferramenta tão poderosa e versátil de comunicação.

PERÍCIA DE VOZ ou: EXAME DE IDENTIFICAÇÃO DE FALANTES, EXAME COMPARATIVO DE VOZES, EXAME
FONÉTICO POR CONFRONTO (entre outros) nada mais é do que um estudo e correspondente relatório
técnico sobre as características individuais de duas vozes, onde uma delas se pretende determinar
a autoria (QUESTIONADA) comparando‐a com outra (PADRÃO) que sabidamente se conhece a autoria.

fonolab@gmail.com - www.decunto.com.br / www.fonolab.com.br - (11) 99142-7007

Folha nº 1 de 3
Prof. Engº. Mauricio Raymundo de Cunto
Restaurador e cientista forense em materiais multimídia (áudio, vídeo, imagem), voz & documentos

Para atribuir a responsabilidade a um indivíduo qualquer quanto à autoria de sua voz, é


inadequado analisar apenas o lado fonético, pois excluiria um conjunto imenso de aspectos da
linguagem, responsáveis pela riqueza de variações tonais, diversidade lingüística, regionalismo e
características culturais.

Estudos fonéticos são feitos em programas de computador e podem ser muito rápidos de se
fazer, mas os resultados representam uma pequena parcela do universo lingüístico das vozes
analisadas.

É de suma importância que os profissionais que façam este tipo de exame devam ter um bom
conhecimento teórico e prático da Lingüística, não só da fonética, mas grande parte dessas
subdivisões aqui citadas.

QUESTÕES TÉCNICAS – Apesar de ainda existirem gravações analógicas, a grande maioria do


material recebido é digital. Como um método simples de triagem, eu adoto um número indicador de
qualidade que vai de “1” a “5”, onde “1” representa um material ruim (mas não é péssimo) e “5”
representa um material bom (mas não é ótimo). Parâmetros ideais de gravação costumam ter CODECs e
formatos de arquivo não comprimidos como WAV ou AIFF, entre outros similares, taxa de quantização
entre 16 e 24 bits, freqüência de amostragem entre 32 e 96 kHz; taxa de bits acima de 128 KBPS,
nível sonoro bem audível ou com o gravador muito próximo da fonte sonora, distorções e ruídos de
baixa intensidade (majoritariamente bem mais baixos do que as falas), ausência de sobreposição de
vozes, acentuado grau de inteligibilidade, poucos interlocutores (1 a 3 indivíduos) e baixa ou
nenhuma reverberação acústica do ambiente.

 Para a realização de um exame pericial de voz com um baixo índice de erro, a qualidade do material a ser
periciado deveria ter índice “4” ou “5”, mas, infelizmente, os materiais que normalmente são recebidos
têm índice inferior a “3”.
 Na prática, não há como melhorar a qualidade do material gravado, principalmente aquele que não se
conhece a autoria da voz. Já a segunda gravação que serve para o confronto, pode ser realizada com um
rigor técnico muito maior, permitindo que o erro total do exame seja minimizado. Desenvolvi vários
protocolos que sempre são empregados, buscando coletar com segurança uma grande variedade de aspectos
lingüísticos, permitindo a obtenção de bons resultados por meio de um exame bastante responsável e justo.
 A COLETA da voz utilizada na comparação pode ser feita de modo presencial ou remoto (atualmente o mais
comum), não interferindo na qualidade ou na lisura. Este procedimento normalmente não ultrapassa o
período de uma hora e, é conduzido por mim, bastando um simples agendamento entre as partes.
 Os aspectos fonéticos que costumam ser avaliados são: F0Hist (Histograma de freqüência fundamental), LPC
(Linear Predictive Coding), LTAS (Long‐Term Average Spectrum) e Cepstrum (Cepstro/Cepstral). A escolha do
método depende muito da qualidade do material recebido.
 Os aspectos lingüísticos que costumam ser avaliados são: variantes segmentais, alofones, excursões
melódicas, excursões de acentos de pitch, taxa de elocução e articulação, pausas silenciosas e
preenchidas, ênfases, qualidade da voz, concordância, flexão, regência, uso de pronomes, regionalismos,
vocabulário, gírias, marcadores e introdutores discursivos, repetições, produções específicas de
palavras, risos, ruídos de respiração audível, hesitações, cliques, pigarro, aspectos da sociedade,
normas culturais, expectativas, contexto, apócopes, sândis, variação de pitch, extensão espectral, ênfase
por pitch, rugosidade, soprosidade, alçamentos, supressões, articulação, ritmo, pitch, loudness,
intermitências, pausas, protrusão, movimentos labiais, abertura de mandíbula, análise de discurso,
semântica, morfologia, pragmática, morfologia, entre outros.

São Paulo, 01 de Outubro de 2023

MAURICIO RAYMUNDO Digitally signed by MAURICIO RAYMUNDO DE CUNTO:01044683864


DN: c=BR, o=ICP-Brasil, ou=VideoConferencia, ou=33754412000176,
ou=Secretaria da Receita Federal do Brasil - RFB, ou=RFB e-CPF A3,

DE CUNTO:01044683864 ou=(em branco), cn=MAURICIO RAYMUNDO DE CUNTO:01044683864


Date: 2023.10.01 23:44:54 -03'00'

Maurício Raymundo de Cunto CERTIFICAÇÃO DIGITAL


CREA nº 060.154.048.7

fonolab@gmail.com - www.decunto.com.br / www.fonolab.com.br - (11) 99142-7007

Folha nº 2 de 3
Prof. Engº. Mauricio Raymundo de Cunto
Restaurador e cientista forense em materiais multimídia (áudio, vídeo, imagem), voz & documentos

CURRICULUM VITAE
PROF. ENGº MAURICIO RAYMUNDO DE CUNTO, 65 anos, casado, Engenheiro Eletrônico formado pela
Universidade Mackenzie (1985) e pós‐graduado em Engenharia de Telecomunicações pela FAAP (2003).
Cursei mestrado pela USP de São Carlos em Bioengenharia/Fonoengenharia (2003) cumprindo todos os
créditos mas interrompido em 2006, onde fui discente em “Acústica Aplicada”, “Processamento Digital
de Sinais”, “Fundamentos de Anatomia”, “Histologia e Fisiologia do Aparelho Locomotor”,
“Instrumentação Biomédica”, “Bases do Método e da Elaboração do Trabalho Científico”,
“Processamento de Sinais Biomédicos”, “Bioestatística”, participando também em diversos “Seminários
de Distúrbios da Comunicação” – todos pela USP.
Na área de documentos, sou autodidata em análise de documentos físicos, eletrônicos e digitais,
além da análise de escrita, com análise de padrões comportamentais, desde o início dos anos 80,
incluindo os segmentos da Documentoscopia: Grafotecnia e Grafocinesia. Sou especialista no uso de iluminação infravermelha
no estudo de documentos físicos, particularmente no equipamento HS‐525 (Forensic 30‐50x Magnifier with lntegrated Camera).
Na área de segurança e computadores, fui autodidata desde o final dos anos 70 em hardware e software, participei de grupos
de estudo em sistemas operacionais, montagem e manutenção de hardware nos anos 80, além de comunicações ponto‐a‐ponto por
modems conectados a linhas telefônicas. Nos anos 90 me formei pela Compaq / TBA / Microsoft / Principia‐Macromedia como
especialista em Compaq Servers, Sistemas Operacionais Windows Server & Workstation, Redes TCP‐IP e programação Multimídia.
Prestei consultoria no mercado corporativo, ministrando cursos e aulas no segmento de informática e multimídia para mais
de dois mil alunos.
Nas áreas de áudio e voz, Nos anos 2000 fui discente em “Fonética Acústica (LL‐108)” – UNICAMP com a prof. Eleonora
Albano, “Acústica na audiologia” – CEFAC, “Teoria Lingüística: Pesquisa em Voz e avanços nas investigações da função
vocal”, ministrado pelo Prof. Johan Sundberg do Depto. de Comunicação Falada – Universidade de Estocolmo, KTH, “Fonética
Forense” (duas disciplinas) ministrado pelo Prof. Anders Eriksson da Universidade de Gotemburgo, Suécia e "Vocology"
ministrado pelo Prof. Ingo Titze ‐ Speech Science and Voice da University of Iowa, USA. Tive vários trabalhos apresentados
em congressos nacionais entre 2003 e 2005, todos na área de voz (SBFA ‐ Sociedade Brasileira de Fono Audiologia) e também
em um congresso internacional: "The Voice Foundation's 35th Annual Symposium Philadelphia, Pennsylvania, USA (2006)", com
o trabalho “HIFI Stereo VCR Voice Recordings: An Acceptable and Inexpensive Option for Voice Samples Analyses” (eleito
para apresentação oral).
Nas áreas de eletrônica e instrumentação, exerci a chefia técnica em laboratórios de desenvolvimento de equipamentos
eletrônicos nas áreas de áudio, segurança, telefonia, audiologia e otoneurologia. Sou cientista autodidata em Física,
Eletro‐medicina, Neurofeedback / Biofeedback, Audiologia, Processamento Auditivo Central (PAC), Otoneurologia, Ciências da
Voz entre outras. Sou especialista em equipamentos, sistemas de armazenamento e materiais multimídia ‐ audiovisuais
(áudio, vídeo e imagens – analógicos e digitais), voz e documentos, exercendo a prestação de serviços de análise e
restauração (científica e forense) há mais de quarenta anos. Fui consultor da KAY Elemetrics Corp (Atualmente Pentax
Medical) desde os anos 80, para os sistemas “digital stroboscopy”, “endoscopy”, “swallowing” e “speech assessment” (CSL
Computerized Speech Lab Model 4300B, VisiPitch II Model 3300 e Suíte MultiSpeech Model 3700).
Na área de fotografia, no meio dos anos 70, como autodidata, montei um laboratório fotográfico próprio utilizando a
técnica de fotografia química, fotografando, revelando e ampliando imagens e prestando serviços como fotógrafo e produtor
de posters e fotolitos. No final dos anos 70 estudei e me formei em “Fotografia em Documentação Científica”.
Quanto a publicações, tenho artigos técnicos em sites especializados, em revistas, trabalhos científicos apresentados em
congressos nacionais e internacionais, publiquei um livro sobre “Gravações de Voz” (Clube de Autores) e atualmente escrevo
livros sobre o registro e o manejo de materiais audiovisuais com ênfase no poder da observação, baseados num pensamento de
Alejandro Jodorowsky.
Sou Expert no segmento forense, atuando como perito nomeado não‐concursado e como assistente técnico nas áreas acima
citadas, bem como análise de perfil e comportamental (escrita, falada e micro‐expressões) e em análises no segmento de
gravações por meio de interceptação telefônica. Em meados de 2015 criei o G.E.L.A. (Grupo de Estudos e Leitura em Áudio)
com cerca de cinqüenta participantes, baseado no livro “Áudio Cyclopedia” do Howard M. Tremaine. Atualmente sou professor
em cursos de metodologias forenses e especialista no manejo e análises de materiais multimídia, principalmente nos de má
qualidade. Sou especializado na utilização de equipamentos de áudio (equalizadores, compressores, enhancers, filters,
spectral/spectrogram) e plug‐ins (Waves, WaveArts, Voxengo, Melodyne, MAAT, entre outros), em aplicações forenses. Em 2020
acrescentei aos meus estudos “Técnicas e Análise de Comportamento Humano” com o prof. Thompson Cardoso, Análise de
Discurso, Linguagem não Verbal e Micro‐expressões, Inteligência Defensiva e Técnicas de Interrogatório. Fui discente em
várias disciplinas da Lingüística (ciências da fala): "Fonética e Prosódia para segunda língua (LL268‐2020)", "Fonética
Acústica (LL427‐2021)" e "Fonética Forense (HL181‐2021)" pela UNICAMP‐ com o prof. Plínio Barbosa, no segmento EAD:
"Linguistic Phonetics", "Transcribing Prosodic Structure of Spoken Utterances" e "Language and Its Phonology Structure"
(MIT ‐ MASSACHUSETTS INSTITUTE OF TECHNOLOGY ‐ OPENCOURSEWARE), "Justice" e "Data Science" (HARVARD UNIVERSITY AUDIT
ONLINE LEARNING). Desde dezembro de 2020 integro o quadro docente do CSI Brasil (cursocsibr.com.br) ‐ Centro de Estudos
Periciais cujos cursos oferecem certificação Internacional pela Müller Consulting & Training LLC, coordenando a área de
Multimídia. Em Julho de 2021 participei do treinamento internacional dado pelo prof. Rui Mergulhão Mendes (Emotional
Business Academy – EBA, Portugal) “Masterclass – Neurociências e Análise Comportamental”. Em agosto de 2021 fui discente
da profª Sheila Queralt (Espanha) em Lingüística Forense e em Novembro de 2021 finalizei uma disciplina de Fonética
Instrumental HL341‐2021 (carga horária de 50h) na Unicamp com o prof. Plínio Barbosa. Em janeiro de 2023 participou da 4ª
oficina de reconhecimento forense de voz promovida pelo GEFF (Escola Superior do Ministério Público de São Paulo e o Grupo
de Estudos em Fonética Forense do Instituto de Estudos da Linguagem/Unicamp)
Atualmente, além dos livros, das atividades em consultoria profissional e participação em cursos, estou roteirizando e
gravando uma série de vídeos sobre a extensa área de multimídia, tanto para fins técnicos como para fins forenses.

fonolab@gmail.com - www.decunto.com.br / www.fonolab.com.br - (11) 99142-7007

Folha nº 3 de 3

Você também pode gostar