Você está na página 1de 32

HUDSON JORGE SCATENA

A FSICA APLICA PERCIA CRIMINAL: FONTICA FORENSE

Trabalho de concluso de curso apresentado ao curso de graduao em Fsica da Universidade Catlica de Braslia, como requisito parcial para obteno do Ttulo de Licenciado em fsica. Orientador: Prof. Msc. Thiago Borduqui Ferrari

Braslia 2010

Trabalho de Concluso de Curso de autoria de Hudson Jorge Scatena, intitulado A FSICA APLICADA PERICIA CRIMINAL, apresentado como requisito parcial para obteno do grau de Licenciado em Fsica da Universidade Catlica de Braslia em 23 de junho de 2010, defendida e aprovada pela banca examinadora abaixo assinada:

___________________________________________ Prof. . Msc. Thiago Borduqui Ferrari Orientador Fsica-UCB

___________________________________________ Prof. Dr. Srgio Luiz Garavelli Fsica - UCB

___________________________________________ Prof. Msc. Diego Oliveira Nolasco da Silva Fsica - UCB

AGRADECIMENTO

Agradeo a Deus por ter me conduzido at este momento. Ao meu professor e amigo Thiago B. Ferrari por ter me orientado durante o processo de construo deste trabalho e por suas relevantes aulas ministradas na Universidade Catlica de Braslia. Aos produtores do software e stio Sound Ruler acousct analysis, por disponibilizarem de maneira gratuita uma poderosa ferramenta para o desenvolvimento cientfico da humanidade. Aos criadores e colaboradores do stio Perito Criminal, por disponibilizarem vrios relatos e artigos relacionados percia criminal no Brasil. Ao professor Edson Bencio por me encaminhar um belo material sobre as transformadas de Fourier, que foi de grande valia para o entendimento dos fenmenos tratados neste trabalho. A minha famlia por ter me apoiado e sempre ter acreditado em mim. Aos meus amigos por terem me acompanhado e apoiado neste processo to importante, em especial a Aline Mouro, Ana Carolina S. Machado, Carlos da Silva, Carlos Antnio, Demetrius Leo Diones Charles, Jonathas Fernandes, Pedro Castilho, Thiago de Freita.

O mundo no est ameaado pelas pessoas ms, e sim por aquele que permitem a maldade. Albert Einstein

RESUMO

Referncia: SCATENA, Hudson Jorge. A Fsica aplicada a percia criminal: Fontica forense. 2010. 32 folhas. Trabalho de concluso de curso para obteno do grau de Licenciado em Fsica pela Universidade Catlica de Braslia, Braslia-DF.

O presente trabalho busca mostrar um pouco dos conceitos da fsica envolvidos na atividade pericial, em especial nas anlises das falas, aqui tratada como fontica forense, fazendo uso de softwares aplicveis anlise dos sons da fala humana, aliadas aos conceitos de outras reas do conhecimento humano. Os resultados aqui apresentados no buscam atingir o mesmo nvel de preciso dos resultados alcanados em laudos oficiais, porque a metodologia e materiais utilizados buscaram mostrar de maneira superficial tal atividade, porm estes resultados se mostraram como fortes elementos para a individualizao da voz de um falante confirmando assim a teoria apresentada.

Palavras-chave: Fsica forense. Fontica forense. Percia criminal.

SUMRIO 1. INTRODUO 2. FISIOLOGIA DA FALA 2.1. SUBSISTEMA RESPITATRIO 2.2. SUBSISTEMA LARNGEO 2.3. SUBSISTEMA SUPRALARNGEO 3. PRODUO DA FALA 4. FONTICA FORENSE 4.1. VERIFICAO DE LOCUTOR 4.2. VERIFICAO DE EDIO 4.3. ANLISE DE CONTEUDO FONOGRAFICO 5. ELEMENTOS TECNICOS-COMPARATIVOS 5.1. FORMANTES 5.2. FREQUNCIA FUNDAMENTAL 5.3. MODOS ARTICULATRIOS 5.4. QUALIDADE VOCAL DO FALANTE 5.5. SONORIDADE OU VOZEAMENTO 5.6. RITMO E TAXA DE ELOCUO 5.7. VOICE ONSET TIME (VOT) 6. EXAME DE VERIFICAO DE LOCUTOR 6.1. ANLISE PERCEPTUAL 6.2. ANLISE ACSTICA 6.3. TCNICAS PARA A ANLISE 6.3.1. Espectrograma: 6.3.2. Formantes: 6.3.3. FFT (Fast Fourier Transform): 6.3.4. LPC (Linear predictive coding): 6.3.5. LTAS (Long term average spectrum): 6.3.6. Frequncia fundamental: 6.4. METODOLOGIA PARA A ANLISE 6.4.1. Anlise geral e particular dos formantes 6.4.2. Anlise de Estabilidade das Vogais Orais 6.4.3. Traado da curva de frequncia de resposta 6.4.4. Anlise de VOT (Voice Onset Time) 6.4.5. Anlise de Curvas de Energia: 6.4.6. Anlise de Frequncia de Vibrao das Pregas Vocais: 6.5. REQUESITOS DAS AMOSTRAS PARA VERIFICAO DE LOCUTOR 6.5.1. Autenticidade 6.5.2. Adequabilidade 6.5.3. Contemporaneidade 6.5.4. Quantidade 7. EXAME DE VERIFICAO DE EDIO 08 09 10 10 10 10 12 12 13 13 13 13 15 16 16 17 17 17 17 17 18 18 18 18 18 18 19 19 19 19 19 20 20 20 20 20 20 21 21 21 21

8. ANLISE DE VOZ COM OS SOFTWARES 9. CONCLUSO

22 30

1. INTRODUO O perito criminal uma pessoa com grande conhecimento tcnico, cientfico ou artstico, capaz de esclarecer fatos de interesse judicial. Compem o corpo de peritos, profissionais das reas de fsica, qumica, biologia, contbeis, cincia da computao, geologia, odontologia, farmcia, bioqumica, mineralogia e engenharia, devido a variabilidade de reas de atuao. As atribuies do perito criminal so: periciar locais de crimes ou desastres, objetos, veculos, documentos, moedas, mercadorias, produtos qumicos, txicos, exames balsticos, instrumentos utilizados na prtica de infraes, exames de DNA, bem como a realizao de todas as investigaes necessrias complementao dessas percias, para fins jurdico-legais (PCI Concursos, 2007). O perito criminal no exerccio de sua funo faz uso da cincia chamada criminalstica, que a unio dos vrios conhecimentos cientficos aplicados na elucidao de ilcitos penais e tem por objetivo o estudo sistemtico dos objetos e locais envolvidos no crime1. Na criminalstica, se usa vrias reas do conhecimento humano, entre eles esto os da fsica, neste caso chamado de Fsica Forense, que de acordo com Negrini Neto (2002) a parte da Fsica destinada observao, anlise e interpretao dos fenmenos fsicos naturais de interesse judicirio, essenciais na elucidao de vrios eventos, tais como: Acidentes de trnsito. Balstica Forense, que compreende o estudo das armas de fogo, suas munies e percias. Documentoscopia Forense, que verifica se houve falsificao ou alterao de um documento. Fontica Forense, que a parte da criminalstica que busca determinar a autenticidade de arquivos de udio apresentados aos aplicadores da Lei.

Neste trabalho sero abordados aspectos relacionados fontica forense, verificando suas ramificaes e aspectos fsicos relacionados com sua realizao.

2. FISIOLOGIA DA FALA

Crime: Definido legalmente como a infrao penal a que a lei comina pena de recluso ou de deteno quer isoladamente, quer alternativa ou cumulativamente com a pena de multa (Dec. Lei n 3.9 14, de 9/12/1941 - Lei de Introduo ao Cdigo Penal - art. 1). A doutrina define crime como o "fato proibido por lei sob ameaa de uma pena" (Bento de Faria)

De acordo com Morisson (2010), para o melhor entendimento do processo de comparao de vozes se faz necessrio expor alguns parmetros tcnico-comparativos intimamente ligados anatomia bem como uma sucinta explicao sobre o funcionamento do aparelho fonador humano. Do ponto de vista fontico podem ser apontados trs subsistemas relevantes para o entendimento, o respiratrio, larngeo e o supralarngeo.

Figura 1: O aparelho fonador. Figura encontrada em: http://www.cefala.org/fonologia/galeria_imagens.php?vcategoria=Aparelho%20fonador&vnome=Diag rama%204&vfile=aparelhofonador_d4.jpg&vref=4, inicialmente extrada e adaptada de http://www.barcode.ro/tutorials/biometrics/img/speech-production.jpg

2.1. O SUBSISTEMA RESPIRATRIO. ... Composto pelos pulmes, msculos respiratrios, brnquios e traqueia cuja principal funo a respirao (MORISSON, 2010). Os sons da lngua portuguesa so produzidos com o ar que sai do subsistema respiratrio em direo ao meio externo, e por meio de compresses e rarefaes deste ar que so produzidos os sons da fonao.

10

2.2. O SUBSISTEMA LARNGEO ... Composto por um conjunto de msculos, ligamentos e cartilagens cuja principal funo controlar a disposio das pregas vocais, o ar que sai dos pulmes, que contnuo, em direo ao meio externo, ao passar pelas pregas vocais pode sofrer modificaes, transformando-se em pulsos de ar, de acordo com o som desejado (MORISSON, 2010).

2.3. O SUBSISTEMA SUPRALARNGEO ... Composto pela regio faringal, bucal e nasal. Sua finalidade definir a maiorias das caractersticas qualitativas na fonao, ou seja, a modulao do som produzido na regio larngea ou na prpria regio supralarngea principalmente pela movimentao da lngua, alterando o tamanho e a forma da cavidade bucal ou unindo-se ou no a cavidade nasal (MORISSON, 2010).

3. PRODUO DA FALA

Na lngua portuguesa, a fala produzida com o ar ascendente dos pulmes que conduzido pela traqueia at a laringe. Na laringe se encontram as pregas vocais, que so msculos estriados que revestem a laringe, separados por espaos chamados de glote. O ar que se acumula na regio inferior da glote, aumenta a presso at conseguir provocar sua abertura e a consequente passagem do ar e seu fechamento devido ao efeito Bernoulli2, com isso as pregas vocais vibram produzido o som. Esse som segue para o subsistema supralarngeo, que tem a funo de modul-lo, atenuando a energia do som em algumas frequncias e refora em outras, para assim produzir o som desejado pelo falante. Por fim o som passa pelo trato vocal, que composto pela faringe, laringe, cavidade nasal e cavidade oral (boca, lngua, bochechas e dentes), e o som que antes era bastante simples, passa por constantes modificaes no sistema de ressonncia do trato vocal e estruturas ali localizadas (MORISSON, 2010). Como a forma e comprimento de cada cavidade do trato vocal so distintos, a fonao se torna nica para cada indivduo e, portanto cabvel de anlise de vrios elementos tcnicocomparativos nos exames periciais (MORISSON, 2010).
2

Efeito Bernoulli: Quando uma pequena amostra de um fluido escoa numa regio estreita de um tubo, ele ganha velocidade, porque a presso a montante (antes do estreitamento) que a empurra para frente maior do que a presso a jusante (dentro ou depois do estreitamento) que se ope a seu movimento (Tipler, 2006, p. 463).

11

O conceito de tubos sonoros se faz muito importante para entendimento da produo da voz de um indivduo, que diz o seguinte: o ar ou gs contido num tubo pode vibrar de modo estacionrio, em determinadas frequncias, produzindo ondas sonoras. Os tubos sonoros podem ser do tipo aberto ou fechado, com as duas extremidades abertas ou uma extremidade aberta e a outra fechada respectivamente (Tipler, 2006, p. 580).

Figura 2 Tubo sonoro aberto Figura encontrada em: <http://www.cdcc.usp.br/ondulatoria/musica5.html>

Figura 3 Tubo sonoro fechado Figura encontrada em: <http://www.cdcc.usp.br/ondulatoria/musica5.html>

Se uma fonte sonora for colocada na extremidade aberta de um tubo, as ondas sonoras emitidas em determinadas frequncias iro superpor-se s que se refletirem na outra extremidade, produzindo ondas estacionrias. Nessas condies, a coluna de ar no tubo entra em ressonncia com a frequncia emitida pela fonte. Uma extremidade aberta sempre corresponde a um ventre (interferncia construtiva) e a fechada, a um n (interferncia destrutiva). De acordo com Kemp3 (2010), o trato vocal pode ser entendido como um tubo sonoro fechado, onde a extremidade fechada a glote, fonte da energia acstica, e a outra extremidade aberta sero os lbios. Portanto o trato vocal funcionar como um ressoador

Informaes obtidas das notas de aula do Prof. Dr Ernesto Kemp do Instituto de Fsica da Universidade Estadual de Campinas, disponvel em:<http://www.ifi.unicamp.br/~kemp/f105wp/downloads/Parte6.pdf>

12

natural, com aproximadamente 17 cm de comprimento para um homem adulto e frequncia fundamental de aproximadamente 500 Hz conforme de expresso:
(1)

sendo n=1, 2, 3, ..., v a velocidade do som no meio e L o comprimento do tubo. Tal equao pode ser reescrita da seguinte forma (KEMP, 2010):

(2)

sendo i os inteiros impares, que pode ser entendido como os harmnicos de um tubo sonoro fechado, v a velocidade do som (aproximadamente 340 m/s), L o comprimento do tubo (aproximadamente 0,17 m), portanto:

, ,

Observa-se que o tubo do trato vocal no reto, porm a anlise de ressonncia em tubos retos ou curvos no traz diferenas significativas nos resultados (KEMP, 2010), (MORISSON, 2010).

4.

FONTICA FORENSE

A fontica forense se ramifica em: verificao de locutor, verificao de edio e anlise de contedo fonogrfico (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

4.1.

A VERIFICAO DE LOCUTOR ... Investiga se as falas gravadas em uma mdia (fita K7, CD, DVD, VHS), provm ou

no do aparelho fonador de uma pessoa em questo. Muitas vezes nos processos de investigao policial, a nica maneira de atribuir a autoria de um crime ou desvincular uma pessoa dele determinar se a voz contida em uma mdia ou no da pessoa em questo, em especial nos casos de suborno, chantagem ou extorso. Este tipo de percia feita por meio de comparao entre dois arquivos de voz levando em conta vrios parmetros acsticos e varias

13

realizaes articulatrias do falante. O resultado da investigao d origem a um laudo tcnico, que apresentado por perito qualificado considerado como prova material4.

4.2.

A VERIFICAO DE EDIO Tem como objetivo examinar os arquivos de udio contidos em uma mdia, para

averiguar se sofreram algum tipo de edio como modificao, supresso ou acrscimo.

4.3.

ANLISE DE CONTEDO FONOGRFICO Consiste em descrever todo o contedo registrado, que seja relevante investigao,

em um anexo eletrnico contendo todos os arquivos de udio, que podem ser acessados por aparelhos que leiam CD ou DVD compatvel com o formato de arquivo MP3. Possui vantagens sobre o mtodo tradicional de transcrio, pois ao transcrever os fatos para o papel as palavras so escritas de modo inexpressivo, podendo distorcer o seu real sentido e perder vrias informaes vitais na elucidao e no entendimento dos fatos, tais como entonao, velocidade da fala, regionalismos, som ambiente, sons ao fundo e toda a riqueza de detalhes contidos no udio. O anexo eletrnico consiste em uma mdia do tipo CD-R, com todos os udios investigados organizados de forma que o usurio possa avali-lo rapidamente e de maneira descomplicada podendo fazer uso de ferramentas como pesquisa de palavras por exemplo.

5.

ELEMENTOS TCNICO-COMPARATIVOS

5.1.

FORMANTES De acordo com Morisson (MORISSON, 2010) Os formantes so os efeitos

ressonantes no trato vocal, relacionado amplificao da energia sonora no subsistema supralarngeo. Esto relacionados anatomia e s configuraes do aparelho fonador de cada indivduo. De maneira anloga pode ser entendido como um filtro que da a forma por meio das frequncias ressonantes do trato vocal. O primeiro formante ( ) possui sua frequncia relacionada com a posio da lngua na direo vertical e pelo grau de abertura da boca. J o segundo formante ( ) est relacionado posio da lngua no plano horizontal. As frequncias dos demais formantes esto
4

Prova material: Provas produzidas a partir de vestgios encontrados no local do crime. Sendo uma das provas admitidas no nosso processo penal. A prova pericial contribui para formar a convico do juiz na deciso de um caso concreto.

14

relacionadas geometria do trato vocal no momento da fonao, e assim como os dois primeiros, dentro de um conjunto de convergncias so fortes aspectos para individualizao do falante. (MORISSON, 2010). A figura 4 uma imagem de anlise real feita pelo Instituto Nacional de Criminalstica que mostra as regies dos formantes, ou seja, a frequncia de ressonncia, entre duas amostras de udio de um mesmo falante.

Observa-se a perfeita coerncia entre os valores dos quatro primeiros formantes do fone relacionado vogal [e] da primeira slaba do enunciado deixa o resto quando comparado entre os registros de voz do questionado (curva vermelha no grfico direita) e padro (curva azul). Ressalta-se que no articulada a semivogal /i/ nesse enunciado. (MORISSON, 2010)

Figura 4 Anlise de formantes Figura encontrada em: <http://www.peritocriminal.net/mambo/index.php?option=com_content&task=view&id=182&Itemid=28>.

A figura 5 tambm mostra a convergncia dos grficos dos formantes que de acordo com o autor a divergncia do primeiro formante pode ter ocorrido por fatores emocionais.

15

Perfeita coerncia entre o segundo, terceiro e quarto formantes do segmento voclico da locuo t quando comparado entre os registros de voz do questionado e padro. Como o primeiro formante est diretamente relacionado ao grau de abertura da boca, a falta de espontaneidade durante o fornecimento do material sonoro padro justifica a divergncia encontrada nos valores do primeiro formante (MORISSON, 2010).

Figura 5 Anlise de formantes Figura encontrada em: <http://www.peritocriminal.net/mambo/index.php?option=com_content&task=view&id=182&Itemid=28>

5.2.

FREQUNCIA FUNDAMENTAL A menor frequncia de ressonncia chamada de frequncia fundamental ( ) ou

primeiro harmnico, possui a componente de frequncia com maior energia do pulso de ar gerado no sistema larngeo, devido ao movimento de afastamento e de aproximao das pregas vocais. De acordo com Morisson (2010), os falantes adultos femininos e crianas possuem a frequncia fundamental em mdia de 220 Hz e de 300 Hz respectivamente, j os falantes masculinos adultos possuem a frequncia fundamental em mdia de 120 Hz. Esta diferena nos valore de suas frequncias se deve a caractersticas anatmicas, em especifico pelo tamanho das membranas das pregas vocais, sendo o falante adulto masculino, em geral possuidor dos maiores comprimentos destas membranas, seguido pelos falantes adultos

16

femininos e por crianas. Portanto a relao entre as frequncias, anatomia e fisiologia das pregas vocais nos demonstram que a frequncia fundamental um importante elemento tcnico-comparativo na individualizao do falante.

5.3.

MODOS ARTICULATRIOS Trata da maneira que o ar sai da cavidade oral, ou seja, o grau de obstruo da

passagem de ar. Desta forma os sons podem ser classificados em:


Oclusiva5: obstruo completa da corrente de ar atravs da boca, vu palatino levantado e o ar vai para a cavidade oral - [p], [t], [k], [b], [d] e [g]. Ex.: [p]elo pelo, [t]bua tbua, [k]orte corte, [b]ote bote, [d]ama dama, [g]alo galo Nasal: obstruo completa da corrente de ar atravs da boca, vu palatino abaixado e o ar vai para as cavidades oral e nasal [m], [n], []. Ex.: [m]el mel, [n]oite noite, so[]o sonho Fricativa: obstruo parcial do ar pela aproximao dos articuladores, causando frico [f], [v], [s], [z], [], []. Ex.: [f]ado fado, [v]alor valor, [s]aco saco, [z]ebra zebra, []ave chave, [] j Africada: obstruo completa na passagem do ar (como nas oclusivas) na fase inicial e, aps esta fase (quando se d a soltura da ocluso), frico, decorrente da passagem central da corrente de ar (como nas fricativas) [t], [d]. Ex.: po[t]e pote, bo[d]e bode Tepe (ou vibrante simples): o articulador ativo toca rapidamente o articulador passivo, ocorrendo uma rpida obstruo da passagem do ar atravs da boca []. Ex.: a[]o aro Vibrante: o articulador ativo toca algumas vezes o articulador passivo, causando vibrao [r]. Ex.: ca[r]o carro Retroflexas: o articulador ativo a ponta da lngua e o passivo o palato duro. A produo das retroflexas se d pelo levantamento e encurvamento da ponta da lngua em relao ao palato duro - []. Ex.: ca[]ta carta, ca[]ga carga Laterais: a corrente de ar obstruda na linha central do trato vocal e o ar expelido por ambos os lados da obstruo, tendo sada lateral [l] e []. Ex.: [l]ata lata, pa[]a palha

Ao se analisar os segmentos fonticos de um falante, por meio da espectrografia, possvel inferir os modos articulatrios empregados em determinados enunciados. (MORISSON, 2010). O seguimento fontico realizado por um falante tem a tendncia de seguir um padro, e isso permite a comparao estatstica de uma mesma especificao fonolgica e desta maneira est analise constitui mais um forte elemento tcnico-comparativo.

Dados obtidos das notas de aula da Professora Flaviane R. Fernandes Svartman, da Universidade de So Paulo. Disponvel em:< http://www.fflch.usp.br/dlcv/2010-FLC0275aula01.pdf>

17

5.4.

QUALIDADE VOCAL DO FALANTE A qualidade vocal est relacionada maneira que o som da fala entendido por outras

pessoas, e est intimamente ligado s caractersticas fisiolgicas. Em seu artigo Morisson (2010), destaca algumas classificaes da voz utilizadas por peritos, estas so: voz modal (normal), rangida, o falseto (pitch alto), bitonal, laringalizada (creaky voice), murmurada, spera, rouca, hipernasalisada, robotizada (monotnica),

infantilizada, virilizada e a voz feminilizada.

5.5.

SONORIDADE OU VOZEANTO Neste parmetro os sons produzidos pelo falante ou tambm chamado de fone, pode

ser classificado como sonoro ou surdo. Esta classificao feita por meio de verificao da vibrao das pregas vocais no momento da produo do fone, caso seja positivo classifica-se como fone sonoro, caso negativo classifica-se como fone surdo (MORISSON, 2010).

5.6.

RITIMO E TAXA DE ELOCUO O ritmo e a taxa de elocuo ou (speech rate), esto relacionados velocidade do

encadeamento dos fones produzidos por um falante. Esta velocidade relaciona-se a maneira que os rgos ativos do aparelho fonador trabalham e tambm de fatores neurolgicos, cdigo lingusticos, aspectos psicoemocionais e se natural ou no ao vocabulrio do falante (MORISSON, 2010).

5.7.

Voice Onset Time (VOT)


a medida do tempo que leva entre a soltura de uma ocluso no trato e o incio do

vozeamento a ele interligado. Como exemplo, citamos o intervalo de tempo entre a exploso de um som oclusivo (por exemplo, um [p]) e o incio de vibrao das pregas vocais

(MORISSON, 2010).

6.

EXAME DE VERIFICAO DE LOCUTOR

6.1.

ANALISE PERCEPTUAL Busca identificar maneiras particulares na fala, como o socioleto6, idioleto7 e dialeto8

bem como variaes na articulao das unidades sonoras como ponto de articulao, adio,
6 7

De acordo com a lingustica a maneira particular de um grupo social. De acordo com a lingustica a maneira particular de um individuo falar.

18

omisso, nasalizao e troca de fonemas, empregado pelo falante na articulao tanto na fala questionada como na fala padro.

6.2.

ANLISE ACSTICA A anlise acstica dos fones questionados e padro devero ser realizados nas mesmas

condies, tais como nvel de intensidade e largura da banda de frequncia. A verificao dever ser realizada preferencialmente entre frases, entre palavras, entre unidades silbicas e unidades sonoras que sejam semelhantes. Os resultados da anlise acstica devero ser apresentados na forma de estatstica com relao aos parmetros acsticos analisados. Os espectrogramas devero contemplar analises tanto em banda larga como em banda fina de frequncia. Sendo que em banda larga dever destacar os formantes e suas transies e em banda fina dever ilustrar a estruturao dos harmnicos da fala.

6.3.

TECNICAS PARA A ANLISE

6.3.1. Espectrograma: Analisar o movimento dos formantes e suas transies, a estruturao dos harmnicos em uma unidade ou em um conjunto de unidades sonoras assim como caractersticas articulatrias e de co-articulao da fala. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.3.2. Formantes: Busca identificar caractersticas comuns nos valores mdios das zonas de estabilidade dos ncleos voclicos e as equivalncias em suas transies. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.3.3. FFT (Fast Fourier Transform): A transformada rpida de Fourier uma poderosa ferramenta, que neste caso feita por um algoritmo, que objetiva determinar a caracterstica da amplitude no domnio da frequncia da fala em uma amostra de curto ou longo perodo. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

De acordo com a lingustica a maneira particular de indivduos de uma regio falar.

19

6.3.4. LPC (Linear predictive coding): A codificao preditiva linear busca determinar a frequncia em um ponto de maior energia e a frequncia dos formantes num dado instante. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.3.5. LTAS (Long term average spectrum): um desenho bidimensional da intensidade em funo da freqncia espectral da amostra. Para Nordemberg e Sundberg9, "Reflete a contribuio tanto da fonte gltica quanto do trato vocal na qualidade de uma voz". Dispe em um s espectro, a mdia de vrios espectros momentneos obtidos, por exemplo, a cada 200 milsimos de segundo (MASTER; BIASE; PEDROSA; CHIARI, 2006.)

6.3.6. Frequncia fundamental: Aplicar esta anlise quando a qualidade do udio for excelente e as condies de coleta do som padro e questionado 10 forem muito prximas. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008)

6.4.

METODOLOGIAS PARA ANLISE

6.4.1. Anlise geral e particular dos formantes So analises relacionadas s frequncias dos formantes, buscando similaridade nas amostras cotejas ou investigadas.
cotejar conjuntos de valores das frequncias utilizando a tcnica de mximos e de mnimos para os dois primeiros formantes voclicos entre fonemas anlogos existentes na amostra padro e na questionada. Deve ser considerado, sempre que possvel, como ponto de medida, a regio de maior valor de F1 (primeiro formante), para a vogal baixa e para as vogais mdias baixas (/a,,/), para as vogais anteriores /i/ e /e/ a regio de mximo F2 (segundo formante) e para as vogais posteriores /o/ e /u/ a regio de menor valor de F2 (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008)

Outras possibilidades so: clculo da mdia das frequncias dos formantes na zona de estabilidade no ncleo voclico;

2003 apud MASTER; BIASE; PEDROSA; CHIARI,2006. Amostra de fala gravada que se busca identificao por comparaes com amostras cedidas pelo investigado, ditas padro.
10

20

extrao dos valores das frequncias dos formantes na zona de maior energia do ncleo voclico; localizao, por anlise em banda fina de frequncia, do centro do harmnico de maior energia na zona de frequncia correspondente a cada formante do referido ncleo E ainda de acordo com (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008),

Cotejar o desenho dos formantes entre as amostras padro e questionada. As transies dos formantes inter e intra-conjuntos fonticos. Quando possvel utilizar para intervalos de tempo e de localizao espacial anlogos, dados estatsticos para os valores extrados das duas amostras cotejadas entre si.

6.4.2. Anlise de Estabilidade das Vogais Orais Fazer a anlise do espectrograma no modo spectrum, que o grfico da energia em funo da frequncia em zonas de estabilidade das vogais orais. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008)

6.4.3. Traado da curva de frequncia de resposta Realizar a LPC sobreposta FFT, observando para que a compatibilidade tcnica usada no clculo da Anlise de Fourier seja a correspondente para esse exame, permitindo que os picos espectrais sejam coincidentes. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.4.4. Anlise de VOT (Voice Onset Time): Cotejar o tempo decorrido entre a soltura de uma plosiva e o incio do movimento peridico de articulao da vogal utilizando-se das anlises de oscilograma e espectrografia. (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008)

6.4.5. Anlise de Curvas de Energia: Empregado no estudo da estrutura rtmica do discurso (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.4.6. Anlise de Frequncia de Vibrao das Pregas Vocais: Empregado no estudo da estrutura rtmica do discurso.

21

6.5.

REQUISITOS DAS AMOSTRAS PARA VEIFICAO DE LOCUTOR

6.5.1. Autenticidade As amostras padres devem ser coletadas e preparadas pelo Perito que vai realizar o exame pericial e o cotejo deve ser preferencialmente realizado com o udio questionado original (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.5.2. Adequabilidade Amostras padres devem ser produzidas de maneiras e em datas distintas. Um conjunto dessas deve ser gravado, preferencialmente, no mesmo tipo de mdia, com a utilizao do mesmo sistema, do mesmo meio ou linha de transmisso de gravao daquele utilizado no material questionado. Outras amostras padres devem ser produzidas com a melhor qualidade possvel em seu udio. O local onde deve ser feita a coleta das amostras padres dever apresentar a maior similaridade possvel com o rudo ambiental existente na gravao questionada. Portanto, a coleta de padres em cabine acstica nem sempre se faz necessria e conveniente, por no apresentar, na maioria dos casos, similaridade com as gravaes de situaes forenses nas quais, normalmente, o falante est em ambiente de sua convivncia, em oposio a uma situao atpica, que certamente influenciar na sua qualidade vocal (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.5.3. Contemporaneidade Os padres devem ser preferencialmente obtidos em datas prximas data em que foi produzida a pea questionada. O decurso de um tempo muito prolongado entre a produo da pea questionada e a obteno dos padres pode dificultar a realizao da percia (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

6.5.4. Quantidade Deve ser facultada ao perito a possibilidade de coleta de material padro, no mnimo, em duas oportunidades (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

7.

EXAME DE VERIFICAO DE EDIO

Neste tipo de investigao, busca-se identificar evidncias que indiquem a existncia de edio que possa ter alterado o contedo original da gravao, seja por insero, corte, superposio, abafamento ou por deslocamento de trechos no udio gravado. Para isso

22

preciso observar o tempo de durao do conjunto de sons analisados, assinalar os pontos suspeitos de edio, destacar os instantes em que houve alterao da amplitude do sinal para posterior anlise espectrogrfica e assinalar todo e qualquer sinal sonoro tal como rudos e estalos (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008).

8.

ANLISE DE VOZ COM OS SOFTWARES

Para a confirmao da teoria aqui descrita, sero analisados 06 udios gravados, sendo dois falantes masculinos adultos e um falante feminino adulto. Os sons para est anlise foram capturados por um aparelho de telefone celular modelo Nokia 5610 XpressMusic. Os udios capturados por este tipo de aparelho ficam no formato AMR (exemplo: Grav000.amr), porm o programa Sound Ruler11 abre apenas os arquivos do tipo Wave ( exemplo: Grav000.wav), portanto foi preciso fazer a converso da extenso amr para a wav , e para isso foi utilizado o software Switch Audio File Converter , que um conversor livre obtido no stio de downloads. De fcil utilizao, o programa converte os arquivos para os seguintes formatos de udio e vdeo: AAC, AIFF, AMR, AU, FLAC, GSM, M3U, M4U, M4A, OGG, PLS, RAW, RSS, VOX, WAV, WMA e MPL, (BAIXAKI, 2010). Os programas utilizados para anlise dos udios foram o Sound Ruler verso 0.9.6.0 e o Vox metria 4 verso Trial, que so ferramentas para anlise, produo de grficos e ensino de bioacstica. Sendo o Sound Ruler livre e o Vox metria com licena para 07 dias. Para a verificao da teoria, os falantes gravaram cada enunciado duas vezes para que fossem feitas as devidas comparaes. Para melhor organizao dos dados os falantes foram identificados como falante masculino 01 (FM1), falante masculino 02 (FM2) e falante feminino 03 (FF3). Para facilitar o estudo sem comprometer a qualidade do trabalho foram escolhidos sons limpos e fceis de serem pronunciado. Os dois enunciados trabalhados foram as principais vogais da lngua portuguesa e os nmeros de um a dez, como exposto nos itens (a) e (b). Aos falantes foi pedido que falassem de maneira tranquila duas vezes o enunciado (a) e em seguida duas vezes o enunciado (b). a. [a], [], [i], [], [u]. b. [1], [2], [3], [4], [5], [6], [7], [8], [9], [10].

11

Disponvel em:<http://soundruler.sourceforge.net/oldsite/index-br.htm>

23

Resultados A lista a seguir foi feita com alguns itens selecionados do arquivo tipo txt do softwere Sound Ruler. Na lista constam os valores calculados pelo programa relacionado ao fone [1] do enunciado (b) produzido pelo falante FM1. Tabela 1 Dados obtidos com o Sound Ruler Amplitude mxima do pulso Energia entre os 90% iniciais: amplitude do pico Frequncia fundamental do pulso Amplitude da frequncia fundamental Amplitude do harmnico 2 Amplitude do harmnico 3 RelPulsePeak Ener_90-Peak_Beg PulseFundFreq relAmpl_H1 relAmpl_H2 relAmpl_H3 0,59682 0 117,1875 -6,1046 0 -2,6219

O Sound Ruler um programa que analisa o udio por intervalos pequenos e por isso foram geradas trinta tabelas semelhantes exposta acima, para cada falante totalizando noventa tabelas, porm para a comparao pretendida, vrios dos parmetros calculados so desnecessrios e, portanto os dados foram trabalhados separadamente. Os grficos apresentados a seguir na figura 6, tambm foram feitos com o Sound Ruler. O grfico localizado na parte esquerda superior mostra o oscilograma da seo analisada, o seguinte mostra o oscilograma do intervalo, na parte de baixo a esquerda o espectrograma e por ltimo o grfico que o programa chama de Zoom Oscillogram /Ampl Spectrum, que um grfico da amplitude em funo da frequncia, que pode ser entendida como uma FFT.

Figura 6 Grficos obtidos com o Sound Ruler

24

Para este experimento foram selecionados os parmetros que mais se aproximaram da teoria apresentada, calculados pelo Sound Ruler. As tabelas 02, 03, 04, 05 e 06 representam a anlise estatstica dos parmetros calculados, com o auxilio de um editor de planilhas, sendo que todo o desenvolvimento est presente no anexo deste trabalho, com os valores individuais, mdia, desvio padro, moda, mximo e mnimo. Tabela 2 Dados estatsticos do FM1N1
FM1N1 RelPulsePeak Ener_90-Peak_beg PulseFundFreq relAmpl_H1 relAmpl_H2 relAmpl_H3 RelPulsePeak MDIA 0,91509 0,02038 246,87500 -11,48557 0,00000 -13,11066 0,91509 DESV. PAD 0,179280289 0,06443457 MODA 1 0 MIN 0,55412 0,00000 MAX 1,00000 0,20376 398,43750 -6,06010 0,00000 -0,18379 1,00000

85,27999737 117,1875 117,18750 3,065368713 0 8,125112753 0,179280289 #N/D 0 #N/D 1 -15,13920 0,00000 -23,00580 0,55412

Tabela 3 Dados estatsticos do FM1N2


FM1N2 RelPulsePeak Ener_90-Peak_beg PulseFundFreq relAmpl_H1 relAmpl_H2 relAmpl_H3 RelPulsePeak MDIA 0,92334 0,00000 246,87492 -10,65950 0,00000 -12,26296 0,92334 DESV. PAD 0,183024222 0 72,18761941 4,368184013 0 5,993373278 0,183024222 MODA 1 0 #N/D #N/D 0 #N/D 1 MIN 0,43447 0,00000 132,81250 -15,97340 0,00000 -20,12010 0,43447 MAX 1,00000 0,00000 382,81250 -1,04350 0,00000 -1,92090 1,00000

25

Tabela 4 Dados estatsticos do FM2N1


FM2N1 RelPulsePeak Ener_90-Peak_beg PulseFundFreq relAmpl_H1 relAmpl_H2 relAmpl_H3 RelPulsePeak MDIA 0,94183 0,00133 196,87500 -12,23249 0,00000 -14,85603 0,94183 DESV. PAD 0,183962341 0,004206778 MODA 1 0 MIN 0,41826 0,00000 MAX 1,00000 0,01330 289,06250 -3,70800 0,00000 -7,48230 1,00000

53,34411512 195,3125 117,18750 5,251644933 0 5,447488681 0,183962341 #N/D 0 #N/D 1 -21,40290 0,00000 -23,78120 0,41826

Tabela 5 Dados estatsticos do FF3V1


FF3V1 RelPulsePeak Ener_90-Peak_beg PulseFundFreq relAmpl_H1 relAmpl_H2 relAmpl_H3 RelPulsePeak MDIA 1,00000 0,00000 335,93750 -14,58306 0,00000 -19,77722 1,00000 DESV. PAD 0 0 243,8201021 9,026894875 0 14,93570124 0 MODA 1 0 #N/D #N/D 0 #N/D 1 MIN 1,00000 0,00000 101,56250 -28,63980 0,00000 -39,50650 1,00000 MAX 1,00000 0,00000 648,43750 -4,36200 0,00000 -3,08470 1,00000

Tabela 6 Dados estatsticos comparativos dos falantes. MDIA GERAL RelPulsePeak Ener_90-Peak_beg PulseFundFreq relAmpl_H1 relAmpl_H2 relAmpl_H3 FM1
0,84313 0,00510

FM2
0,89873 0,00034

FF3
0,99569 0,00000 295,31250 -11,18627 0,00000 -15,34466

249,99998 294,53160 -10,59600 0,00000 -12,32229 -13,77181 0,00000 -13,82110

26

Um dos primeiros aspectos que pode ser verificado, so os valores para a amplitude relacionada ao harmnico 02, confirmando assim a teoria relativa comparao do trato vocal com um tubo sonoro fechado e, portanto produz apenas harmnicos impares. Podem ser observados tambm os valores das frequncias fundamentais, algo que pode ser utilizado na individualizao do falante. Como exposto nas tabelas 02 e 03, os valores de so muito prximos e, portanto corrobora com a afirmao de que os falantes de

FM1N1 e FM1N2 serem a mesma pessoa ao passo que ao comparar com os valores das demais tabelas sero verificado valores muito diferentes. Com o software Vox Metria foi possvel visualizar melhor os dados comparados, por possuir mais ferramentas grficas e por ter sido desenvolvido no Brasil, ou seja, foi direcionado s caractersticas e peculiaridades da populao brasileira e est em portugus. Nesta sesso est exposta apenas uma pequena parte dos resultados obtidos a fim de proporcionar melhor entendimento da tcnica utilizada, as demais imagens esto disponveis no anexo. As imagens a seguir so resultados das anlises comparativas entre os trs falantes.

Figura 6 Grficos comparativos entre FM1 e FF3 do espectro de energia e curva de LPC obtidos com o Vox Metria.

Na figura 6 exposta a comparao do espectro de energia (em vermelho) e a curva de LPC (em verde) dos falantes FM1 e FM3, para um mesmo enunciado. Pode ser observado nas

27

curvas de LPC, as regies do primeiro e segundo formantes descrito por picos de frequncia em cada uma.

Figura 7 Grficos comparativos entre FM1 e FM2 dos dados estatsticos obtidos com o Vox Metria.

Na figura 7 acima exposta a comparao dos dados estatsticos, feita pelo software entre os falantes FM1 e FM2 para um mesmo enunciado. Podem ser comparados os valores de , intensidade e os tempos percentuais de voz e sem voz.

28

Figura 8 Grficos comparativos entre FM2 e FF3 da freqncia fundamental e intensidade obtidos com o Vox Metria.

Na figura 8 exposta a comparao de

(em azul) e a intensidade (em verde) do som

para os falantes FM2 e FF3. Esta imagem facilita o entendimento dos sons analisados, pois para intensidades parecidas, as frequncias se mostraram bastante distintas, revelando na imagem a esquerda um som mais grave e a direita mais agudo, corroborando com a afirmao de que so falantes distintos. Nas figuras 9 e 10, so mostradas as curvas de energia e de LPC, produzidas pelo mesmo falante sendo que na primeira a comparao feita com enunciados iguais e na segunda com enunciados distintos. Para a imagens com os enunciados iguais se observa muita semelhana tanto na curva de energia quanto na de LPC em especifico na regio dos formantes como mostra as imagens, e na figura 11 mostrada a curva de LPC com os valores dos formantes.

29

Figura 9 Grficos comparativos entre FM1 e FM2 do espectro de energia e curva de LPC obtidos com o Vox Metria.

Figura 10 Grficos comparativos entre FM1 e FF3 do espectro de energia e curva de LPC obtidos com o Vox Metria.

30

Figura 11 Grficos da curva de LPC com os valores dos formantes obtido com o Vox Metria.

9. CONCLUSO A necessidade de atribuir um fone a um indivduo de maneira confivel e cientfica, s possvel graas s grandes evolues tecnolgicas sofridas pelo mundo nas ltimas dcadas, em especial as da informtica, pois o processo de quantificao de falas s possvel de maneira computacional. Durante as pesquisas para a confeco deste trabalho, foi observado que os peritos que trabalham com a fontica forense, na produo de seus laudos, no se prendem a avaliaes minuciosas de caractersticas isoladas e sim na viso geral do conjunto de dados passveis de confronto, tanto objetivos quanto subjetivos. E na mesma linha este trabalho pretendeu seguir mostrando um pouco dos conhecimentos fsicos envolvidos na identificao de falantes, embora tenha havido a necessidade de explanaes que envolvem outras reas do conhecimento humano, expondo assim umas das mais fortes caractersticas da criminalstica, que a interdisciplinaridade em seu objeto de estudo. Conclui-se que a anlise dos fones humanos permite calcular vrias grandezas fsicas e sua evoluo no tempo, essenciais na caracterizao do fone e que estes dados devem ser unidos aos obtidos pela audio do perito e assim compor um laudo com uma grande diversidade de parmetros comparativos. Os principais conhecimentos para um perito trabalhar com a verificao de locutor e edio so os de processamento digital de sinais, fsica acstica, fontica articulatria, fontica acstica e fonologia do portugus (RIBEIRO; MORISSON; RICARDO; SAMPAIO, 2008). E isto mostra o quanto pode ser complexa e especializada a atividade pericial.

31

Os dados gravados para analise neste trabalho foram gentilmente cedidos por voluntrios e em seguida tratados com os softwares obtidos na internet de forma gratuita. Portanto nem sempre os mesmos se adequaram a todas as especificaes exigidas para esta finalidade. Houve alguns eventos que podem ter influenciado nos resultados, um deles foi com o Vox Metria, que por ele ser um software de domnio privado, ou seja, deve-se comprar uma licena para us-lo, foi preciso trabalhar com ele em sua verso de testes, disponvel por sete dias e isso exigiu um maior planejamento das atividades a serem desenvolvidas no momento mais oportuno. Outro fator que pode ter influenciado os dados, foi a maneira e o tempo entre as duas gravaes que os falantes produziram seus fones, pois as falas foram um pouco diferentes de suas falas naturais e o tempo entre uma gravao e outra foi da ordem de minutos. Portanto as anlises dos fones foram possveis graas a alguns conhecimentos da fsica acstica adquiridos no curso de fsica e ao uso de algumas ferramentas computacionais hoje disponveis.

32

REFERENCIAS

BUTKOV, Eugene. Fsica matemtica. Rio de Janeiro: LTC, 1988. MASTER, Suely; BIASE,Noemi de; PEDROSA, Vanessa; CHIARI,Bras Maria. O espectro mdio de longo termo na pesquisa e na clnica fonoaudiolgica. Disponvel em: <http://www.scielo.br/scielo.php?pid=s0104-56872006000100013&script=sci_arttext>. Acesso em 30 de maio. 2010 MORISSON, Andr Luiz da Costa. Identificao Humana pela voz. Disponvel em: <http://www.apcesp.com.br/idvoice.htm>. Acesso em 10 de maio. 2010. NEGRINI NETO, Osvaldo. Solues Eletrnicas para Clculos de Velocidade em Acidentes de Trnsito. Disponvel em: < http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-47442002000200007>. Acesso em 09 de maio. 2010. PCDF Polcia Civil do Distrito Federal. Unidade Policiais; Instituto de Criminalstica. Disponvel em: <http://www.pcdf.df.gov.br/pgUnidadesPoliciais/pgInstitutoCriminalistica.aspx>. Acesso em 17 de fev. 2010. PCI CONCURSOS. Concursos. Polcia civil DF. Braslia, 17 dez. 2007. Disponvel em: <http://www.pciconcursos.com.br/concurso/policia-civil-df-40-vagas>. Acesso em 09 maio. 2010. RIBEIRO, Joel F.; MORISSON, Andr Luiz da Costa; RICARDO, Jabes de Lima; SAMPAIO, Jos Fabrizio. Exames periciais em fontica forense: Recomendaes tcnicas para a padronizao de procedimento em metodologias. Disponvel em: <http://www.abcperitosoficiais.org.br/hotsites/seminariopara/Criminal-12-fonetica.pdf>. Acesso em 29 de maio. 2010. SOUND RULER. Anlises acsticas. Disponvel em: <http://soundruler.sourceforge.net/oldsite/index-br.htm> TIPLER, Paul; MOSCA, Gene; Fsica para cientistas e engenheiros v. 1 mecnica, oscilaes e ondas, termodinmica. 5 edio, LTC, Rio de Janeiro, 2006. p. 463.

Você também pode gostar