Você está na página 1de 1

Reconhecimento de fala

Origem: Wikipdia, a enciclopdia livre. Tecnologias de reconhecimento da fala (tambm denominado em alguns aparelhos como reconhecimento de voz) permitem que computadores equipados com microfones interpretem a fala humana, por exemplo, para transcrio ou como mtodo de comando por voz. Tais sistemas podem ser classificados por requererem, ou no, que o usurio treine o sistema a reconhecer seus padres particulares de fala, por ter a habilidade de reconhecer fala contnua ou por requerer que o usurio fale pausadamente, e pelo tamanho do vocabulrio que capaz de reconhecer (pequeno, da ordem de dezenas a centenas de palavras, ou grande, com milhares de palavras). Sistemas que requerem pouco treinamento podem capturar continuamente a fala com um amplo vocabulrio, em ritmo normal, com preciso de cerca de 98% (duas palavras erradas em cem) enquanto sistemas que no requerem treinamento podem reconhecer um nmero pequeno de palavras como, por exemplo, os dez dgitos do sistema decimal. Tais sistemas so populares por direcionar chamadas telefnicas recebidas, em grandes organizaes, aos seus destinos. Sistemas comerciais para reconhecimento da fala tm estado disponveis desde os anos 90, porm interessante notar que, apesar do aparente sucesso dessa tecnologia, poucas pessoas os usam. Parece que a maioria dos usurios de computador pode criar e editar documentos mais rapidamente com um teclado convencional, apesar do fato de que muitas pessoas so capazes de falar consideravelmente mais rpido do que podem digitar. Alm disso, o uso intenso dos rgos da fala pode resultar em sobrecarga vocal. Alguns dos problemas tcnicos chaves do reconhecimento da fala so: Diferenas entre os interlocutores so freqentemente grandes e dificultam. No est claro quais caractersticas da fala so independentes do falante. A interpretao de vrios fonemas, palavras e frases sensvel ao contexto. Por exemplo: os fonemas so geralmente mais curtos em palavras longas do que em palavras pequenas. As palavras tm significados diferentes em frases diferentes. Por exemplo: "Philip lies" deitando-se na cama. A entonao e o timbre da fala podem mudar completamente a interpretao de uma palavra ou frase. Por exemplo: "Vai!", "Vai?" e "Vai." podem ser claramente reconhecidos por um humano, mas no to facilmente por um computador. Palavras e frases podem ter vrias interpretaes vlidas de modo que o falante deixe a escolha da correta para o ouvinte. A linguagem escrita precisa de pontuao de acordo com regras estritas que no esto fortemente presentes na fala e so difceis de inferir sem conhecer o significado (vrgulas, fim de frase, citaes). O entendimento do significado das palavras ditas pensado como um campo separado do entendimento natural da linguagem. H vrios exemplos de frases que soam iguais e s podem ser desambiguadas pela apario do contexto: uma famosa camisa vestida por pesquisadores da Apple Inc. dizia "I helped Apple wreck a nice beach" [Eu ajudei a Apple a destruir uma bela praia], o que, quando pronunciado, soa como "I helped Apple recognize speech" [Eu ajudei a Apple a reconhecer a fala]. Uma soluo geral para muitos dos problemas acima requer efetivamente conhecimento humano, experincia e uma avanada tecnologia em inteligncia artificial. Especificamente, modelos estatsticos de linguagem so freqentemente empregados para desambiguao e melhoramento da preciso do reconhecimento.
http://pt.wikipedia.org/wiki/Reconhecimento_de_fala (Acessado em 19/02/14 12:14)
[1]

pode ser interpretado como Philip sendo um mentiroso ou como Philip

Você também pode gostar