Você está na página 1de 9

Propuesta recibida el mayo 2016 y aceptada para publicacin el julio 2016.

Propuesta de clasificacion de un banco de voces


con fines de identificacion forense
A proposal to classify a voice database for forensic identification

Fernanda Lopez-Escobedo Julian Solorzano-Soto


Universidad Nacional Autonoma de Mexico Universidad Nacional Aut
onoma de Mexico
flopeze@unam.mx jsolorzanos@iingen.unam.mx

Resumen 1 Introducci
on
En este artculo se presenta el proyecto que se desa-
rrolla para proponer una clasificacion de un banco de Actualmente, los laboratorios de an alisis fo-
voces con fines de identificacion forense. Se expone la rense de voz de los servicios periciales en Mexico
manera en que la informacion ling ustica puede ser cuentan con bancos de voces que est an organiza-
utilizada en una base de datos para reducir el n ume- dos sin tomar en cuenta las variantes ling usticas
ro de falsos positivos y falsos negativos que resultan de cada hablante. Las voces se clasifican u nica-
cuando se llevan a cabo comparaciones automatizadas mente por genero y n umero de averiguacion pre-
para la identificacion forense de voz. En particular, se via o carpeta de investigaci on.
abordan los fenomenos foneticos que se han propuesto
para realizar una clasificacion de un banco de voces Por ejemplo, Aguilar (2011), quien fue Di-
en este nivel de la lengua. A partir de esta informa- rector General de la Coordinaci on de Servicios
cion se describe como construir un modelo de base de Periciales de la la Procuradura General de la
datos y el tipo de b usquedas que se espera lograr. Rep ublica (PGR) por m as de 15 a nos, mencio-
La propuesta de generar descriptores ling usticos na que dicha instituci on cuenta con cuatro bases
para la clasificacion de un banco de voces pretende de datos: huellas dactilares, identificaci on balsti-
ser una metodologa que permita coadyuvar en la im- ca, genetica forense y an alisis de voz. Respecto
particion de justicia en Mexico y otros pases de habla a esta u ltima comenta que el reconocimiento se
hispana. realiza de manera autom atica con base en las ca-
Palabras clave ractersticas acusticas de la persona a partir de
ondas sonoras, pero no hace referencia a ning un
sociolingustica, identificacion forense de voz, varia-
aspecto ling ustico de la voz.
cion, banco de voces, espa nol
Recientemente, Morrison et al. (2016)
realizo una encuesta para conocer c omo las
agencias criminales de diferentes partes del
Abstract mundo llevan a cabo el reconocimiento forense
This article describes the project developed to
de voz. Uno de los resultados que reporta es
classify a voice database for forensic identification. It que los sistemas autom aticos de comparacion
exposes how the linguistic information can be used forense de voz que m as se utilizan son BATVOX,
in a database to reduce the number of false positives seguido de IKAR Lab. En Mexico, las agencias
and false negatives when an automatized forensic voi- de investigaci on que cuentan con an alisis forense
ce comparison is carried out. In particular, the phone- de voz utilizan alguno de estos dos sistemas. Por
tic phenomena that have been proposed for classifying ejemplo, la PGR cuenta con el sistema BAT-
a voice database in this level of language are repor- VOX, mientras que la Procuradura General de
ted. From this information it describes how to build a
Justicia de la Ciudad de Mexico cuenta con el
database model and the type of search to be achieved.
sistema IKAR Lab.
The proposal to create linguistic descriptors to
classify a voice database is intended as a methodology Ambos sistemas tienen la capacidad de clasi-
to assist in the administration of justice in Mexico and ficar las muestras de voz asoci andoles determina-
other Spanish-speaking countries. dos atributos, lo que facilitara la aplicacion de
los resultados obtenidos en este proyecto. No se
Keywords
cuenta con documentaci on que se nale la manera
sociolinguistics, forensic voice identification, varia- en que las instituciones mencionadas utilizan las
tion, voice database, spanish ventajas que ofrecen estos sistemas para poten-
ciar las bases de datos con las que cuentan, pues
This work is licensed under a Linguama tica ISSN: 16470818
Creative Commons Attribution 3.0 License Vol. 8 N
um. 1 - Julho 2016 - Pag. 3341
tica
34 Linguama Fernanda L
opez-Escobedo y Juli
an Sol
orzano-Soto

se trata de informacion confidencial. Sin embar- estas muestras de voz son tambien dubitadas (por
go, los expertos que en ellas laboran expresan que ejemplo, llamadas telef onicas interceptadas). En
las muestras de voz no se clasifican a partir de este ultimo caso, si al realizar la comparacion la
informaci on ling ustica. Prueba de ello es que los muestra dubitada resulta similar a una muestra
peritajes que realizan no contienen una descrip- tambien dubitada del conjunto de referencia, el
cion ling
uistica de la voz que se esta analizando, resultado es u til para reunir informaci on foren-
y no existen expertos ling uistas laborando en di- se de inteligencia pero no para identificar a un
chas instituciones. El perfil del perito que realiza hablante, como lo se nala Ramos (2007).
analisis de voz en Mexico es el de un ingeniero Otra caracterstica del reconocimiento au-
experto en an alisis de audio. tom atico de hablantes es la dependencia del tex-
Morrison et al. (2016) a nade que de las 44 to. Rose (2002) menciona que existen sistemas
agencias que respondieron la encuesta, 28 cuen- que son dependientes del texto y sistemas que no
tan con una base de datos. Agrega que la mayora lo son. Nuevamente, la segunda situaci on resulta
contienen grabaciones de sospechosos pero pocas mas compleja y es la que se presenta en el ambi-
(menos de la mitad) cuentan ademas con voces to forense. Por ejemplo, las diferencias ac usticas
de personas condenadas o procesadas por alg un entre dos muestras de voz de un mismo hablante
delito, as como de grabaciones de la poblaci on. diciendo la palabra mesa, ser an menores a las
Dicho autor tambien reporta las caractersticas que presenta en dos muestras de voz produciendo
tecnicas con las que se realizan las grabaciones palabras diferentes mesa y silla.
que est an contenidas en las bases de datos (lla- Ramos (2007) menciona que la produccion
madas telef onicas, entrevistas con sospechosos, de habla es un proceso complejo pues depen-
audios de internet, etc.), el n umero de lenguas de de muchas variables que incluyen factores so-
incluidas y el n umero de hablantes. Sin embargo, ciolingusticos como nivel educativo, el contexto
no se menciona nada respecto a la clasificaci on ling
ustico, diferencias dialectales, as como cues-
de estas bases de datos a partir de informaci on tiones fisiologicas. El estado del arte en los siste-
social o lingustica. mas autom aticos de comparaci on forense de voz
o reconocimiento de hablantes se ha concentra-
do en desarrollar sistemas que analizan la se nal
2 Reconocimiento forense de voz acustica para realizar la comparaci on entre la
muestra de voz dubitada y el conjunto de referen-
Una de las aplicaciones del area de reconoci- cia. Dichos sistemas se caracterizan por realizar
miento autom atico de hablantes es la del recono- la comparaci on contra un conjunto de referencia
cimiento en el contexto forense. El metodo que se abierto y por realizar el reconocimiento indepen-
utiliza consiste en comparar una muestra de voz dientemente del texto. No obstante, y a pesar de
de un hablante desconocido (dubitada) contra un que la se nal acustica proporciona informaci on so-
conjunto de referencia compuesto por muestras bre distintos factores, sus caractersticas estan di-
de voz de hablantes conocidos (indubitadas); es rectamente relacionadas con cuestiones fisiologi-
decir, una base de datos. No obstante, su apli- cas acerca de la configuraci on del tracto vocal.
cacion en el
ambito forense presenta situaciones El proyecto que aqu se presenta pretende
complejas. Rose (2002) hace la diferencia entre incluir informaci on sobre diferencias dialectales
una base de datos que representa un conjunto de con el fin de robustecer los sistemas autom aticos
referencia cerrado y una que representa un con- de comparaci on forense de voz. Actualmente no
junto abierto. La diferencia se encuentra en que, existe un an alisis ling
ustico previo que permita
mientras en el conjunto cerrado se sabe que el ha- realizar la confronta u nicamente contra una par-
blante de la muestra dubitada es uno de los ha- te del conjunto de referencia que se caracterice
blantes del conjunto de referencia, en el conjunto por contener voces que compartan caractersti-
abierto el hablante de la muestra dubitada puede cas lingusticas con la muestra de voz dubitada.
o no estar en el conjunto de referencia. La pri- Contar con informaci on que permita generar gru-
mera situacion representa una tarea mas sencilla pos en el conjunto de referencia de muestras de
para el reconocimiento pues es posible determi- voz reducira el n umero de falsos positivos y fal-
nar que el hablante de la muestra dubitada ser a el sos negativos que se generan con las confrontas o
que presente la distancia mas peque na respecto al comparaciones automatizadas.
conjunto de muestras indubitadas. En el ambito Por otro lado, debido a que en muchas oca-
forense esta situacion sera poco com
un. Los siste- siones las grabaciones dubitadas se encuentran
mas autom aticos de comparacion forense de voz en formatos digitales comprimidos, las propieda-
cuentan con un conjunto abierto de muestras de des ac usticas se ven muy afectadas, lo que impi-
voz indubitadas. Incluso, algunas veces parte de
Propuesta de clasificaci
on de un banco de voces con fines de identificaci
on forense tica 35
Linguama

de llevar a cabo la comparacion. La informaci on 1921. Propone seis grandes zonas dialectales que
sobre las variantes ling usticas que caracterizan divide en:
las distintas voces contribuira no solamente a la
clasificacion del conjunto de referencia, sino tam- El territorio hisp
anico de los Estados Unidos,
bien a reforzar los dictamenes que actualmente se
realizan pues se podran llevar a cabo compara- El norte de la Rep
ublica Mexicana,
ciones no automatizadas basadas en parametros La altiplanicie del Centro, donde se ubica la
lingusticos, a
un y cuando las caractersticas del Ciudad de Mexico,
formato de audio no lo permitan.
El objetivo de este trabajo consiste en descri- Las tierras calientes de la costa oriental, en
bir los par ametros lingusticos que se han definido particular Veracruz y Tabasco,
en el nivel fonetico para la creacion de cat alogos La pennsula de Yucat
an, donde ejerce in-
de descriptores ling usticos en un banco de vo- fluencia el maya,
ces. Es importante resaltar que el objetivo de este
proyecto es generar el conocimiento para clasifi- La America Central, comenzando en el Es-
car un banco de voces que sirve como conjunto tado mexicano de Chiapas.
de referencia en una comparacion automatizada,
y no as generar el banco de voces, pues como Lo que a juicio de Henrquez Ure na caracteri-
ya se menciono, las agencias de investigaci on en za como zona dialectal a cada una de las regiones
Mexico ya cuentan con grandes bases de datos geogr aficas enumeradas es el vocabulario, pues
de voz. reconoce que no hay uniformidad fonetica en nin-
guna de ellas (Moreno de Alba, 1998, pg. 157).
La principal crtica que se le hace a Henrquez
3 Divisi
on dialectal del espa
nol Ure na es que se trata de una clasificaci on basada
u
nicamente en cuestiones lexicas. En este senti-
Desde 1918 con la publicacion del Manual de do resulta pertinente resaltar que para determi-
Pronunciaci on espa nola de Navarro hasta el da nar una zona dialectal se deben tomar en cuenta
de hoy, los estudios ling usticos sobre la pronun- las caractersticas presentes en diferentes niveles:
ciaci
on del espa nol han tenido grandes avances. el nivel fonetico que estudiar a los sonidos de la
El Manual de Pronunciaci on espa nola tena por lengua; el nivel morfol ogico que estudiara la es-
objeto describir breve y sencillamente la pro- tructura de las palabras, su constituci on interna y
nunciaci on espanola pues sabido es que la len- sus variaciones; el nivel sintactico que estudiara la
gua espa nola presenta importantes diferencias de manera en la que se combinan las palabras; y el
pronunciaci on, no solo entre los diversos pases en nivel lexico que estudiar a el uso de determinados
que se habla, sino entre las regiones de un mis- vocablos. En este trabajo se presentan u nicamen-
mo pas, y frecuentemente entre las comarcas y te los descriptores ling usticos correspondientes
lugares de una misma region (1918, pg. 5). al nivel fonetico; no obstante, el objetivo del pro-
Moreno Fernandez (1993, pg. 15) se nala que yecto es proponer la clasificaci on de una base de
los individuos, al hablar entre s, son capaces datos con descriptores en todos los niveles, sir-
de distinguir a los que pertenecen a su misma viendo el nivel fonetico como ejemplo de lo que
comunidad de los que son ajenos a ella. Los lmi- se espera lograr.
tes de una comunidad pueden ser locales, regio- Al trabajo de Henrquez Ure na siguieron otros
nales, nacionales o incluso supranacionales y sus como La pronunciaci on del espa nol de America:
miembros generalmente conocen o intuyen el al- Ensayo hist orico-descriptivo de Canfield (1962),
cance de la conducta ling ustica que los carac- El problema de la divisi on del espa nol americano
teriza. Esto nos llevara al concepto de dialec- en zonas dialectales de Rona (1964) y Dialecto-
to: los hablantes pueden sentirse miembros de loga hispanoamericana: Teora, descripci on, his-
una comunidad dialectal. Sin embargo, aunque toria de Zamora & Guitart (1982). Ademas, se
una persona tenga conciencia de su pertenencia llevaron a cabo investigaciones cuyo objetivo era
a una comunidad, tambien es capaz de identifi- describir el habla de algunas zonas de la Rep ubli-
car dentro de ella variantes internas de car acter ca Mexicana, por ejemplo el trabajo de Matluck
geolingustico o sociolingustico, as como de re- (1951) sobre La pronunciaci on en el espa nol del
conocer cu ales son los usos mas prestigiosos de Valle de Mexico, Fonologa del espa nol hablado
su variedad y apreciar la relacion historica de su en la Ciudad de Mexico: Ensayo de un metodo
habla con otra. socioling ustico de Perissinotto (1975), El habla
El primer ling uista en proponer una divi- de Tepotzotl an de Cortichs de Mora (1951), El
si
on dialectal de Mexico fue Henrquez Ure na en habla de Guanajuato de Boyd-Bowman (1960),
tica
36 Linguama Fernanda L
opez-Escobedo y Juli
an Sol
orzano-Soto

El espa nol de Jalisco de Cardenas (1967), entre Aspiraci


on y/o velarizaci
on de /f/
otros.
Bilabializaci
on de /f/
Sin embargo, el estudio mas completo que se
ha hecho sobre el espa nol de Mexico es el que Confusi
on de lquidas
comienza el ling uista Lope Blanch (1970) con Debilitamiento y/o perdida de /d/ inter-
el objetivo de iniciar una serie de investigacio- voc
alica y final de slaba
nes, conducentes a reunir los datos ling usticos
foneticos, gramaticales y lexicos- necesarios pa- Nasalizaci
on voc
alica
ra determinar cuales son las principales modali- Realizaci
on fricativa de //
dades dialectales existentes hoy en el pas (Lo-
pe Blanch, 1970, pg. 4). Los datos recogidos Seseo y ceceo
presentaron gran abundancia, variedad y riqueza Variante oclusiva de /b, d, g/ en posicion
y en consecuencia el proyecto inicial de delimi- intervoc
alica
tar las zonas dialectales fue superado y se trans-
form o en el levantamiento de un Atlas general Velarizaci
on de nasal implosiva
del espa nol de Mexico (Espejo, 1998, pg. 119). Velarizaci
on de r
oticas
Se estudiaron 193 localidades y se analizaron al
menos 3 informantes por localidad, de distinto Vocalizaci
on de lquidas
nivel sociocultural, edad y sexo. Para el levanta- Yesmo
miento de los datos se realizaron cuestionarios y
entrevistas, algunas de las cuales se grabaron en Resulta interesante resaltar que en el caso de
cintas magnetof onicas. La informacion recabada los fenomenos que afectan a las vocales u nica-
se registro en mapas que dan cuenta de la varie- mente se ha incluido el de la nasalizaci on. A pesar
dad ling ustica del espa nol de Mexico. de que existen otros fen omenos que se han estu-
A pesar de que los datos recopilados en dicho diado ampliamente como la diptongaci on de hia-
trabajo resultan de gran utilidad en el estudio tos, el debilitamiento voc alico o el cierre vocalico,
de las variantes dialectales del espa nol de Mexi- son fen omenos que podran resultar complejos en
co, los anos han transcurrido y con ello se debe el analisis auditivo hecho por un perito en ac usti-
asumir un cambio ling ustico que probablemente ca forense.
ya no este reflejado en los datos recopilados hace Este ultimo criterio ha resultado fundamental
casi m as de cuarenta a nos. en la elecci on de los fen omenos pues el objetivo
En el trabajo que aqu se presenta se es clasificar un banco de voces con fines forenses.
realizo una revision bibliografica de los fen ome- Por lo tanto, los usuarios de dicho banco, y a su
nos foneticos que se han estudiado, principalmen- vez responsables de clasificar las voces, no seran
te en el espa nol de Mexico, y de un modo m as expertos en ling ustica sino peritos en ac ustica
general en el espa nol de America y en el espa nol forense que, en la mayora de los casos, tienen
peninsular, con el fin de determinar cuales resul- una formaci on en el area de ingeniera. As, los
tan pertinentes para la clasificacion del banco de fenomenos foneticos que servir an como descrip-
datos. Una de las principales referencias ha sido tores ling usticos deben ser f acilmente identifica-
el Atlas ling ustico de Mexico, sin embargo somos bles en un an alisis auditivo por una persona no
conscientes de la necesidad de corroborar los da- experta en fonetica, condici on que consideramos
tos a traves del levantamiento de grabaciones en cumplen los 17 fen omenos que aqu se presentan.
las diferentes regiones a las que se hace referencia.
3.2 Informaci
on diat
opica y diastr
atica de
los fen
omenos
3.1 Descriptores fon
eticos
Una vez identificados los fen omenos se ela-
Los fenomenos que se proponen como descrip-
boro una breve descripci
on de su realizaci on y se
tores ling
usticos en el nivel fonetico son 17:
hizo una tabla de cada uno de ellos con informa-
ci
on sobre variantes diat opicas y/o diastr aticas
Articulaci
on apicoalveolar de /s/
segun se ha descrito en las diferentes referencias
> bibliogr
aficas. Consideramos importante que los
on fricativa de /tS/
Articulaci
fenomenos describan algunas de estas variantes
Asibilaci
on de roticas o ambas pues es la manera en la que se puede
Aspiraci
on de /s/ implosiva caracterizar un individuo no s olo para clasificar
su voz en la base de datos, sino tambien para po-
Aspiraci
on de /x/ der realizar una confronta lingustica, en el caso
Propuesta de clasificaci
on de un banco de voces con fines de identificaci
on forense tica 37
Linguama

Variante diat opica Variante diastr


atica Notas
Mexico: es mas frecuente en el no-
roeste del pas; en menor medida, Esta presente en todos los niveles
se registra en la region occidental sociales pero es mas frecuente en
del centro de Mexico (Moreno de las mujeres (Lope Blanch, 1990)
Alba, 1994; Lope Blanch, 1990)
En Cadiz coexisten tanto la afri-
cada como la fricativa; sin embar-
Propia del nivel sociocultural ba-
Espa
na (Andaluca) go, entre los hablantes cultos, la
jo (Jimenez, 1999)
segunda es rechazada (Jimenez,
1999)
Propia del nivel sociocultural ba- Motivo el surgimiento de una
Chile jo (Vivanco, 1999) nueva variante (Vivanco, 1999)
Es m as frecuente en el nivel me-
Panama: en la capital se regis-
dio; y parece ser una marca dis-
tra la variante totalmente frica-
tintiva de sexo (Aleza & Enguita,
tiva (Aleza & Enguita, 2002)
2002)
Algunos estudios indican que es
Puerto Rico: en el area metropo- un fenomeno propio de las ge-
Es m as frecuente en las mujeres
litana se registra la variante frica- neraciones jovenes (Cedergren,
(Lopez, 1983)
tiva (Lopez, 1983; Navarro, 1948) 1973); y otros aseguran lo contra-
rio (L
opez, 1983)
>
Cuadro 1: Descripcion del fen on fricativa de /tS/
omeno articulaci

de que las propiedades ac usticas de la grabacion presentan un ndice menor: Baja California Norte
esten muy afectadas. (7.5 %), Chihuahua (20 %), Durango (5 %), etc.
Por ejemplo, en el caso del fenomeno articu- Otras localidades de la costa del Pacfico regis-
> tran lo siguiente: Tepic (7.5 %), Tuxpan (30 %) y
lacion fricativa de /tS/ se cuenta con una des-
cripcion general que se narra de la siguiente ma- Acaponeta (30 %).
nera: el espa nol cuenta con un solo fonema africa- Aproximadamente, el 75 % de los informantes
> >
do, el linguopalatal sordo /tS/. Este se caracteriza que registraron la /tS/ fricativa fueron mujeres de
por su articulacion doble: oclusion + friccion. Ge- todos los niveles escolares: analfabeto, semianal-
neralmente, el perodo de oclusion es mayor que fabeto, medio, semiculto y culto.
el de la friccion; sin embargo, hay ciertas areas Asimismo, se cuenta con informaci on sobre es-
dialectales donde se registran variantes (Quilis, te fen
omeno en Espa na y otras partes de America
1999). En la medida en que prevalezca el mo- Latina. En Andaluca se registra el fen omeno de
mento oclusivo sobre el fricativo se tratar a de un fricativizaci
on conforme se desciende en la escala
sonido m as tenso; si pasa lo contrario y el momen- social o se reduce la edad de los hablantes. Es
to fricativo predomina, la articulacion ser a me- decir: la articulaci
on africada es m as frecuente y
nos tensa, m as relajada (Moreno de Alba, 1994, prestigiosa. Por lo tanto, penetra en los estratos
pg. 193). altos y medios (94 % y 90 %, respectivamente);
Respecto a la caracterizacion diatopica y mientras que en el nivel sociocultural bajo solo
diastratica del fenomeno se cuenta con la siguien- alcanza 68 % (Jimenez, 1999). Asimismo, la va-
te informaci on. En Mexico este fenomeno se atri- riante en cuesti on es una marca que distingue
buye como caracterstico del habla del noroeste entre sexos: el alofono fricativo es casi exclusivo
del pas: Baja California, Baja California Sur, So- del habla masculina (Moya & Weiderman, 1995).
nora, Chihuahua y una parte de Durango (Men- En C adiz coexisten tanto la africada como la fri-
doza, 2004). No obstante, tambien se registra co- cativa y su ndice de aceptaci on es similar; sin
mo poco frecuente en otras regiones de Mexico, embargo, entre los hablantes cultos la segunda
por ejemplo: Tacambaro, Michoacan; Cihuatl an, realizaci
on no es aceptada.
Jalisco; Tepic y Acaponeta, Nayarit; la regi on En Chile, la articulaci
on fricativa es propia de
norte de Veracruz (Moreno de Alba, 1994), en- los niveles socioculturales bajos. Por ende, ha si-
tre otros. do ampliamente estigmatizada. Este hecho mo-
En el Atlas ling ustico de Mexico (mapa 35) tiv
o el surgimiento de una nueva variante, como
el fenomeno tiene el mayor ndice en Baja Ca- respuesta al rechazo del al ofono fricativo. La va-
lifornia Sur (60 %) y Guaymas, Sonora (50 %); riante emergente se caracteriza por ser una rea-
mientras que el resto de los estados del noroeste lizaci
on muy marcada de la africada: est a ligera-
tica
38 Linguama Fernanda L
opez-Escobedo y Juli
an Sol
orzano-Soto

>
mente m as adelantada que /tS/, tiene un periodo datos que cumple con las caractersticas anterio-
de oclusi on mas extenso (Vivanco, 1999). res.
En Panam a, en la capital se registra la varian-
te totalmente fricativa (Vaquero, 1996). Los estu-
dios concluyen que los hombres adoptan, en ma-
yor medida que las mujeres, la articulacion africa-
da. Es decir: son la mujeres quienes tienden m as
a fricativizar el fonema (39.5 %) que los hombres Figura 1: Diagrama Entidad-Relaci
on.
(13.2 %) (Cardona, 2010). Asimismo, la articula-
cion fricativa es mas comun en la clase media que En este modelo se tiene que una grabacion
en otras clases sociales (Aleza & Enguita, 2002). puede estar asociada a uno o m as descriptores
En Puerto Rico, en el area metropolitana se lingusticos, mientras que a su vez un descriptor
presenta la variante adherente (con predominio lingustico puede estar asociado a varias graba-
del elemento fricativo) (Lopez, 1983; Navarro, ciones (relaci on muchos a muchos). De esta ma-
1948). Esta variante es mas frecuente en el se- nera se puede tener que, por ejemplo, la graba-
xo femenino, como ocurre en Panama; asimismo, cion A presente nasalizaci on voc alica y arti-
>
el fenomeno no es propio de las generaciones j ove- culaci on fricativa de /tS/, mientras que la gra-
>
nes (L opez, 1983). bacion B presente articulaci on fricativa de /tS/
Una vez descrita la informacion fonetica del y vocalizaci on de lquidas.
fenomeno, esta se acomoda en una tabla como la Por su parte, cada descriptor lingustico de-
que se muestra en el Cuadro 1. A partir de la bera tener asociada su respectiva informacion
informaci on contenida en la tabla se definen los diatopica y diastratica. Esta informaci on esta re-
atributos de identidad en la base de datos, as co- presentada por la entidad identificada en la figu-
mo la asociaci on que existira entre las diferentes ra como informaci on diatopica y diastr atica, la
entidades. cual consiste en una combinaci on de valores para
atributos previamente definidos (ej. pas, region,
genero y nivel social).
4 Dise
no de la base de datos
Siguiendo las buenas pr acticas de un mode-
El dise
no de la base de datos debe responder a lo relacional, es recomendable que el conjunto
la necesidad de clasificar las grabaciones del ban- de pases, regiones, generos y niveles sociales sea
co de voces de manera que estas puedan ser re- tambien representado cada uno por una entidad,
cuperadas de acuerdo a una consulta que incluya de manera que la combinaci on de valores de estos
los descriptores mencionados anteriormente jun- atributos sean referencias a un cat alogo.
to con su informacion diatopica y diastratica.
El analisis ling
ustico previo de la voz dubita- 4.2 Tablas de la base de datos
da debe servir para reducir el conjunto de refe-
rencia a un grupo de muestras de voz que com- A continuacion se presenta la propuesta de la
parten caractersticas ling usticas. Por lo tanto, estructura de las tablas de la base de datos a nivel
debe ser posible hacer una consulta que permita mas concreto que el diagrama entidad-relacion.
especificar los descriptores ling usticos presentes Primeramente, en el Cuadro 2 se muestra la
en la grabaci on dubitada, para as restringir el informaci on que funge como cat alogo: pas, re-
conjunto de referencia al hacer la comparaci on gi
on, genero y nivel social. Las tablas pas y re-
automatizada. gi
on estan ligadas puesto que una regi on debe
Como cada descriptor ling ustico en la base pertenecer necesariamente a un pas. Esto hace
de datos estar a acompa nado de su informaci on posible que en la tabla de la informaci on diatopi-
diat
opica y diastratica, las grabaciones que final- ca y diastratica, baste con hacer referencia a la
mente seran mostradas al usuario seran aquellas regi
on. Todas las entradas de esta tabla son asig-
que contengan todos los descriptores solicitados nadas con un ID u nico de manera que pueden ser
y adem as dichos descriptores presenten similitud identificadas unvocamente en las dem as tablas.
en sus atributos tales como pas, region, genero En el Cuadro 3 se muestra la tabla que re-
y nivel social. presenta a la entidad descriptor ling ustico. En
ella se asigna un ID para hacer referencia a ca-
4.1 Modelo entidad-relaci
on da descriptor. Tambien es posible, de considerar-
se conveniente, agregar un tercer campo con una
En la figura 1 se muestra el modelo entidad descripcion del fen
omeno, para que esta informa-
relaci
on propuesto para el dise
no de la base de ci
on pueda ser mostrada al usuario del sistema al
Propuesta de clasificaci
on de un banco de voces con fines de identificaci
on forense tica 39
Linguama

g
enero nivel
id nombre id nombre
1 H 1 Bajo
2 M 2 Medio
3 Alto

pas regi
on
id nombre id pais id nombre
1 Mexico 1 1 Noroeste
2 Panama 2 1 Region occidental del centro
3 Chile 3 5 Andaluca
4 Puerto Rico 4 2 Capital
5 Espana 5 4
Area metropolitana

Cuadro 2: Tablas cat


alogo de la base de datos.

descriptor tores lingusticos), que est


a presente en la region
id nombre 1 (correspondiente a la regi on Noroeste de Mexi-
>
1 Articulacion fricativa de /tS/ co), en el genero 2 (mujeres), y en el nivel social 1
2 Nasalizacion vocalica (bajo). Aparecen ocho filas m as, cada una de las
Debilitamiento y perdida de /d/ cuales representa otra combinaci on de atributos
3 que existe para ese descriptor ling ustico.
intervocalica y final de slaba
4 Confusion de lquidas
5 Aspiracion y velarizacion de /f/
4.3 B
usquedas en la base de datos
6 Bilabializacion de /f/
Bajo este esquema se pueden hacer b usquedas
Cuadro 3: Tabla de los descriptores ling
usticos.
de la siguiente naturaleza. Sup ongase que se de-
informacion dia termina que una cierta grabaci on dubitada posee
id descriptor id region id genero id nivel id los descriptores ling usticos 1 y 2 (articulacion
1 1 1 2 1
>
fricativa de /tS/ y nasalizaci on voc alica). El
2 1 1 2 2
sistema debe buscar en la base de datos, en la
3 1 1 2 3
4 1 2 2 1 tabla de informaci on diat opica y diastratica,
5 1 2 2 2 todos los registros o filas cuya columna descrip-
6 1 2 2 3 tor id tenga el valor 1 o 2. Como resultado se ob-
7 1 3 n/a 1 tienen varias tuplas de atributos correspondien-
8 1 4 n/a 2
9 1 5 2 n/a tes a las filas de las tablas: (1, 1, 2, 1), (1, 1, 2, 2)
y (1, 1, 2, 3) ser
an algunas de las tuplas que se
Cuadro 4: Tabla de la informacion diat
opica y extraen de la tabla presentada en el Cuadro 4.
diastr
atica. El sistema deber a buscar que las tuplas que co-
rresponden al descriptor 2 coincidan lo mas po-
momento de ser utilizado. sible con las tuplas del descriptor 1, en cuanto
a region, genero y nivel social. La interseccion
Finalmente, en el Cuadro 4 se muestra la ta- entre los dos conjuntos de tuplas describe las ca-
bla referente a la entidad informacion diat opica ractersticas que han de contener el grupo de las
y diastr
atica. Esta tabla contiene un registro por grabaciones del conjunto de referencia contra las
cada combinacion de atributos que pueda presen- cuales resultar a l
ogico hacer la comparacion au-
tar un descriptor lingustico. El Cuadro 4 presen- tomatizada, en lugar de realizarla contra todo el
ta como quedara la informacion contenida en el banco de voces.
Cuadro 1 almacenada dentro de la base de datos.
Cada una de sus filas representa una combina-
ci
on de atributos para un fenomeno. Por ejem- 5 Conclusiones
plo, la primera fila tiene los valores (1, 1, 2, 1),
los cuales representan el fenomeno ling ustico, la El proyecto que aqu se presenta pretende ser
regi
on, el genero y el nivel social. Esta fila re- la base te
orica para generar una herramienta que
presenta la informacion sobre el descriptor 1 (co- contribuya a mejorar los sistemas autom aticos de
>
rrespondiente a la articulacion fricativa de /tS/ comparaci on forense de voz. Actualmente dichos
segun el ID que aparece en la tabla de descrip- sistemas unicamente analizan las caractersticas
tica
40 Linguama Fernanda L
opez-Escobedo y Juli
an Sol
orzano-Soto

sonoras de la muestra de voz. No obstante, iden- ma penal en Mexico. XI Jornadas sobre Justi-
tificar los fen omenos ling usticos que describen cia Penal, 445450.
una muestra de voz desde diferentes niveles de
Aleza, Milagros & Jose M. Enguita. 2002. El
la lengua permitira generar grupos de grabacio-
espa
nol de america: aproximaci
on sincr
onica.
nes dentro del conjunto de referencia, y con ello
Valencia: Tirant lo Blanch.
aumentar la asertividad de las comparaciones au-
tomatizadas. Boyd-Bowman, Peter. 1960. El habla de guana-
Asimismo, la informacion generada en este juato. Mexico: UNAM.
proyecto ser a la base teorica para desarrollar he- Canfield, Delos Lincoln. 1962. La pronuncia-
rramientas que permitan automatizar la clasifi- ci
on del espa
nol de america. ensayo hist
orico-
cacion del conjunto de referencia. Por ejempo, en descriptivo. Bogot
a: Instituto Caro y Cuervo.
el caso de los 17 fenomenos foneticos propues-
tos es posible entrenar a un sistema autom atico Cardona, Mauricio. 2010. Fonetica del espa nol
de reconocimiento de voz que permita identificar de panam a. En Miguel A. Quesada (ed.),
aquellos que esten presentes en una nueva mues- El espa nol hablado en America Central. Nivel
tra de voz sin necesidad de que el experto realice fonetico, Frankfurt: Vervuert.
dicha tarea. Cortichs de Mora, Estrella. 1951. El habla de
Se ha descrito el problema que se pretende tepotzotl
an. Mexico: UNAM.
abordar y solucionar a traves del proyecto Pro-
puesta de clasificacion de un banco de voces con C
ardenas, Daniel. 1967. El espa nol de jalisco.
fines de identificacion forense. Asimismo, se ha contribuci
on a la geografa ling
ustica hispa-
hecho un breve recorrido por algunos de los estu- noamericana. Madrid: Consejo Superior de In-
dios m as reconocidos que se han realizado en el vestigaciones Cientficas.
ambito de la dialectologa y la socioling
ustica. Espejo, Mara Bernarda. 1998. Resena a atlas
Con el fin de comprender la manera en la que ling
ustico de mexico. En THESAURUS, vol.
se propone la clasificacion de un banco de voces a Tomo lIII 1, Centro Virtual Cervantes.
partir de descriptores ling usticos, se han expues-
to los 17 fen omenos que, en el nivel fonetico, se Jimenez, Rafael. 1999. El andaluz. Madrid: Ar-
considera pueden ser facilmente identificables au- co/libros.
ditivamente por una persona que no sea experta Lope Blanch, Juan M. 1970. Las zonas dialectales
en fonetica y que podran servir para entrenar a de mexico. proyecto de delimitacion. Nueva
un sistema automatico de voz. A pesar de que la Revista de Filologa Hisp
anica 19(1). 111.
descripci on se hace u nicamente a partir de estos
17 fenomenos, el proyecto considera la definici on Lope Blanch, Juan M. 1990. Atlas ling ustico
de fenomenos en todos los niveles de la lengua. de mexico. Mexico: El Colegio de Mexico
UNAM FCE.
Finalmente, se describe la manera en la que la
informaci on lingustica es utilizada por una base L
opez, Humberto. 1983. Estratificaci
on social del
de datos, no s olo para clasificar y generar gru- espa
nol de san juan de puerto rico. Mexico:
pos de voces con los cuales hacer una compara- UNAM.
cion automatizada; sino, para realizar descripcio-
Matluck, Jose. 1951. La pronunciacion en el es-
nes lingusticas o perfiles ling usticos de las voces
panol del valle de mexico. Mexico: Edicion de
dubitadas, a un y cuando el formato de las graba-
autor.
ciones no lo permite.
Con este proyecto se espera contribuir en la Mendoza, Jose E. 2004. Notas sobre el espa nol
generaci on e implementacion de metodologas, del noroeste. Mexico: El Colegio de Sinaloa.
protocolos y tecnicas que doten a los laboratorios Moreno de Alba, Jose G. 1994. La pronunciacion
y personal de las instituciones de procuraci on de del espanol en mexico. Mexico: El Colegio de
justicia en Mexico de herramientas autom aticas Mexico.
que coadyuven en la imparticion de justicia.
Moreno de Alba, Jose G. 1998. El espanol en
america. Mexico: Fondo de Cultura Economi-
Referencias ca.
Aguilar, Miguel Oscar. 2011. Bases de datos cri- Moreno Fern andez, Francisco. 1993. Las areas
minalsticos en la procuradura general de la dialectales del espa
nol americano: historia de
republica. En Sergio Garca & Olga Islas de un problema. La division dialectal del espa
nol
Gonz alez (eds.), La situaci
on actual del siste- de America 1138.
Propuesta de clasificaci
on de un banco de voces con fines de identificaci
on forense tica 41
Linguama

Morrison, Geofrey Stewart, Farhan Hyder Sahito,


Gaelle Jardine, Djordje Djokic, Sophie Clavet,
Sabine Berghs & Caroline Goemans Dorny.
2016. INTERPOL survey of the use of spea-
ker identification by law enforcement agencies.
Forensic Science International 263. 92100.
Moya, Juan A. & Emilio Weiderman. 1995. La
ch fricativa en granada: un sonido del ha-
bla masculina. En Actas del XII Congreso
de la Asociacion Internacional de Hispanistas,
vol. I, Centro Virtual Cervantes.
Navarro, Tom as. 1918. Manual de pronunciaci
on
espa
nola. Madrid: Consejo Superior de Inves-
tigaciones Cientficas.
Navarro, Tomas. 1948. El espa nol en puerto ri-
co. contribuci
on a la geografa ling
ustica his-
panoamericana. Ro Piedras: Editorial de la
Universidad de Puerto Rico.
Perissinotto, Giorgio. 1975. Fonologa del espa
nol
hablado en la ciudad de mexico. ensayo de un
metodo socioling
ustico. Mexico: El Colegio de
Mexico.
Quilis, Antonio. 1999. Tratado de fonologa y
fonetica espa
nolas. Madrid: Gredos.
Ramos, Daniel. 2007. Forensic evaluation of the
evidence using automatic speaker recognition
systems: Universidad Autonoma de Madrid.
Tesis Doctoral.
Rona, Jose Pedro. 1964. El problema de la divi-
si
on del espanol americano en zonas dialecta-
les. En Presente y futuro de la lengua espanola
I (Actas de la Asamblea de Filologa del I Con-
greso de Instituciones Hisp
anicas), vol. I, 215
226. Madrid: Ediciones Cultura Hispanica.
Rose, Philip. 2002. Forensic speaker identifica-
tion. Taylor & Francis.
Vaquero, Mara. 1996. El espa
nol de america i:
Pronunciacion. Madrid: Arco/libros.
Vivanco, Hiram. 1999. Analisis fonetico ac usti-
co de una pronunciacion de ch en jovenes del
estrato social medio-alto y alto de santiago de
chile. Boletn de Filologa de la Universidad de
Chile XXXVII. 12571269.
Zamora, Munne Juan C. & Jorge M. Guitart.
1982. Dialectologa hispanoamericana. teora,
descripci
on, historia. Salamanca: Colegio de
Espana.

Você também pode gostar