Tesis Pasqualetti G.

APRENDIZAJE DE REGLAS GRAMATICALES: UN ANÁLISIS DE ENSAYO
ÚNICO DEL P600 CON GRAMÁTICAS ARTIFICIALES
Guillermo D. Pasqualetti
Tesis de Licenciatura en Ciencias Físicas
Facultad de Ciencias Exactas y Naturales
Universidad de Buenos Aires
Diciembre 2010
TEMA: Aprendizaje de reglas gramaticales: un análisis de ensayo único del P600 con
gramáticas artificiales.
ALUMNO: Guillermo D. Pasqualetti
LU N°: 142/04
LUGAR DE TRABAJO: IIBM (Facultad de Ingeniería, UBA)
DIRECTOR DEL TRABAJO: Dr. Alberto Yorio
CODIRECTOR o COLABORADOR: Dr. Sergio Lew
FECHA DE INICIACION:
FECHA DE FINALIZACION:
FECHA DE EXAMEN:
INFORME FINAL APROBADO POR:
Autor Jurado
Director y Co-Director Jurado
Profesor de Tesis de Licenciatura Jurado

G. D. Pasqualetti Aprendizaje de reglas gramaticales 3
Resumen
Las principales limitaciones del análisis convencional de los potenciales

relacionados con eventos son la pérdida de la información de cada ensayo y de cada
individuo. El objetivo del presente trabajo es investigar las bases neurobiológicas del
procesamiento de violaciones sintácticas en gramáticas artificiales a nivel de los
ensayos únicos en sujetos individuales. Se utilizó un protocolo de gramáticas artificiales
con un léxico de 17 pseudo palabras fonotácticamente legales, construidas según la
fórmula: “vocal-consonante-vocal-consonante”. Las oraciones fueron presentadas en
forma visual y auditiva. Se construyeron 106 frases para la fase de entrenamiento y 160
para la fase de prueba: 80 correctas y 80 incorrectas. Simultáneamente se registró la
actividad eléctrica cerebral. Se diseño un algoritmo de clasificación lineal con el
propósito de predecir la validez gramatical de las frases a partir de ciertas características
de la información electroencefalográfica. El clasificador tuvo éxito en 8 de 14 sujetos y
se pudo verificar una correlación significativa entre el desempeño del mismo y la
cantidad de ensayos. Las características de la información electrofisiológica necesarias
para clasificar las oraciones no fueron las mismas en los ocho sujetos.
ÍNDICE
INTRODUCCIÓN GENERAL.....................................................................................6
CAPÍTULO 1: ANÁLISIS CLÁSICO

1.1 Introducción........................................................................................................9
1.2 Materiales y Métodos
1.2.a Actividades...................................................................................................9
1.2.b Dispositivo experimental............................................................................11
1.2.c Terminología y validación de ensayos.......................................................12
1.3 Resultados y Análisis
1.3.a Efectos de la violación sintáctica...............................................................16
1.3.b Lateralidad.................................................................................................17
1.3.c Región.........................................................................................................17
1.3.d Efectos del aprendizaje..............................................................................17
1.4 Discusión............................................................................................................18
CAPÍTULO 2: ANÁLISIS GENERAL POR CONDICIONES Y FACTORES

2.1 Introducción.......................................................................................................20
2.2 Métodos
2.2.a Preprocesado..............................................................................................20
2.2.b Clasificador................................................................................................21
2.2.c Condiciones y factores de procesado.........................................................24
2.2.d Criterio de significancia............................................................................25
2.3 Resultados y Análisis........................................................................................25
CAPÍTULO 3: ANÁLISIS POR GRUPOS

3.1 Introducción.......................................................................................................28
3.2 Métodos..............................................................................................................28
3.3 Resultados y Análisis.........................................................................................28
CAPÍTULO 4: ANÁLISIS POR SUJETO: PREDICCIÓN DE LA VALIDEZ

GRAMATICAL
4.1 Introducción.......................................................................................................31
4.2 Resultados y Análisis
4.2.a Performance por sujeto..............................................................................31
4.2.b Influencia de la cantidad de ensayos..........................................................34
4.2.c Influencia del grado de aprendizaje...........................................................37
CAPÍTULO 5: ANÁLISIS MEJOR GRUPO POR CONDICIONES Y

FACTORES
5.1 Introducción......................................................................................................39
5.2 Resultados y Análisis........................................................................................39
DISCUSIÓN GENERAL..............................................................................................44
CONCLUSIONES.........................................................................................................48
APÉNDICE: MEDICIÓN DEL CAMPO ELÉCTRICO Y MONTAJES

A Medición...........................................................................................................49
B Montajes y localización...................................................................................50
BIBLIOGRAFÍA...........................................................................................................52
INTRODUCCIÓN
P600: características, eventos desencadenantes e interpretaciones

El conocimiento de los mecanismos neurobiológicos subyacentes a los diversos
procesos mentales ha sido una de las principales metas de la neuropsicología moderna.
En este sentido, el registro electroencefalográfico (EEG) de los potenciales relacionados
con eventos (ERPs) en tareas de investigación ha probado ser una herramienta de gran
utilidad como medida de la actividad cerebral dada su resolución temporal en el orden
de los pocos milisegundos. Así, en las últimas décadas se han podido analizar múltiples
potenciales, caracterizados por forma, latencia y topografía craneana. Entre ellos, uno
muy estudiado en el ámbito de la neuropsicología es el denominado P600. Dicho
potencial fue inicialmente descripto en tareas de procesamiento sintáctico, viéndose que
la aparición de incongruencias gramaticales elicitaba una onda positiva con amplitud
máxima alrededor de los 600 ms. posteriores a la aparición de la incongruencia en la
oración y de topografía centroparietal (Osterhout y Holcomb 1992; Hagoort et. al. 1993;
Osterhout et. al 1994). Diversos trabajos han interpretado su aparición como un
correlato de procesos de reanálisis y reparación de la estructura sintáctica analizada
previamente o un indicador de la dificultad de integración de un elemento en la
estructura analizada (Osterhout y Holcomb 1992; Friederici 1995; Kaan et. al. 2000).
Sin embargo estudios más recientes han observado la evocación de esta positividad ante
la aparición de errores en secuencias abstractas (Lelekov, et. al. 2000) y series
aritméticas (Núñez-Peña y Honrubia-Serrano 2004). En el procesamiento de ecuaciones
matemáticas simples (Niedeggen y Roesler 1999) la amplitud del potencial aumenta en
función de la distancia numérica entre el resultado esperado (correcto) y el mostrado
(incorrecto). Estos resultados han llevado a postular que en contextos lingüísticos y no
lingüísticos, el P600 podría ser un correlato de la aparición de un evento inesperado en
el procesamiento de una estructura secuencial, modulándose en función de la
expectativa del sujeto ante la aparición del siguiente estímulo (Niedeggen y Roesler
1999). En línea con esta interpretación se ha visto que el P600 es también sensible a la
frecuencia de aparición de errores. Por ejemplo, cuando el número de oraciones no
gramaticales es alto en relación a las gramaticales, su amplitud disminuye o
directamente desaparece (Gunter et. al. 1997; Hahne y Friederici 1999).
P600 y gramáticas artificiales

En el estudio en cuyos datos se basa el presente trabajo se investigó si el
componente P600 podía estar reflejando la participación de mecanismos estadísticos en
el procesamiento de la sintaxis, empleando para ello una tarea de gramáticas artificiales
(Tabullo et. al. 2010). El paradigma de gramáticas artificiales resulta útil para estudiar
diversos aspectos de la adquisición del lenguaje, ya que permite controlar factores como
el tamaño del léxico y la cantidad de reglas que deben ser aprendidas, así como la
interferencia que puede generar la lengua materna. Consiste en un conjunto de reglas
combinatorias que permiten formar secuencias a partir de un conjunto limitado de
estímulos, por ejemplo, oraciones a partir de un léxico de pseudo palabras. Una regla
sintáctica en una gramática artificial puede expresarse como un patrón adquirido de
transiciones posibles entre categorías de palabras o estructuras, y un error constituye
una violación de expectativa, provocado por un evento de probabilidad nula. La
hipótesis es que este potencial podría estar reflejando la violación de expectativa que
genera un error de sintaxis, basada en los patrones estadísticos previamente adquiridos.
Hasta el momento, en sólo una ocasión se ha reportado encontrar un componente P600
ante la presentación de violaciones sintácticas en una gramática artificial (Friederici,
Steinhauer, Pfeifer, 2002). No obstante, en ese trabajo se intentó simular las condiciones
de aprendizaje de una segunda lengua, por lo cual se utilizó un léxico con contenido
semántico y un contexto de aprendizaje ecológicamente válido. En nuestro experimento,
en cambio, se esperó que los sujetos aprendiesen las reglas de la gramática apelando
sólo a la información estadística disponible, por lo que no se presentó ningún contenido
semántico asociado. Con esta metodología se encontró un componente P600
significativamente mayor ante la presentación de oraciones incorrectas que ante
correctas, así como una modulación del mismo por el grado de aprendizaje de las
estructuras sintácticas.
Al analizar los datos se llevó a cabo el “análisis clásico” de los trazados
electroencefalográficos que se detallará en el capítulo 1. En este tipo de estudios se
hacen comparaciones, mediante pruebas Anovas, a partir de dos listas de valores que
difieren en determinado aspecto (oraciones correctas vs. incorrectas en este caso). Cada
uno de estos valores condensa información de distintos ensayos del EEG de un sujeto
(Tabullo et. al. 2010), razón por la cual a este tipo de análisis se lo denominó como
“interensayo”. Además los estadísticos producto de las pruebas hacen referencia a un
conjunto de sujetos. En los dos capítulos siguientes se describirá otro tipo de análisis
que fue denominado como “intraensayo” porque se basa en la información contenida en

un ensayo único (y un sujeto único). Para ello se entrenó un clasificador o discriminador
lineal cuyas entradas fueron ciertas características de las variables fisiológicas
adquiridas (EEG en esta experiencia) en cada uno de un subconjunto del total de ensayo
y sus salidas las respuestas dadas por el participante en cada ocasión. Luego, con el fin
de estimar su desempeño en la predicción del tipo de oración (correcta/incorrecta) a
partir de las mismas características del electroencefalograma, fue probado con los
ensayos restantes. El clasificador pudo separar exitosamente ambos tipos de oraciones
para 8 de un total de 14 sujetos. En el capítulo 4 se presentarán algunos estudios con la
finalidad de explicar el fracaso del clasificador con los 6 sujetos restantes; se encontró
que la cantidad de ensayos disponibles es un factor crucial. En el último capítulo se
explorará la importancia de distintos factores en el procesamiento de los datos (tales
como la referencia y la división en bandas de frecuencia, entre otros) y se establecerán
similitudes y diferencias al respecto entre el presente abordaje y el del análisis clásico.
Objetivos
El objetivo general de la tesis es investigar las bases neurobiológicas del
procesamiento de violaciones sintácticas en gramáticas artificiales. Los propósitos
específicos son: i) predecir la validez gramatical de cierta frase a partir de sólo el
potencial evocado en el ensayo en cuestión, es decir, mediante un análisis de ensayo
único o intraensayo, ii) explorar la influencia de distintos métodos de procesamiento de
los trazados crudos en dicho análisis, y iii) comparar los métodos de análisis clásicos y
de ensayo único.
CAPÍTULO 1
ANÁLISIS CLÁSICO
1.1 Introducción
En el presente capítulo se estudiarán los cambios ocurridos a nivel
neurobiológico durante una tarea de juicio gramatical con una gramática artificial (sin
contenido semántico) en búsqueda del potencial P600 y con el fin de determinar si este
componente podría estar reflejando la participación de mecanismos estadísticos en el
procesamiento de la sintaxis.
Se explicará la gramática artificial (con sus pseudo palabras componentes y
reglas de formación de frases) y la tarea experimental planteada a los sujetos. También
se hablará acerca de dispositivo experimental y el montaje electroencefalográfico
utilizado y se describirá la validación de ensayos y el preprocesamiento de los datos.
Respecto al análisis de los datos se comenzará exponiendo el gran promedio
efectuado a partir de los datos de todos los sujetos, lo que permitió identificar la ventana
de interés (600-900ms. post estimulación). Luego se mostrarán pruebas Anovas que
revelan la existencia de un componente P600 significativamente mayor ante oraciones
incorrectas que ante correctas, y una modulación del mismo por el grado de aprendizaje
de las estructuras sintácticas. Además se estudió la lateralización y región predominante
de este componente.
1.2 Materiales y métodos

a) Actividades
Participaron del estudio 21 sujetos adultos (14 mujeres), de entre 19 y 32 años
de edad (Media: 26,6 ± 3,7 años). Todos tenían educación secundaria completa,
dominancia manual diestra y eran hablantes nativos del castellano rioplatense. Además
no reportaron antecedentes de patologías neurológicas o psiquiátricas, ni estaban bajo
medicación psicoactiva al momento del experimento.
Se diseñó una gramática artificial con un léxico de 17 pseudo palabras. Las
pseudo palabras, inexistentes en la lengua materna de los sujetos, eran fonotácticamente
legales, construidas según la fórmula: “vocal-consonante-vocal-consonante”. Cada
estímulo fue grabado por una voz masculina, con prosodia neutra. El léxico se dividió
en tres categorías de pseudo palabras (categoría A: “bane”, “cane”, “fadi”, “pefa”,
“leda”; categoría B: “siru”, “soti”, “nomi”, “revu”, “roli”; categoría C: “pere”, “mene”,
“tese”, “sele”) y tres “conectores” (conector1: “bapa”, 2: “ducu”, 3: “nili”). La

gramática tenía dos estructuras sintácticas posibles, presentada ya sea en 2/3 de los
ejemplos del entrenamiento (estructura frecuente (1)), o 1/3 de los ejemplos entrenados
(estructura infrecuente(2)): 1) conector 1 – categoría A – categoría B – conector 2 –
categoría A (ejemplo: “bapa bane roli ducu fadi”); 2) conector 1 – categoría A –
categoría B – categoría C – conector 3 – categoría A (ejemplo: “bapa pefa soti tese nili
cane”). No se permitió repetir palabras dentro de una misma oración. Se construyeron
106 oraciones para la fase de entrenamiento y 160 para la fase de prueba: 80 correctas y
80 incorrectas, conteniendo uno de los dos errores siguientes: violación de conector (40
oraciones) o violación de categoría (40 oraciones). La violación de conector consistió en
cambiar el conector correspondiente por el de la otra estructura (ducu por nili o
viceversa). Por ejemplo: “bapa bare roli nili fadi”,“bapa pefa soti tese ducu cane”. La
violación de categoría consistió en cambiar una palabra de la categoría A por otra de la
B al final de la oración. Por ejemplo: “bapa leda nomi ducu siru”, “bapa cane revu
pere nili soti” (ver fig. 1).
Con. 2 Bare
Cat. B Cane
Cat. A Ducu Fadi
Con. 1 Pefa
Bare Siru Leda
Cane Soti
Bapa
Fadi Roli
Pefa Revu Cat. C
Leda Nomi Con. 3
Pere Bare
Sele Cane
Nili
Mene Fadi
Tese Pefa
Leda
Frases correctas: “Bapa cane soti ducu pefa”

“Bapa leda siru pere nili bare”
Frases incorrectas: Violación de categoría: “Bapa fadi roli ducu revu”

Conector incorrecto: “Bapa leda nomi sele ducu bare”
Fig. 1. Esquema de formación de las frases. Se muestran ambas estructuras sintácticas y

ejemplos correspondientes a cada una.
En la fase de entrenamiento se explicó a los sujetos que verían y escucharían

oraciones provenientes de un lenguaje inventado, y se les pidió que trataran de aprender
sus reglas de formación. Las oraciones fueron presentadas simultáneamente en forma
escrita (en un monitor de PC) y oralmente (mediante parlantes), palabra por palabra.
Periódicamente el software preguntaba si una determinada pseudo palabra había

aparecido en la oración anterior, con el fin de ayudar a que el sujeto dirigiese su
atención a los estímulos. Se presentaron así 106 oraciones en dos bloques de 53 ensayos
cada uno, con un descanso intermedio. Luego de este entrenamiento, de
aproximadamente 10 minutos, los sujetos pasaron a la fase de prueba. Se les explicó que
verían oraciones nuevas, algunas de ellas construidas de acuerdo con las mismas reglas
con que fueron armadas las precedentes y otras con errores, y que su tarea consistiría en
decidir si eran correctas o incorrectas y responder presionando una tecla, lo más rápido
posible sin equivocarse. Se mostraron entonces 160 frases, divididas en dos bloques de
80 ensayos cada uno, con un descanso intermedio. Durante esta etapa se registró la
actividad EEG sincronizada con la aparición de los errores sintácticos en las frases
incorrectas y con la presentación de la última palabra en las correctas. También se
registraron las respuestas de los sujetos ante cada oración, así como el tiempo
transcurrido entre la señal de sincronización y la respuesta correspondiente.
b) Dispositivo experimental
Para el armado del dispositivo experimental se utilizaron los siguientes
componentes:
-Dos PCs convencionales
-Amplificador de 21 canales Akonic Bio-PC Systems.
-Placa digitalizadora de 256hz.
-Gorro con 19 electrodos y una entrada tierra (mismo fabricante).
-Conexión a tierra mediante jabalina.
Estos fueron dispuestos formando el dispositivo experimental diagramado en la
fig. 2.
Fig. 2. Esquema del dispositivo experimental.
Se situó al sujeto en una silla frente al monitor de PC 1 en el que se mostró el

software correspondiente. Se le colocó el gorro, conectado a tierra vía el amplificador, y
dos electrodos auriculares también conectados al amplificador a modo de referencia del
potencial. A su vez el amplificador fue enlazado al puerto paralelo de PC 2 (mediante
un conversor analógico-digital) y esta comunicada con PC 1 mediante un cable por el
que se transmitió la señal de sincronización.
La fig. A1 del apéndice ilustra la ubicación y nombre de los electrodos en la
cabeza del paciente; el montaje utilizado es el denominado “10/20”, con 21 electrodos,
dos de ellos auriculares.
c) Terminología y validación de ensayos

Producto de todo esto se obtuvo, para cada sujeto, un trazado
electroencefalográfico de 19 canales y un registro de sus respuestas conductuales
(sí/no/no responde) junto con la relación temporal entre las variables conductuales y
neurofisiológicas registradas.
Se introducirá ahora cierta terminología. A la presentación de la frase se le llamó
estímulo; al período de tiempo comprendido entre un estímulo y el siguiente, ensayo; y
al segmento temporal incluido dentro de cada ensayo que se consideró relevante para el
análisis, época. El motivo de fijar una época radica en que la influencia principal de la
estimulación se manifiesta de manera considerable sólo poco después de la misma. La
época comprende además un corto período de tiempo previo que puede ser usado como
línea de base, una referencia consistente en el promedio del potencial de cada canal
previo al estímulo. Se estableció como época al período temporal que comprende desde
los 200 ms. previos al estímulo a los 1500 ms. posteriores al mismo. Además cada
ensayo estuvo sujeto a cierta condición experimental, en este caso “frase correcta” y
“frase incorrecta”.
Se le dio el nombre de artificio a toda anomalía en el trazado
electroencefalográfico. Son producto de actividades no relacionadas directamente con la
tarea tales como movimientos (particularmente los oculares y faciales debido a la
cercanía del rostro a los electrodos) o actividad sensorial, como la audición de un sonido
intenso. Es por esto que se aísla lo más posible al sujeto y se vela por su comodidad.
En la fig. 3 se muestra un segmento del trazado electroencefalográfico de un
sujeto de sexo masculino y 24 años de edad. Se indica en el mismo la señal de
sincronización (momento de estimulación), un artificio (parpadeo), dos actividades
rítmicas normales y la época. Un filtro pasabajos de 30hz fue aplicado sobre el trazado
original para obtener el de la figura.
Fig. 3. Segmento de trazado electroencefalográfico típico filtrado con un pasabajos de 30hz. Se

identifican los componentes principales del trazado (artificio, actividad rítmica, época y señal de
sincronización).
Previo a todo análisis de los datos se determinaron los ensayos válidos (se
desecharon los otros) y se llevó a cabo un preprocesado de las señales. Existen dos tipos
de criterios independientes que debe satisfacer un ensayo para ser considerado válido,
los llamaremos comportamental y fisiológico. El primer tipo comprende los criterios

basados en los aspectos conductuales de la tarea, en este caso se estableció un tiempo de
respuesta menor a 2 segundos y que la misma sea correcta. El segundo los basados en la
forma del trazado electroencefalográfico durante la época en cuestión, en el presente
trabajo se realizó una inspección visual del mismo en busca de artificios. Eventualmente
algún canal presentó artificios muy frecuentemente durante el registro en cuyo caso, en
lugar de desechar todo el registro, se reemplazó el de ese canal por un promedio de la
señal de los canales vecinos. El preprocesado consiste en filtrar, desechar canales,
establecer la referencia y validar ensayos. i) En cuanto al filtrado se eliminaron las
componentes de frecuencia menores a 1 hz. y mayores a 20 hz., ii) se desecharon los
canales prefrontales (Fp1, Fp2) y occipitales (O1, O2) que son poco relevantes para el
fenómeno bajo estudio y muy propensos a presentar artificios y iii) se estableció la
referencia promedio, lo que significa restarle a cada canal la señal obtenida del
promedio de todos los canales.
1.3 Resultados y análisis

Una vez hecho el preprocesado se promediaron los trazados
electroencefalográficos (los 19 canales) de todos los ensayos válidos por condición
experimental y por sujeto. Con lo que se obtuvo el equivalente a dos trazados promedio
por sujeto, uno por condición experimental, y previo a todo análisis fino de los datos se
realizó un segundo promedio sobre todos los sujetos, obteniéndose dos trazados
correspondientes a ambas condiciones experimentales: el promedio general o “gran
promedio”, que aparece graficado a continuación para dos canales centrales y dos
parietales, en ambas condiciones experimentales. Las líneas punteadas indican la ventana
temporal de interés. En rojo oraciones incorrectas, en azul correctas.
Fig. 4. Gran promedio para cuatro canales representativos del P600 (en microvolts) vs. tiempo
(en segundos). Las líneas punteadas indican la ventana temporal de interés. Rojo: oraciones
incorrectas, azul: oraciones correctas.
La inspección visual del promedio general indicó una onda positiva para las
oraciones incorrectas en la ventana 600-900 ms. Si bien la positividad era observable en
los canales frontales, se hacía más definida en los centrales y parietales. Por su latencia
y distribución topográfica, el potencial observado resultó análogo al componente P600.
La fig. 5 muestra la reconstrucción, a partir de lo registrado por los electrodos,
del potencial craneal “gran promedio” a los 660ms de presentado el estímulo para
ambas condiciones experimentales. El gráfico fue generado con el programa de
distribución gratuita “Loreta”. El color rojo indica positividad y el azul negatividad; la
imagen superior corresponde a frases incorrectas y la inferior a correctas.
Fig. 5. Reconstrucción del potencial craneal “gran promedio” 660ms. tras la

estimulación. La imagen superior corresponde al promedio sobre frases sintácticamente
incorrectas, la inferior sobre frases correctas. El color rojo indica positividad y el azul
negatividad.
Se puede apreciar aquí, en forma muy visual, las características ya mencionadas

del gran promedio en la ventana temporal: mayor positividad ante oraciones incorrectas
y ubicación de dicha diferencia (lateral izquierda y centro-parietal).
Entonces se llevaron a cabo análisis estadísticos con los datos pertinentes que
permitieron estudiar: i) los correlatos neuronales del aprendizaje de una gramática
artificial sin contenido semántico y ii) la posible modulación del P600 en función del
grado de aprendizaje de las estructuras entrenadas. Para esto se tomo como ventana
temporal relevante el citado intervalo 600 - 900ms. post estimulación. Entonces se
promedió, para cada sujeto, en cada canal y condición experimental, la señal registrada
en esa ventana y en todos los ensayos válidos obteniéndose 21x15x2 valores (21 sujetos,
15 canales y 2 condiciones experimentales). Sobre este conjunto de valores se
efectuaron los análisis estadísticos: Anovas de medidas repetidas.
a) Efectos de la violación sintáctica

Con el fin de analizar diferencias en el potencial debidas a violaciones
sintácticas se armaron dos listas de 21 elementos, una conteniendo para cada sujeto el
promedio de los 15 canales para las frases correctas y la otra para las incorrectas. Se
efectuó entonces un Anova que arrojó como resultado un índice p=0,038, de donde se
concluyó que violaciones sintácticas se asocian a una positividad mayor que oraciones
correctas.
b) Lateralidad
Para observar efectos de lateralidad se armaron las listas promediando para cada
sujeto los valores de los canales frontales (F), temporales (T), centrales (C) y parietales
(P) de un hemisferio y de ambas condiciones experimentales; esto para ambos
hemisferios por separado. De donde se obtuvieron dos listas de 21 valores, cada una
correspondiendo a un hemisferio. Entonces se realizó un test Anova que arrojó como
resultado que ambas listas de valores diferían significativamente. El índice de la prueba
fue p = 0,008. De esto se concluyó que el potencial evocado está, efectivamente,
lateralizado a izquierda.
c) Región
Para estudiar la distribución topológica del P600 se promediaron, para cada
sujeto, los valores en ambas condiciones experimentales para los canales de tres
regiones por separado: anteriores (F7, F3, Fz, F4, F8), centrales (T3, C3, Cz, C4, T4) y
posteriores (T5, P3, Pz, P4, T6). De esto se obtuvieron 3 listas de 21 valores a las que se
les aplicó una Anova (p=0,01). Se concluyó entonces que el potencial es mayor en los
canales centrales y parietales que en los frontales.
d) Efectos del aprendizaje

Hasta aquí no se mencionó un resultado comportamental de gran relevancia: una
prueba G (con p<0,05) aplicada a las respuestas de cada sujeto (considerando solo las
respondidas) reveló que de los 21 sujetos, 9 no respondieron significativamente mejor
que el azar, es decir que no aprendieron, al menos explícitamente, las reglas
gramaticales. En un primer momento se pensó en desechar los resultados de estos
sujetos, que sin embargo fueron incluidos en el análisis anterior. Esto se debe a que una
prueba del efecto de la violación sintáctica sobre este grupo reveló que en estos también
hay una diferencia significativa entre ambas condiciones experimentales (p<0,04); esto
revela un aprendizaje implícito de la regla sin correlato conductual.
Para estudiar el efecto del nivel de aprendizaje sobre el potencial se dividió a los
sujetos en dos grupos: aquellos que respondieron significativamente mejor que el azar y
aquellos que no. Para cada sujeto de cada grupo se promediaron los valores de todos los
canales centrales y posteriores en ambas condiciones experimentales. Como resultado se
obtuvieron dos conjuntos de valores que un Anova reveló que eran significativamente
distintos (p<0,02).
En la fig. 6 se grafica la distribución topográfica y los posibles generadores de la
onda de diferencia (frases incorrectas - correctas) para ambos grupos en la ventana 600 -
900 ms., para los sujetos que aprendieron (izquierda) y los que no aprendieron
(derecha). El color rojo indica positividad y el azul negatividad.
Fig. 6. Onda de diferencia por grupo: topografía y posibles generadores. El color rojo indica
positividad y el azul negatividad.
Puede notarse que la diferencia es mucho más acentuada en los sujetos que
aprendieron explícitamente la gramática. En el grupo que aprendió se habrían activado
bilateralmente los giros frontales y temporales (superior, medio e inferior), mientras que
en los sujetos que no aprendieron, la activación de estas áreas se limitó al hemisferio
izquierdo. En este último grupo se habrían activado, además, regiones parietales
izquierdas.
1.4 Discusión
En primer lugar se encontró un componente P600 significativo ante la aparición
de oraciones incorrectas en gramáticas artificiales. Además se establecieron algunas
características del potencial: estar lateralizado a izquierda y localizado principalmente
en la zona centro-parietal del cráneo. Los generadores neuronales estimados son
congruentes con estudios previos de resonancia funcional en los que se presentaron
violaciones de sintaxis en lenguajes naturales y artificiales. De esto se dedujo que no se

requiere de un contenido semántico para la aparición del P600.
Una conclusión novedosa fue producto de un hecho en principio indeseado: el
que muchos de los sujetos no parecían aprender las reglas gramaticales. El análisis de
este grupo reveló la existencia de una diferencia significativa en el potencial ante
oraciones incorrectas. Esto puede ser explicado asumiendo que los sujetos aprendieron
la regla. Ahora bien, si los sujetos aprendieron la regla, ¿por qué no son conscientes de
ello y lo manifiestan conductualmente? Una hipótesis, compatible con los
conocimientos neurofisiológicos, es que sería necesario un número mínimo de neuronas
activas y/o disparando sincrónicamente para generar una respuesta comportamental
adecuada. Por lo que se trataría de un aprendizaje implícito. Pese a esto, el P600 no era
idéntico en ambos grupos, sino que resultó ser significativamente más débil en el grupo
que no aprendió, de donde se infiere una modulación del P600 por el grado de
aprendizaje de las reglas gramaticales. La actividad más distribuida observada en los
sujetos que no aprendieron, que incluyó regiones parietales y frontales más anteriores,
podría vincularse a una mayor demanda cognitiva para la resolución de la tarea, y/o a la
aplicación de estrategias alternativas de resolución.
Además de los descubrimientos recién citados, que tienen importancia propia,
todo esto parece sustentar la hipótesis estadística de los mecanismos de aprendizaje de
reglas gramaticales sobre la hipótesis tradicional. Este enfoque resulta especialmente
atractivo ya que permite explicar, a partir de una hipótesis simple, las conclusiones
arriba descriptas. Así, la modulación del P600 por el grado de aprendizaje de las
estructuras sintácticas, resulta natural si se tiene en cuenta que un mismo error causará
una mayor violación de expectativa en una estructura bien aprendida. Por otra parte,
como la explicación de que el P600 es evocado ante una violación de expectativa,
producto de un análisis estadístico del input lingüístico, es independiente de cualquier
aspecto semántico de la oración presentada entonces resulta esperable encontrar los
P600 en tareas con gramáticas artificiales.
CAPITULO 2
ANÁLISIS GENERAL POR CONDICIONES
2.1 Introducción
Se explicará el análisis intraensayo efectuado sobre los datos de 14 sujetos que
respondieron significativamente mejor que el azar, prueba G (p<0,05), 12 de los cuales
constituyeron el grupo que aprendió en el capítulo anterior.
Se comenzará describiendo el preprocesamiento de los datos (filtrado, selección
de canales, referencia, y remoción (o no) de la línea de base). Luego se explicará el
funcionamiento del clasificador y sus variantes de análisis que, junto con las variantes
en el preprocesamiento, determinan un conjunto de posibles procesamientos o
procesados de los trazados electroencefalográficos. Finalmente se determinarán criterios
para establecer cuándo el clasificador separa los ensayos de determinado sujeto por
condición experimental (frases correctas/incorrectas) con una significancia del 5% y,
tras comprobar que no existe un único procesamiento en que las condiciones de más de
dos sujetos puedan separarse, para determinar qué procesamiento usar para cada
individuo. Además se estudiará la importancia relativa de los posibles valores de cada
una de las variables que determinan un procesado.
2.2 Métodos
a) Preprocesado
El primer paso consistió en filtrar digitalmente la señal para deshacerse del
ruido de línea y posibilitar el análisis por bandas de frecuencia. Para la línea se utilizó
un filtro “notch” de segundo orden con una frecuencia de 50hz. y un ancho de banda de
100/35 hz. a un nivel de -3 dB, y para definir las bandas la función “eegfilt” del paquete
para análisis electroencefalográficos “EEGLAB” de “Matlab”. Los límites y nombres de
la bandas fueron los siguientes: 1-4hz (Delta); 4-8hz (Theta); 8-12hz (Alfa); 12-30hz
(Beta); 30-70hz (Gamma), y un sexto contenía al espectro completo 0-70hz. Además se
agregó un filtro con los mismos límites que el del análisis clásico, 1-20hz, con el fin de
hacer posibles comparaciones.
A continuación se seleccionó un subconjunto de canales para deshacerse de los
poco importantes para el fenómeno bajo estudio y/o propensos a presentar artificios. Un
primer grupo contuvo todos los canales; el segundo los 15 restantes tras desechar los
prefrontales y occipitales; y el tercero los 6 en que se manifiesta más intensamente el
potencial P600 (ver introducción), constituido por los canales centrales (C3, Cz, C4) y
parietales (P3, Pz, P4).
Luego se estableció la referencia. Una posibilidad fue referenciar al promedio,
lo que significa restarle a cada canal la señal obtenida del promedio de todos los
canales. Se quita así la variación común del potencial craneal. La otra referencia
utilizada fue conservar la auricular.
Entonces se llevó a cabo la validación de ensayos siguiendo los mismos criterios
que en el análisis clásico (ver ítem c, sección 1.2): respuestas correctas con menos de 2
segundos de latencia y ausencia de artificios.
Finalmente, tras separar los ensayos por condición experimental, se removió (o
no) la línea de base, restándole a cada canal el promedio de su trazado en los 200ms.
previos a la señal de sincronización en cada ensayo, y se examinó la misma ventana de
interés que en el examen precedente: 600-900 ms. post señal sincronización.
b) Clasificador
Se entrenó un discriminador lineal (Fischer 1936; Duda et al. 2000), cuyas
entradas fueron ciertas características de los trazados electroencefalográficos de cada
ensayo, y sus salidas las respuestas dadas por el participante en cada ocasión. Para ello
se utilizó cierto porcentaje de los ensayos válidos para cada participante. Luego fue
probado con los ensayos restantes, con la finalidad de estimar el desempeño en la
predicción del tipo de oración (correcta/incorrecta) a partir de las mismas características
del electroencefalograma (Lew et al. 2009). Debido a la baja cantidad de ensayos
disponibles se utilizó el método iterativo “bootstrapping” (Efron 1979), que consiste en
redefinir los ensayos de entrenamiento y testeo en cada iteración, con la intención de
mejorar los resultados del clasificador.
En cada iteración, i) se definieron dos subconjuntos del total de ensayos de cada
condición experimental como de entrenamiento y testeo; ii) se calculó un “vector
características” por ensayo; iii) se encontró un hiperplano que separa los “vectores
características” en entrenamiento de ambas condiciones experimentales, y se calculó la
performance del clasificador en el entrenamiento; iv) se calculó la performance en el
test a partir del hiperplano calculado y los ensayos de test. Se aclara a continuación cada
uno de los pasos.
i) El método exige que la cantidad de ensayos correspondientes a oraciones
correctas e incorrectas sea la misma. Para lograr este fin sin desperdiciar información se
calculó el mínimo entre la cantidad de ensayos de ambas condiciones

experimentales, N , y se fijó la cantidad de ensayos de entrenamiento, N E , como un
70% de ese valor1 y la de test, N T , como un 30% del mismo. Entonces se definió el
subconjunto de ensayos de entrenamiento eligiendo al azar N E / 2 ensayos de la
condición experimental correctas y N E / 2 de la condición incorrectas, y el subconjunto
de ensayos de test eligiendo de la misma manera N T / 2 ensayos de cada condición
experimental. De esta manera puede uno asegurarse de usar la información de todos los
ensayos con el correr de las iteraciones, en lugar de desechar arbitrariamente algunos de
ellos.
r
ii) El vector características, X , es producto de computar un estadístico
determinado -en este caso promedio, desviación estándar o varianza normalizada2- en
cada canal a lo largo del tiempo o en cada instante3 a través de los canales. Al primer
caso se lo denominó “intracanal”, al segundo “intercanal”. Adicionalmente se dividió
la ventana en segmentos temporales menores (“bines”) y se calculó un estadístico dentro
de cada uno. Para el caso intercanal esto significa promediar los estadísticos obtenidos
en todos los instantes pertenecientes a cada segmento temporal4. Finalmente, los
estadísticos se calcularon individualmente (“estadístico único”) o en alguno de los
siguientes pares (“estadístico doble”): promedio y desviación estándar o promedio y
varianza normalizada. Todos estos valores se reunieron formando el vector
características que entonces condensa ciertas particularidades del ensayo en cuestión,
particularidades que pueden o no diferir apreciablemente por condición experimental.
La dimensión, o cantidad de componentes, de los vectores características puede
calcularse como,
r
Dim( X int ra ) = N can × N bines × N estad (1a)
en el caso intracanal y como,
r
Dim( X int er ) = N bines × N estad (1b)
1
Este porcentaje no es producto de un análisis teórico sino de la experiencia. Se vio que otros valores o
bien no mejoraban el desempeño del clasificador o lo empeoraban. Entre otras alternativas, se probó usar
como conjunto de entrenamiento todos los ensayos excepto uno, con el que se testeó, los resultados no
fueron satisfactorios.
2
Definida como el cociente entre la desviación estándar y la media.
3
Con esta palabra se quiere significar una adquisición individual del potencial (recuérdese que la
frecuencia de adquisición es de 256hz.).
4
Es importante notar que, en el análisis intercanal, el no definir una cantidad de bines es equivalente a
tener 78 (resultado del producto de la frecuencia de adquisición y la duración de la ventana de interés:
256 hz. x 300 ms.), es decir uno por adquisición.
en un análisis intercanal. Donde N can representa la cantidad de canales conservados,
N bines la cantidad de bines en que se dividió la ventana de interés y N estad la cantidad de

estadísticos simultáneos (dos para estadístico doble; uno para único). Un ejemplo simple
lo constituye un análisis intracanal en que se desechen los canales prefrontales y
occipitales, no se divida la ventana en bines y sólo se utilice el estadístico promedio. En
ese caso el vector características estaría compuesto por 15 componentes (un promedio
por canal) independientemente de factores como la referencia o el filtrado. Si en cambio
se consideraran 3 bines (600-700 ms., 700-800 ms. y 800-900 ms.), la cantidad de
componentes se triplicaría, correspondiendo las primeras 15 a los promedios efectuados
sobre los canales en la primer ventana, las segundas 15 a los calculados en la segunda y
las terceras 15 a los de la última. Por otra parte, si por ejemplo se calcularan dos
estadísticos la cantidad de componentes se duplicaría.
r
iii) Para calcular la normal, W , al hiperplano se comenzó quitándole a cada
r
vector características de entrenamiento X iE la media de todos los vectores de
entrenamiento,
r r r
X iE ← X iE − X (2)
E
donde el símbolo “ ← ” indica asignación y E

la media sobre el conjunto de
entrenamiento. La distribución de vectores resultante quedó centrada en el origen.

r
Luego se calculó W como la diferencia entre las medias de los vectores de oraciones
correctas e incorrectas,
r r r
W= X − X (3)
CE IE
Los subíndices “CE” y “IE” indican vectores en la condición “correctas” e “incorrectas”

de entrenamiento, respectivamente. Es importante mencionar que para encontrar la
normal del hiperplano que mejor separa dos conjuntos de vectores (maximizando la
distancia de los puntos al hiperplano) es necesario tomar en cuenta, además de la media
de los conjuntos, como en este caso, su covarianza. Sin embargo para obtener una buena
estimación de dicha covarianza se necesita una cantidad de ensayos mayor a la
disponible.
r r
El signo del producto interno entre un vector X y W indica de que lado del
r
hiperplano se encuentra X , si del de “correctas” o “incorrectas”, y es en virtud de esta
propiedad que se le da el nombre de “hiperplano divisor”. Se definió entonces la
performance de ensayos correctos (incorrectos) como el cociente entre la cantidad de

r
vectores correctos (incorrectos) que multiplicados por W dan un valor positivo
(negativo) y la cantidad total de vectores,
r r
Perf CE = ∑i θ ( X iCE .W ) / N E (4a)
r r
Perf IE
= ∑i θ (− X iIE .W ) / N E (4b)
donde θ (x) representa la función escalón y se considera θ (0) = 0 .

Finalmente la performance de la iteración se obtuvo como el promedio de ambas
performance,
Perf E
= ( Perf CE + Perf IE
)/2 (5)
iv) La performance en el test se calcula en forma completamente análoga a partir
r
del W y los ensayos de test, tras quitarles a estos últimos la media de los vectores de
entrenamiento previamente calculada:
r r r
X iT ← X iT − X (6)
E
r r
Perf CT = ∑i θ ( X iCT .W ) / N T (7a)
r r
Perf IT
= ∑i θ (− X iIT .W ) / N T (7b)
Perf T = ( Perf CT + Perf IT

)/2 (8)
Tras cada iteración se almacenaron entonces dos valores de performance, uno
correspondiente al entrenamiento y otro al test, que indican el desempeño del
discriminador en ambas fases.
c) Condiciones y factores de procesado

La combinación de estas variables de preprocesado y del clasificador dio como
resultado 6720 procesamientos posibles de los datos, a cada uno de los cuales se llamó
condición de procesado. Una condición de procesado está compuesta por 7 factores de
procesado: la banda analizada, los canales seleccionados, la referencia, la remoción (o
no) de la línea de base, el tipo de análisis (intra/intercanal), el estadístico utilizado y la
cantidad de bines. Los primeros 4 pertenecen al preprocesado y los últimos 3 son
variables del discriminador.
Hay, además, ciertos parámetros que son comunes a todas las condiciones de
procesado: la ventana de interés (600-900ms. post estimulación), el porcentaje de
ensayos de entrenamiento (70%) y la cantidad de iteraciones (1000).
Debido a que al tomar referencia promedio la media intercanal se anula, fue
necesario excluir aquellas condiciones de procesado que tuvieran referencia promedio
en un análisis intercanal con estadístico promedio o varianza normalizada. El número de
condiciones previamente mencionado no incluye estas excepciones.
Entonces, producto del análisis anterior, se obtuvo, para cada uno de los 6720
procesamientos, una lista de 1000 valores de performance (uno por iteración) para el
entrenamiento y otra para el test. Y todo esto para cada sujeto.
d) Criterio de significancia
Cuando para un determinado sujeto, en cierta condición de procesado, el
porcentaje de veces en que la performance de test resultó mayor que 0,5 sea mayor o
igual al 95% del total de las pruebas (950/1000), se podrá asegurar que el clasificador
pudo separar exitosamente los ensayos por condición experimental con un grado de
significancia del 5%.

Con este criterio se buscó alguna condición en la que el discriminador tenga
éxito en una cantidad considerable de sujetos. El análisis arrojó que de las 6720
condiciones, 6221 no presentaron ningún sujeto, 463 uno, 36 dos y ninguna tuvo más de
dos. Con lo que sólo el 7,4% del total de procesamientos arrojó al menos un sujeto en
que el clasificador tenga éxito y en ninguna condición pudieron separarse ambas
condiciones experimentales para muchos sujetos.
Con la finalidad de determinar la importancia relativa de los posibles valores que
puede adoptar cada factor de procesado se construyó la tabla I. Esta muestra, para cada
factor, el porcentaje de veces que tomó cada valor dentro del conjunto de las 499
condiciones en que el discriminador tuvo éxito con al menos un sujeto.
Factor Valores
Filtro (banda) Delta Theta Alfa Beta Gamma 0-70hz. 1-20hz.
25% 30,4% 16,4% 6% 0,6% 12,2% 9,2%
Canales Todos Sin Fp's, O's C's y P's

31,8% 38,8% 29,2%
Referencia Promedio Auricular

46,4% 53,5%
Línea de base No quitando Quitando

51,5% 48,4%
Tipo análisis Intracanal Intercanal

77,35% 22,6%
Estadístico Promedio Desviación Var. norm. Prom. y Desv. Prom. y Var.

16,2% 59,5% 0% 24% 0,2%
Bines 1 2 3 4 5 6 7 8 9 10
14,6% 9,8% 11,4% 14,4% 8,8% 5,4% 9,6% 8% 8,4% 7,6%
Tabla I. Se muestra, para cada factor, el porcentaje de veces que adoptó cada valor dentro
del conjunto de las 499 condiciones en que el discriminador tuvo éxito con al menos un sujeto.
Se pueden hacer algunas observaciones respecto a la localización de la

información relevante para el clasificador: en cuanto al filtrado, la banda Gamma no
parece tener relevancia, la Beta poca, y la Theta mucha, lo que es consistente con la
frecuencia correspondiente a la duración de la ventana de interés: 1/300ms. = 3,33hz.;
en cuanto al tipo de análisis, parece haber una preferencia por la localización interna en
los canales; y en cuanto al estadístico, aquellos en que interviene la varianza
normalizada no son en absoluto relevantes, y la desviación estándar parece predominar
sobre el promedio.
Pese a esta dificultad para encontrar un procesamiento bueno para muchos
sujetos, al observar para cuales el clasificador tuvo éxito, se encontró que para 11 de los
14 individuos funcionó con al menos una condición de procesado, lo que puede
apreciarse en la fig. 7, en la que se diagrama la cantidad de dichas condiciones por
sujeto.
Fig. 7. Cantidad de condiciones en que el discriminador separó exitosamente ambas

condiciones experimentales vs. sujeto.
Por lo tanto fue necesario usar el clasificador en una condición particular por
sujeto. Con el fin de determinar qué procesamiento usar en cada caso se estableció el
criterio siguiente: de entre todos los posibles, se elegirá aquel procesamiento que
maximice la media de las performance de entrenamiento. Esa condición de procesado
será llamada “condición de procesado ganadora”.
Entonces se calculó el porcentaje de performances de test mayores a 0,5 en la
condición de procesado ganadora para los 14 sujetos, encontrándose malos desempeños
para casi todos, lo que parecía implicar una falta de correlación entre entrenamiento y
test. Sin embargo este resultado negativo podía tener otra causa: aquellas condiciones en
que la dimensionalidad del espacio de vectores características sea grande tenderán a
arrojar mayores performances de entrenamiento (debido a que en un espacio de mayor
dimensionalidad se tiene más libertad para elegir el hiperplano divisor),
independientemente de la separabilidad inherente a los datos (propiedad necesaria para
lograr un buen desempeño en el test), lo que da preferencia a las condiciones de alta
dimensionalidad por sobre las otras. Lo que se observó resultó compatible con está
explicación: todas las condiciones ganadoras presentaban 8, 9 o 10 bines y, en el caso
intracanal, una tendencia al uso de todos los canales; maximizando así la dimensión de
los vectores características (ver ecs. 1a, 1b). En el capítulo siguiente se explora una
solución a este problema.
CAPITULO 3
ANÁLISIS POR GRUPOS
3.1 Introducción
El presente capítulo describe la solución adoptada frente al problema surgido al
final del capítulo anterior: al aplicar el criterio según el cual se elige, para cada sujeto, el
procesamiento que maximiza la performance promedio en entrenamiento, los resultados
resultaron muy pobres. La solución adoptada consistió en dividir el espectro de 6720
procesamientos en grupos de condiciones de procesado cuyos vectores característica
tuvieran igual cantidad de elementos o dimensiones, y llevar a cabo el análisis,
siguiendo el criterio descripto, dentro de cada grupo por separado.
3.2 Métodos
Ciertos factores de procesado, como el filtrado o la referencia, no modifican la
dimensionalidad del espacio de vectores características, mientras que otros sí lo hacen.
Entonces se separaron las 6720 condiciones de procesado en conjuntos
isodimensionales (“grupos”) fijando en cada uno los 4 factores que influyen en dicha
dimensionalidad (ver ecs. 1a, 1b): número de bines, cantidad de canales y de
estadísticos y tipo de análisis (intra/intercanal). De esto surgieron 120 grupos, cada uno
compuesto por 84, 56 o 28 condiciones según consideren uno o dos estadísticos en un
análisis intra o intercanal5. Las condiciones dentro de un grupo dado difieren en cuanto
a los demás factores: filtro, referencia, línea de base y estadístico considerado.

Una vez hecho esto se eligió, dentro de cada grupo, la condición ganadora según
el criterio mencionado, y se calculó el porcentaje de performances de test mayores a 0,5,
para los 14 sujetos en dicha condición. La figura siguiente ilustra esto, mostrando la
cantidad de sujetos para los que el discriminador tuvo éxito en cada grupo.
5
El tipo de análisis influye indirectamente en la cantidad de condiciones del grupo a través de las
excepciones del caso intercanal que modifican la cantidad de posibles estadísticos y referencias.
Fig. 8. Cantidad de sujetos para los que el clasificador pudo separar ambas condiciones
experimentales vs. número de grupo. La numeración de los grupos es arbitraria. Los 4 dígitos
que acompañan a los seis grupos con más sujetos indican de qué grupo se trata siguiendo la
convención descripta en el cuerpo principal del texto.
Los dígitos que acompañan los 6 grupos con más sujetos indican de qué grupo se
trata siguiendo la siguiente convención: el primer digito señala la cantidad de canales
(1: todos los canales; 2: excluyendo prefrontales y occipitales; 3: canales centrales y
parietales), el segundo el tipo de análisis (1: intracanal; 2: intercanal), el tercero la
cantidad de estadísticos utilizados (1: promedio, desviación estándar o varianza
normalizada; 2: promedio y desviación estándar o promedio y varianza normalizada), y
el cuarto la cantidad de bines.
Se pueden valorar los grupos según la cantidad de sujetos para los que el
discriminador tuvo éxito en la separación de los ensayos de test por condición
experimental. En este sentido el mejor es el “2111”, en que son 8 los sujetos, seguido
del “3112” con 5. Además cabe observar que en los 6 mejores grupos se lleva a cabo un
análisis intracanal y en 5 de ellos no se divide la ventana en bines (lo que es esperable
teniendo en cuenta que con los bines aumenta la dimensionalidad del espacio con las
dificultades que vimos que ello acarrea para elegir un buen test (ver sección 2.3).
Es elocuente el hecho de que el grupo “2111” este compuesto por los
procesamientos más similares al del análisis clásico: al igual que en ese caso se
desechan los canales prefrontales y occipitales, se analiza a nivel intracanal y no se
divide la ventana de interés. La diferencia radica en que ahora se considera, además del
promedio, la desviación estándar y la varianza normalizada (aunque esta última, como
se verá, no es en absoluto relevante) y distintas variantes de preprocesado. En el

capítulo 6 se explorarán en profundidad las similitudes y diferencias entre los análisis
clásico e intraensayo.
CAPÍTULO 4
ANÁLISIS POR SUJETO: PREDICCIÓN DE LA VALIDEZ GRAMATICAL
4.1 Introducción
El análisis se centrará ahora en el grupo con mayor cantidad de sujetos para los
que el clasificador tuvo éxito en la condición de procesado ganadora, el grupo “2111”.
Se comenzará exponiendo gráficos que muestran el porcentaje de performances de test
mayores a 0,5 para cada sujeto, de donde se verá que en no todos se pudo separar ambas
condiciones experimentales. Entonces se presentarán algunos estudios llevados a cabo
con la finalidad de encontrar diferencias entre los sujetos en que se pudo separar ambas
condiciones experimentales y los que no: se mostrará la correlación entre el porcentaje
de performances de test mayores a 0,5 y la cantidad de ensayos de los sujetos y un
análisis considerando los ensayos con artificios de manera de aumentar la cantidad de
ensayos (a costa de la reintroducción de cierto ruido en la señal). También se enseñará
la correlación entre el porcentaje de performances de test mayores a 0,5 y el porcentaje
de respuestas correctas sobre respondidas, parámetro relacionado con el nivel de
aprendizaje del sujeto.

a) Performance por sujeto
En la fig. 9 se grafica el porcentaje de performances de test mayores a 0,5
correspondiente a la condición de procesado ganadora (eje y) vs. el mayor porcentaje de
performances de test mayores a 0,5 dentro del espectro de condiciones del grupo (eje x),
este último valor constituye un umbral al que el clasificador puede aspirar para un sujeto
determinado. Cada elemento del gráfico corresponde a un sujeto. Las líneas
discontinuas verdes indican el límite que separa los porcentajes para los que el
discriminador tiene éxito de los que no y la línea punteada negra es la recta y=x.
Fig. 9. Porcentaje de performances de test mayores a 0,5 vs. umbral; cada elemento
corresponde a un sujeto. Las líneas verdes separan los porcentajes para los que el discriminador
tiene éxito de los que no y la negra es la recta y=x.
Se puede apreciar que para 8 sujetos el clasificador pudo separar ambas

condiciones experimentales mientras que para 6 no, aunque uno de estos (el sujeto 11)
quedó relativamente cercano al límite con un porcentaje igual a 93,2%. También es
importante notar que para todos los individuos cuyo umbral fue mayor o igual al 95% se
pudieron separar ambas condiciones en forma exitosa. Además hay una correlación
importante entre el umbral y el porcentaje de performances de test mayores a 0,5,
especialmente para los 8 sujetos para los que el clasificador tuvo éxito. Esto es
graficado a continuación junto con un ajuste lineal por cuadrados mínimos (recta roja),
en el borde superior izquierdo se muestra su expresión analítica.
Fig. 10. Porcentaje de performances de test mayores a 0,5 vs. umbral; cada elemento
corresponde a un sujeto para el que el discriminador tuvo éxito. La recta roja es el ajuste lineal
(en el borde superior izquierdo se encuentra su ecuación) y la línea punteada es la recta y=x.
El coeficiente de correlación obtenido es 0,9394 (p= 0,00053) con lo que la

correlación es muy alta. También es elocuente el hecho de que en 5 de estos sujetos el
discriminador alcanzó el umbral (puntos sobre la línea punteada), mientras que en los 3
restantes un valor cercano.
La fig. 11 muestra, para cada sujeto, el promedio de las performance de test en la
condición ganadora junto con las correspondientes barras de error. Una estrella roja
acompaña a los sujetos para los que el discriminador pudo separar oraciones correctas e
incorrectas.
Fig. 11. Promedio de las performance de test en la condición ganadora junto con las
correspondientes barras de error. Las estrellas rojas indican sujetos cuyo porcentaje de
performance de test resultó mayor o igual al 95%.
Esta figura complementa a la fig. 9 mostrando el promedio y la desviación

estándar de las performances. Puede notarse que los promedios son considerablemente
mayores a 0,5 (especialmente en los sujetos para los que se pudo separar las condiciones
experimentales) lo que no es consecuencia necesaria del hecho de que la cantidad de
performances mayores a 0,5 se alta, lo que podría ocurrir con una performance media
cercana a 0,5.
b) Influencia de la cantidad de ensayos

En este punto surgió el interrogante siguiente: ¿por qué para algunos sujetos se
pudo separar ambas condiciones experimentales mientras que para otros no? Ello puede
deberse a una limitación del método o a la naturaleza de los datos, pudiendo ser estos,
por ejemplo, excesivamente ruidosos en algunos sujetos. A continuación se llevan a
cabo ciertos análisis con el objeto de responder esto.
Teniendo en cuenta que en el proceso de validación se llevó a cabo una
selección de ensayos, descartando aquellos que presentasen artificios y/o en que el
individuo haya respondido incorrecta y/o tardíamente, para cada sujeto se tendrá una
cantidad diferente de ensayos válidos con los que entrenar y testear el discriminador, y
esto puede influir en el desempeño del mismo. En la figura siguiente se grafica la

cantidad de ensayos válidos por sujeto; cruces verdes para sujetos en que el clasificador
tuvo éxito, cruces rojas para los que no.
Fig. 12. Número de ensayos por sujeto; cruces verdes para sujetos en que el clasificador tuvo
éxito, cruces rojas para los que no.
Puede observarse que 5 de los sujetos para los que no pudo separarse las
condiciones experimentales (sujetos 2, 5, 10, 11 y 13) tienen pocos ensayos mientras
que, por otro lado, para los 4 individuos con mayor cantidad de ensayos (sujetos 1, 8, 9
y 12) el clasificador tuvo éxito. En síntesis, parece haber cierta correlación entre la
cantidad de ensayos y la cantidad de performances de test mayores a 0,5. Una prueba de
correlación lineal entre estas variables arrojó un coeficiente de 0,5967 (p=0,0243). La
fig. 13 ilustra esto. La línea roja es el ajuste lineal y en el borde inferior derecho se
muestra su expresión analítica.
Fig. 13. Porcentaje de performance de test mayores que 0,5 vs. número de ensayos para los 14
sujetos. La línea roja es el ajuste lineal y su ecuación se presenta en el borde inferior derecho.
Esto explica parte del interrogante planteado y da fundamento a un criterio

según el que se desechen aquellos sujetos cuya cantidad de ensayos sea menor a cierta
cota, que en este caso se podría fijar en torno a los 25 ensayos.
Entonces, y sólo con el fin de continuar indagando la influencia del número de
ensayos, se utilizó el discriminador en el grupo “2111” incluyendo los ensayos con
artificios, lo que aumentó dicho número a 51, 35, 41, 44, 44, 44, 45, 54, 52, 44, 26, 59,
20, 37 para los 14 sujetos, respectivamente. La figura siguiente, en que se grafica el
porcentaje de performances de test > 0,5 vs. umbral, ilustra lo obtenido; cada elemento
del gráfico corresponde a un sujeto, las líneas discontinuas verdes indican el límite que
separa los porcentajes para los que el discriminador tiene éxito de los que no y la
punteada negra es la recta y=x.
Fig. 14. Porcentaje de performances de test mayores a 0,5 vs. umbral considerando los ensayos
con artificios; cada elemento corresponde a un sujeto. Las líneas verdes separan los porcentajes
para los que el discriminador tiene éxito de los que no y la negra es la recta y=x.
Al comparar la fig. 14 con la 9 (análoga pero desechando los ensayos con

artificios) puede verse una mejoría general en el desempeño del clasificador en dos
aspectos: una tendencia en el grupo de sujetos para los que se tiene éxito a tener mejores
umbrales y porcentajes de performances de test mayores a 0,5 que antes y un aumento
en la cantidad de dichos sujetos: se arruinó uno, por efecto de los artificios, pero se
sumaron 2 de los 3 sujetos que previamente tenían menos de 25 ensayos. Uno pasó de
22 a 35 y el otro de 23 a 26. De esto se deduce que en estos 2 sujetos el clasificador
fracasó debido al bajo número de ensayos disponibles. Por otra parte, otro sujeto, sin
llegar a ser significativo, mejoró notablemente su desempeño por lo que parece
plausible que el problema consista también en este caso en la cantidad de ensayos.
c) Influencia del grado de aprendizaje

El número de ensayos es entonces un factor muy importante para el desempeño
del discriminador porque determina la cantidad de vectores características con los que
entrenar y testear. Sin embargo, también puede estar ocurriendo que en los sujetos cuyo
aprendizaje (medido en base a sus respuestas) haya sido menos exitoso la diferencia de
las señales entre condiciones experimentales sea menor, tal como se encontró en el
análisis clásico al comparar el grupo de los que respondieron significativamente mejor

que el azar con el de los que no lo hizo (ver ítem d, sección 1.3). Con esta idea se
calculó la correlación entre el porcentaje de performances de test mayores a 0,5 y el
porcentaje de respuestas correctas sobre respondidas, parámetro relacionado con el nivel
de aprendizaje del sujeto; en la fig. 15 se grafican los datos junto a un ajuste lineal, en el
borde inferior derecho se muestra la expresión analítica del ajuste.
Fig. 15. Porcentaje de performances de test mayores a 0,5 vs. porcentaje de respuestas correctas
sobre respondidas. La recta roja es producto de un ajuste lineal y en el borde inferior derecho se
muestra su ecuación.
El índice de correlación lineal es -0,0820 (p=0,7805) por lo que no hay

correlación entre estas variables.
CAPÍTULO 5
ANÁLISIS MEJOR GRUPO POR CONDICIONES Y FACTORES
5.1 Introducción
Se continuará aquí con el análisis del grupo “2111”, centrándose ahora en las
condiciones y factores que lo componen. Se comenzará mostrando el porcentaje de
condiciones de procesado de entrenamiento y test para las que el discriminador tuvo
éxito. Luego se expondrán análisis para determinar los valores más relevantes de cada
factor de procesado y apreciar la importancia relativa de las distintas bandas de
frecuencia, de ambas referencias, de la remoción (o no) de la línea de base y del
estadístico utilizado. Esto permitirá proseguir la comparación con el procesamiento
llevado a cabo en el análisis clásico.

En la fig. 16 se muestra el porcentaje de condiciones de procesado
(pertenecientes al grupo) para las que el clasificador pudo separar ambas condiciones
experimentales en el entrenamiento (en rojo) y en el test (en verde) para cada sujeto.
Fig. 16. Porcentaje de condiciones de procesado (pertenecientes al grupo) para las que el
clasificador pudo separar ambas condiciones experimentales en el entrenamiento (en rojo) y en
el test (en verde) para cada sujeto.
Puede verse que el hecho de elegir un buen entrenamiento no asegura, por sí

mismo, que el test correspondiente sea bueno, y esto le da robustez al método. Además
puede observarse que cada sujeto sólo presenta unas pocas condiciones para las que el
clasificador pudo separar las condiciones experimentales a partir de los ensayos de test.
Análogamente a lo realizado en el capítulo 2 (en esa ocasión con la totalidad de
las condiciones de procesado), se efectuó un análisis con el fin de determinar la
importancia relativa de los posibles valores que puede adoptar cada factor de procesado,
esta vez sobre las condiciones pertenecientes al grupo “2111” con al menos un sujeto
para el que el clasificador tuvo éxito. En este caso son 20 los procesamientos que
cumplen esto, es decir el 23,8% de un total de 84. Al comparar este valor con el 7,4%
sobre el total de 6720 procesamientos cuando no se dividía en grupos, puede verse que
el porcentaje de condiciones significativas es considerablemente más elevado en el
grupo “2111” (alrededor del triple). Los resultados del análisis por factor se resumen en
la tabla siguiente.
Factor Valores
Filtro (banda) Delta Theta Alfa Beta Gamma 0-70hz. 1-20hz.
25% 20% 15% 10% 5% 5% 20%
Referencia Promedio Auricular

60% 40%
Línea de base No quitando Quitando

60% 40%
Estadístico Promedio Desviación Var. norm. Prom. y Desv. Prom y Var.

30% 70% 0 No corresp. No corresp.
Tabla II. Se muestra, para cada factor, el porcentaje de veces que adoptó cada valor dentro
del conjunto de las 20 condiciones del grupo en que el discriminador tuvo éxito con al menos un
sujeto.
Los datos son en algunos casos comparables y en otros al menos no

contradictorios con los de la tabla I. Las diferencias pueden entenderse recordando que
en el estudio con todos los procesamientos se tenía en cuenta, además del análisis
intracanal, el intercanal, de modo que no era de esperarse una gran similitud entre
ambas tablas.
Vemos que todos los valores de los factores, exceptuando la varianza

normalizada en el factor “estadístico”, aparecieron en alguna condición aunque no en la
misma proporción: respecto al filtrado puede observarse, al igual que antes, una
predominancia por las bandas de frecuencia menores (Delta, Theta y Alfa); en cuanto a
la referencia tiene más peso la promedio y lo mismo puede decirse de la no remoción de
la línea de base; finalmente el estadístico más relevante parece ser la desviación
estándar.
A continuación, con el objetivo de profundizar en la importancia relativa de
estos factores, se excluyó del grupo “2111” la varianza normalizada y se lo dividió en
subgrupos menores y complementarios en el sentido de que no compartían ninguna
condición de procesado y cuya unión daba como resultado el grupo original (sin la
varianza normalizada).
En primer lugar se lo desdobló en dos que contenían sólo aquellas condiciones
con estadístico promedio o desviación estándar. El análisis con el discriminador reveló
que en el subgrupo cuyo estadístico fue el promedio el discriminador pudo separar
ambas condiciones experimentales para 3 sujetos, mientras que en el subgrupo con
desviación estándar pudo hacerse para 5. La figura siguiente ilustra los resultados
obtenidos. Se grafican, para los 8 sujeto en que el clasificador tuvo éxito con el grupo
“2111”, el porcentaje de performances de test mayores que 0,5 para ambos subgrupos
(solo promedio: cruces rojas, solo desviación estándar: puntos azules), la línea punteada
se encuentra en 95% y separa casos en que el clasificador tuvo éxito de los que no.
Fig. 17. Porcentaje de performances de test mayores que 0,5 para ambos subgrupos (solo
promedio: cruces rojas, solo desviación estándar: puntos azules)
Puede observarse que los resultados se complementan mucho para los 8 sujetos,
pudiendo separarse ambas condiciones experimentales en sólo uno u otro de los
subgrupos, a excepción del sujeto 8, cuyos ensayos pueden ser separados en ambos, y
del 14 que no pueden serlo en ninguno6. Esto indica que la información relevante no
puede extraerse de uno u otro estadístico sino que ambos son necesarios para este tipo
de análisis.
Luego se separó el grupo “2111” en cuatro subgrupos que diferían en la
referencia considerada y en cuanto a la remoción de la línea de base. En el caso en que
se dejo la referencia auricular y se quito la línea de base el clasificador dejo de separar
las condiciones de 7 sujetos; en el que se conservó la referencia auricular pero no se
quitó la línea de base, de 6 sujetos; cuando se estableció la referencia promedio y se
removió la línea de base dejo de tener éxito para 3 sujetos; y cuando se estableció
referencia promedio y no se removió la línea de base para sólo 1 sujeto. Esto indica que
la referencia más importante es la promedio y que es preferible no quitar la línea de
base. Sin embargo, si se restringen los posibles análisis en este sentido, en el mejor de
los casos se arruina al menos un sujeto.
Finalmente se desglosó el grupo en tres que diferían en cuanto a las bandas
consideradas. Uno excluía los filtros que cubren varias bandas (0-70hz. y 1-20hz.), otro
las bandas Beta y Gamma y un tercero las bandas Delta, Theta y Alfa. En el primer caso
no se observaron cambios en la cantidad de sujetos para los que el clasificador pudo
separar ambas condiciones experimentales, en el segundo dejaron de poder separarse los
ensayos de 1 sujeto y en el tercero los de 3. De esto se concluye que las bandas Delta,
Theta y Alfa resultan imprescindibles, las Beta y Gamma tienen una importancia menor
y los filtros cuyo espectro resultante contiene varias o todas las bandas son
prescindibles.
En suma, de los 6720 procesamientos llevados a cabo, podemos decir que i)
aquellos que incluyen como estadístico al promedio y la desviación estándar son
imprescindibles mientras que considerar la varianza normalizada es innecesario; ii) los
que toman como referencia al promedio y no remueven la línea de base son
imprescindibles mientras que la referencia auricular y la remoción de la línea de base
tienen una importancia marcadamente menor; iii) es necesario incluir condiciones de
procesado en que se divida en bandas de frecuencias, de las cuales son fundamentales
6
Esto último se debe a que la performance del clasificador es una variable estocástica debido a la
naturaleza del bootstrapping y la fig. 19 fue construida a partir de una nueva corrida.
las bandas Delta, Theta y Alfa y tienen una importancia mucho menor Beta y Gamma,
además los filtros que contienen frecuencias correspondientes a varias bandas son
prescindibles.
Al comparar estos resultados con el análisis clásico se observaron las siguientes
similitudes y diferencias: i) a diferencia de antes, no basta con considerar sólo el
promedio sino que es necesario tomar en cuenta la desviación estándar para obtener
resultados satisfactorios; ii) la referencia más relevante resulta ser la misma previamente
utilizada y lo mismo ocurre con la remoción de la línea de base; iii) ahora es necesario
llevar a cabo el análisis separando por bandas de frecuencia.
DISCUSIÓN
En el estudio que fue denominado como “análisis clásico”, cuyos datos y

resultados son el punto de partida del presente trabajo, se halló un componente P600
ante la presentación de oraciones incorrectas en gramáticas artificiales. Se establecieron
algunas de sus características: estar lateralizado a izquierda y localizado principalmente
en la zona centro-parietal del cráneo. De esto se dedujo que no se requiere de un
contenido semántico para la aparición del P600 lo que parece sustentar la hipótesis
“estadística” de los mecanismos de aprendizaje de reglas gramaticales. Posteriormente,
al comparar, mediante una prueba G, las respuestas reales de los sujetos con las
esperadas de acuerdo a la validez gramatical de las oraciones presentadas, se encontró
que 9 de los sujetos no respondieron significativamente mejor que el azar. Sin embargo
el análisis de este grupo reveló también la existencia de un P600 ante oraciones
incorrectas pero que resultó ser significativamente más débil que en el grupo que
aprendió, de donde se infirió una modulación del P600 por el grado de aprendizaje de
las reglas gramaticales.
Dos limitaciones de este tipo de análisis son que implica promediar los datos de
distintos ensayos y que devuelve un estadístico que revela si en un grupo determinado
de sujetos hay una diferencia significativa entre dos condiciones experimentales. Por lo
tanto no permite determinar si la información necesaria para distinguir entre
condiciones experimentales está presente en el potencial craneal en cada ensayo, ni
obtener resultados de un sujeto en particular y poder así diferenciar entre aquellos que
presentaron P600 y aquellos que no. Esto último puede estar compensado por los
individuos que manifestaron el componente más intensamente. Además el
procesamiento llevado a cabo con los datos implicó, en todos los casos, i) aplicar un
filtro conservando sólo la banda 1-20hz., ii) desechar los canales prefrontales (Fp’s) y
occipitales (O’s), iii) referenciar al promedio, iv) no remover la línea de base, v)
analizar a nivel intracanal, vi) usar un único estadístico (promedio) y vii) no subdividir
la ventana en bines.
Con el fin de superar estas limitaciones e investigar alternativas en cuanto al
procesamiento de los datos se llevó a cabo el denominado análisis intraensayo, cuyas
características principales son que evita promediar datos correspondientes a diferentes
ensayos y cuyos estadísticos se refieren a un único sujeto. Para ello se entrenó y testeó
un discriminador lineal a partir de los datos de cada individuo con un método iterativo
de “bootstrapping”. Esto fue hecho con una multiplicidad de procesamientos posibles y

a partir de los datos de 14 sujetos que respondieron significativamente mejor que el
azar, 12 de los cuales ya habían sido estudiados en el análisis clásico. El número de
procesamientos, que variaban en cuanto al preprocesado (filtrado, selección de canales,
referencia y línea de base) y variables del clasificador (análisis intra/intercanal,
estadístico utilizado y subdivisión de la ventana 600-900ms. en bines), fue de 6720; de
cada uno de ellos se obtuvo un porcentaje de performances de test mayores a 0,5 y un
promedio de performances de entrenamiento. Se estableció un criterio según el cual
cuando dicho porcentaje es mayor o igual al 95%, el discriminador tuvo éxito en la
separación de las condiciones experimentales para ese sujeto, en esa condición de
procesado. Entonces se buscó alguna condición en la que el discriminador tuviera éxito
en una cantidad considerable de sujetos, encontrándose que de un total de 6720
procesamientos sólo para el 7,4% el clasificador pudo separar ambas condiciones
experimentales con los ensayos de test para al menos un sujeto y que en ningún caso se
logró para más de 2. Por lo tanto fue necesario usar el clasificador en una condición
particular por sujeto, de entre todas ellas se eligió aquella que maximice la media de las
performance de entrenamiento. Además el espectro completo de condiciones fue
dividido en 120 grupos definidos por la dimensionalidad de los vectores características
para evitar dar preferencia, en el entrenamiento, a aquellas condiciones de mayor
dimensión. Se utilizó el discriminador dentro de cada grupo.
Una vez hecho esto se pudo valorar los grupos según la cantidad de sujetos para
los que el discriminador logró separar exitosamente ambas condiciones experimentales
a partir de los ensayos de test. En este sentido el mejor fue el denominado grupo
“2111”. Este grupo fue el más similar al análisis clásico ya que, al igual que en él, se
desecharon los canales prefrontales y occipitales, se analizó a nivel intracanal y no se
subdividió la ventana. El discriminador tuvo éxito, en este grupo, para 8 de 14 sujetos lo
que parece ser un resultado pobre. Sin embargo debe ser matizado por los hechos
siguientes. En primer lugar se pudo verificar una correlación significativa (p=0,0243)
entre el éxito del clasificador en el test (medido por el porcentaje de performances de
test mayores a 0,5) y la cantidad de ensayos. En segundo lugar, en todos los individuos
cuyo umbral fue mayor o igual al 95% se pudieron separar ambas condiciones
experimentales. Finalmente, cuando se hizo el análisis sin quitar artificios, de modo que
aumentó la cantidad de ensayos, se vio que para 2 de los sujetos que previamente tenían
menos de 25 ensayos el clasificador fue exitoso en el test, y que en un tercero el
desempeño del clasificador mejoró mucho aunque sin llegar a ser exitoso. En suma, de
los 6 sujetos para los que el discriminador no tuvo éxito, en 3 al parecer el motivo
radicó en la escasez de ensayos, en 1 a que durante la experiencia no contestó, por
equivocación, en muchas ocasiones (sujeto 13) y quedaron 2 sin explicación evidente
(sujetos 5 y 7). Para el primero de ellos el porcentaje de performances de test mayores
que 0,5 fue menor a 95% en las 6720 condiciones, mientras que para el segundo fue
mayor o igual a ese valor en alrededor de 50 casos (ver fig. 7, sección 2.3). Entonces es
posible que el fracaso del discriminador con el sujeto 5 se deba a que su EEG sea
excesivamente ruidoso, mientras que en el otro sujeto la causa puede ser la restricción al
grupo “2111”; quizá en algún otro grupo su condición ganadora coincida con alguna de
estas 50 condiciones, de manera que el clasificador tenga éxito también con él. El
número de ensayos fue sin duda un factor muy importante para el desempeño del
discriminador. El umbral crítico, en esta experiencia, estuvo en torno a los 25 ensayos.
De esto se desprende que al idear experiencias con la intención de llevar a cabo este tipo
de análisis es conveniente generar una buena cantidad de ensayos y al validarlos es
aconsejable utilizar métodos lo más laxos posible.
Por otro lado, se estudió la influencia del grado de aprendizaje de la tarea sobre
el desempeño del clasificador; una prueba de correlación lineal entre el porcentaje de
performances de test mayores que 0,5 y el porcentaje de respuestas correctas sobre
respondidas arrojó un índice de correlación de -0,0820 (p=0,7805) por lo que no pudo
identificarse una modulación del desempeño del clasificador por el grado de aprendizaje
de los sujetos, a diferencia de lo que se encontró en el análisis clásico (ver ítem d,
sección 1.3). Sin embargo en esa ocasión se comparó un grupo de sujetos que
respondieron significativamente peor que el azar con otro que lo hizo mejor que el azar,
mientras que aquí se buscó una modulación más fina dentro del grupo de sujetos que
aprendieron.
Respecto a los factores de procesado relevantes se verificó que i) aquellos que
incluyen como estadístico al promedio y la desviación estándar son imprescindibles
mientras que considerar la varianza normalizada es innecesario; ii) los que toman como
referencia al promedio y no remueven la línea de base son imprescindibles mientras que
la referencia auricular y la remoción de la línea de base tienen una importancia
marcadamente menor; iii) es necesario incluir condiciones de procesado en que se
divida en bandas de frecuencias, de las cuales son fundamentales las Delta, Theta y Alfa
y tienen una importancia mucho menor Beta y Gamma, además los filtros que contienen
frecuencias correspondientes a varias bandas son prescindibles.
Al comparar estos resultados con el análisis clásico se observaron las siguientes
similitudes y diferencias: i) a diferencia de antes, no basta con considerar sólo el
promedio sino que es necesario tomar en cuenta la desviación estándar para obtener
resultados satisfactorios; ii) la referencia más relevante resulta ser la misma previamente
utilizada y lo mismo ocurre con la remoción de la línea de base; iii) ahora es necesario
llevar a cabo el análisis separando por bandas de frecuencia.
Probablemente sería útil hallar un único estadístico que condense la información
de la desviación estándar y la media. Ello se intentó mediante la varianza normalizada,
aunque sin éxito. Esta posibilidad queda pendiente para futuras investigaciones. Otra
mejora al presente análisis podría consistir en tomar una ventana de interés variable por
sujeto, ya que nada asegura que el componente P600 tenga la misma latencia en
distintos individuos.
En síntesis, para 8 sujetos se logró identificar ciertas características de la
información electrofisiológica con las que predecir la condición experimental de cada
ensayo. Estas características no fueron las mismas en los ocho casos, e incluso difirieron
bastante (por ejemplo en algunos se trató del promedio y en otros de la desviación
estándar), lo que sugiere que pudiesen existir diferentes formas de procesamiento de la
información en el cerebro. Esto podría estar relacionado con distintos “estilos
cognitivos”, lo cual merecería ulterior investigación.
CONCLUSIONES
Se logró, mediante el denominado análisis intraensayo, determinar si la

información necesaria para distinguir entre condiciones experimentales está presente en
el potencial craneal en cada ensayo y obtener resultados de un sujeto en particular. De
esta forma se pudieron superar dos limitaciones importantes del método de análisis
anterior. Para lograrlo fue necesario considerar, a diferencia de antes, un conjunto de
posibles procesamientos de los datos y un criterio adecuado con el que elegir cuál
aplicar con cada sujeto. Hubo aquí similitudes y diferencias respecto al procesamiento
utilizado en el análisis clásico. Las diferencias más importantes consistieron en que
mientras que para algunos sujetos se requirió considerar, al igual que antes, el promedio,
para otros fue esencial la desviación estándar, además fue necesario analizar por bandas
de frecuencia, siendo fundamentales las bandas Delta, Theta y Alfa. Entre las
similitudes más destacadas se pueden citar la preferencia por los análisis intracanal y la
no división de la ventana en bines.
El discriminador tuvo éxito en 8 de 14 sujetos y se pudo verificar una
correlación significativa entre el desempeño del mismo y la cantidad de ensayos
(calculada a partir de los datos de los 14 sujetos). Esta correlación indicaría una posible
explicación de los casos negativos. El umbral crítico en el número de ensayos estuvo en
torno a los 25.
APÉNDICE: MEDICIÓN DEL CAMPO ELÉCTRICO CRANEAL Y

MONTAJES
A) Medición
Los campos eléctricos generados en la corteza cerebral viajan a través de

distintos tejidos nerviosos hasta la superficie craneal. Aquí son detectados mediante
electrodos conectados con el equipo electroencefalográfico a través de un
preamplificador diferencial. Se definen entonces los conceptos de campo (craneal)
cercano y lejano como sigue. Un campo cercano es aquel cuyo generador se encuentra a
una distancia comparable a la separación entre el par de electrodos receptores. Uno
lejano aquel cuya fuente se encuentra a una distancia mucho mayor que esa separación.
Por otra parte, un par de electrodos puede ser colocado perpendicular o paralelamente al
generador (o en cualquier posición intermedia entre ellas). Entonces puede pensarse que
una medición con dos electrodos y un generador puede hacerse de cuatro formas
“puras” e independientes:
Campo Cercano
- Perpendicular al generador: misma línea equipotencial, menor sensibilidad.
- Paralelo al mismo: máximo gradiente, mayor sensibilidad.
Máxima diferencia entre perpendicular y paralelo.
Campo Lejano
- Perpendicular al generador: misma línea equipotencial, menor sensibilidad.
- Paralelo al mismo: máximo gradiente, mayor sensibilidad.
Mínima diferencia entre perpendicular y paralelo.
Dicho esto, y teniendo en cuenta que cada canal del preamplificador diferencial
amplifica solo la diferencia entre la señal recibida por dos electrodos, resulta fácil
entender que se procure alejarse lo más posible de fuentes de ruido7 -tales como
monitores, celulares, etc.- y acercarse lo más posible a los generadores que se pretenden
medir. Además en el caso de que el ruido sea persistente puede probarse cambiar la
7
Como la separación entre electrodos es de 3 o 4cm. se recomienda una distancia de 1 a 2m. de la fuente
de ruido.
orientación del sujeto de manera que los electrodos queden sobre las equipotenciales de
la señal indeseada.
B) Montajes y localización
Los montajes son las diferentes maneras en que pueden colocarse los electrodos
sobre el cráneo. Recordemos que la idea siempre es obtener información de la actividad
eléctrica cerebral por lo menos en dos direcciones para poder localizar a los distintos
generadores. Afortunadamente la sociedad de neurofisiología estableció las ubicaciones
y los nombres de cada electrodo, el sistema adoptado más frecuentemente es el “sistema
10/20” que se muestra en la figura A1, a continuación
Figura A1. Montaje electroencefalográfico “10/20”. Los porcentajes se refieren a fracciones

de la longitud a lo largo del perímetro de Nasión a Inión.
Básicamente se puede dividir a los montajes en dos tipos: “monopolares puros”

y “bipolares”. En biología todos los montajes son bipolares, en este caso cada canal del
amplificador tiene dos entradas que son precisamente las dos del preamplificador
diferencial; la diferencia se basa en si los segundos electrodos van en todos los canales
unidos entre sí, o cada segundo electrodo va a una zona activa diferente. Ambos casos
son ilustrados en la figura A2.
Figura A2. Montajes bipolar (izquierda) y bipolar referencial (derecha).
En el primer caso lo normal es enviarlo a una zona eléctricamente neutra. A

veces la referencia se la ubica en O1 u O2 que son zonas no totalmente inactivas pero de
menor actividad. A estos montajes referenciales también se los suele llamar
monopolares, en realidad son bipolares referenciales. Las referencias más utilizadas,
especialmente en los equipos computados, son: A1, A2, A1 + A2, referencia del sistema
(generalmente la frente u otra zona inactiva) y promedio de todos los electrodos.
Cuando ambas entradas del preamplificador diferencial de cada canal van a
electrodos diferentes pero la segunda entrada se une a la primera del siguiente, estamos
en presencia de un montaje bipolar encadenado. Vemos entonces que hay infinidad de
montajes posibles dependiendo de cómo se encadenen los electrodos y de la distribución
en el espacio de los mismos. Sin embargo a efectos prácticos no hay gran diferencia
entre ellas por lo que lo más conveniente parece ser utilizar un montaje convencional
como el sistema 10/20.
BIBLIOGRAFÍA
Duda, R. O.; Hart, P. E.; Stork, D. H. (2000). Pattern Classification (2nd ed.). Wiley
Interscience.
Efron, B. (1979). Bootstrap Methods: another look at the jackknife. The Annals of Statistics 7,
1-26.
Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems. Annals of
Eugenics 7, 179-188.
Friederici, A.D. (1995). The time course of syntactic activation during language processing: A
model based on neuropsychological and neurophysiological data. Brain and Language, 50,
259-281.
Friederici, A.D.; Steinhauer, K.; Pfeifer, E. (2002). Brain signatures of artificial language
processing: Evidence challenging the critical period hypothesis. Proceedings of the National
Academy of Sciences, 99, 529-534.
Gunter, T.C.; Stowe, L.A.; Mulder, G. (1997). When syntax meets semantics. Psychophysiology
34, 660–676.
Hagoort, P.; Brown, C. M.; Groothusen, J.; (1993). The Syntactic Positive Shift (SPS) as an
ERP-measure of syntactic processing. Language and Cognitive Processes 8, 439-483.
Hahne, A.; Friederici, A. D. (1999). Electrophysiological evidence for two steps in syntactic
analysis. Early automatic and late controlled processes. Journal of cognitive neuroscience 11
(2), 194-205.
Kaan, E.; Harris, A.; Gibson, E.; Holcomb, P. The P600 as an index of syntactic integration
difficulty, Language and Cognitive Processes 15 (2): 159–201.
Lelekov, T.; Dominey, P.F.; Garcia-Larrea, L. (2000). Dissociable ERP profiles for processing
rules vs instances in a cognitive sequencing task. Neuroreport. 11(5):1129-32.
Lew, S.; Gutnisky, D.; Dragoi, V. (2009). Decoding the visual working memory in primary
visual cortex. 39th annual meeting of the Society for Neuroscience. Chicago, Illinois, EEUU.
Niedeggen, M.; Roesler, F.; Jost, K. (1999). Processing of incongruous mental calculation
problems: Evidence for an arithmetic N400 effect. Psychophysiology, 36,307-324.
Núñez-Peña, M.I.; Honrubia-Serrano, M.L. (2004). P600 related to rule violation in an
arithmetic task. Cognitive Brain Research, 18, 130-141.
Osterhout, L.; Holcomb, P. J. (1992). Event-related brain potentials elicited by syntactic
anomaly. Journal of Memory and Language 31 (6), 785-806.
Osterhout, L.; Holcomb, P. J.; Swinney, D. A. (1994). Brain potentials elicited by garden-path
sentences: Evidence of the application of verb information during parsing. Journal of
Experimental Psychology: Learning, Memory, and Cognition 20 (4), 786-803.
Tabullo, A.; Sevilla, Y.; Pasqualetti, G.; Vernis, S.; Segura, E.; Yorio, A.; Zanutto, B. S.;
Wainselboim, A. J. Expectancy modulates a Late Positive ERP in an artificial grammar task.
Brain Research (en revisión).
Tabullo, A.; Sevilla, Y.; Pasqualetti, G.; Yorio, A.; Zanutto, B. S.; Wainselboim, A. J. A P600
component in an artificial grammar without semantics: an EEG study of structural violation
type. 29th International Congress of Clinical Neurophysiology. 28 de Octubre al 1 de
Noviembre. Kobe, Japón. Póster.

Tesis Pasqualetti G.

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Tesis Pasqualetti G.

Enviado por

Direitos autorais:

Formatos disponíveis

APRENDIZAJE DE REGLAS GRAMATICALES: UN ANÁLISIS DE ENSAYO

ÚNICO DEL P600 CON GRAMÁTICAS ARTIFICIALES

Tesis de Licenciatura en Ciencias Físicas

Facultad de Ciencias Exactas y Naturales

Universidad de Buenos Aires

ALUMNO: Guillermo D. Pasqualetti

LUGAR DE TRABAJO: IIBM (Facultad de Ingeniería, UBA)

DIRECTOR DEL TRABAJO: Dr. Alberto Yorio

CODIRECTOR o COLABORADOR: Dr. Sergio Lew

INFORME FINAL APROBADO POR:

Director y Co-Director Jurado

Profesor de Tesis de Licenciatura Jurado

Las principales limitaciones del análisis convencional de los potenciales

CAPÍTULO 1: ANÁLISIS CLÁSICO

CAPÍTULO 2: ANÁLISIS GENERAL POR CONDICIONES Y FACTORES

CAPÍTULO 3: ANÁLISIS POR GRUPOS

CAPÍTULO 4: ANÁLISIS POR SUJETO: PREDICCIÓN DE LA VALIDEZ

CAPÍTULO 5: ANÁLISIS MEJOR GRUPO POR CONDICIONES Y

APÉNDICE: MEDICIÓN DEL CAMPO ELÉCTRICO Y MONTAJES

P600: características, eventos desencadenantes e interpretaciones

P600 y gramáticas artificiales

que fue denominado como “intraensayo” porque se basa en la información contenida en

1.2 Materiales y métodos

“tese”, “sele”) y tres “conectores” (conector1: “bapa”, 2: “ducu”, 3: “nili”). La

Frases correctas: “Bapa cane soti ducu pefa”

Frases incorrectas: Violación de categoría: “Bapa fadi roli ducu revu”

Fig. 1. Esquema de formación de las frases. Se muestran ambas estructuras sintácticas y

En la fase de entrenamiento se explicó a los sujetos que verían y escucharían

Periódicamente el software preguntaba si una determinada pseudo palabra había

Fig. 2. Esquema del dispositivo experimental.

Se situó al sujeto en una silla frente al monitor de PC 1 en el que se mostró el

c) Terminología y validación de ensayos

Fig. 3. Segmento de trazado electroencefalográfico típico filtrado con un pasabajos de 30hz. Se

los llamaremos comportamental y fisiológico. El primer tipo comprende los criterios

1.3 Resultados y análisis

Fig. 5. Reconstrucción del potencial craneal “gran promedio” 660ms. tras la

Se puede apreciar aquí, en forma muy visual, las características ya mencionadas

a) Efectos de la violación sintáctica

d) Efectos del aprendizaje

violaciones de sintaxis en lenguajes naturales y artificiales. De esto se dedujo que no se

calculó el mínimo entre la cantidad de ensayos de ambas condiciones

en un análisis intercanal. Donde N can representa la cantidad de canales conservados,

N bines la cantidad de bines en que se dividió la ventana de interés y N estad la cantidad de

donde el símbolo “ ← ” indica asignación y E

entrenamiento. La distribución de vectores resultante quedó centrada en el origen.

Los subíndices “CE” y “IE” indican vectores en la condición “correctas” e “incorrectas”

performance de ensayos correctos (incorrectos) como el cociente entre la cantidad de

donde θ (x) representa la función escalón y se considera θ (0) = 0 .

Perf T = ( Perf CT + Perf IT

c) Condiciones y factores de procesado

2.3 Resultados y análisis

Canales Todos Sin Fp's, O's C's y P's

Referencia Promedio Auricular

Línea de base No quitando Quitando

Tipo análisis Intracanal Intercanal

Estadístico Promedio Desviación Var. norm. Prom. y Desv. Prom. y Var.

Se pueden hacer algunas observaciones respecto a la localización de la

Fig. 7. Cantidad de condiciones en que el discriminador separó exitosamente ambas

3.3 Resultados y análisis

se verá, no es en absoluto relevante) y distintas variantes de preprocesado. En el

4.2 Resultados y análisis

Se puede apreciar que para 8 sujetos el clasificador pudo separar ambas

El coeficiente de correlación obtenido es 0,9394 (p= 0,00053) con lo que la

Esta figura complementa a la fig. 9 mostrando el promedio y la desviación