Escolar Documentos
Profissional Documentos
Cultura Documentos
Guillermo D. Pasqualetti
Diciembre 2010
TEMA: Aprendizaje de reglas gramaticales: un análisis de ensayo único del P600 con
gramáticas artificiales.
LU N°: 142/04
FECHA DE INICIACION:
FECHA DE FINALIZACION:
FECHA DE EXAMEN:
Autor Jurado
Resumen
ÍNDICE
INTRODUCCIÓN GENERAL.....................................................................................6
DISCUSIÓN GENERAL..............................................................................................44
CONCLUSIONES.........................................................................................................48
INTRODUCCIÓN
Objetivos
El objetivo general de la tesis es investigar las bases neurobiológicas del
procesamiento de violaciones sintácticas en gramáticas artificiales. Los propósitos
específicos son: i) predecir la validez gramatical de cierta frase a partir de sólo el
potencial evocado en el ensayo en cuestión, es decir, mediante un análisis de ensayo
único o intraensayo, ii) explorar la influencia de distintos métodos de procesamiento de
los trazados crudos en dicho análisis, y iii) comparar los métodos de análisis clásicos y
de ensayo único.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 9
CAPÍTULO 1
ANÁLISIS CLÁSICO
1.1 Introducción
En el presente capítulo se estudiarán los cambios ocurridos a nivel
neurobiológico durante una tarea de juicio gramatical con una gramática artificial (sin
contenido semántico) en búsqueda del potencial P600 y con el fin de determinar si este
componente podría estar reflejando la participación de mecanismos estadísticos en el
procesamiento de la sintaxis.
Se explicará la gramática artificial (con sus pseudo palabras componentes y
reglas de formación de frases) y la tarea experimental planteada a los sujetos. También
se hablará acerca de dispositivo experimental y el montaje electroencefalográfico
utilizado y se describirá la validación de ensayos y el preprocesamiento de los datos.
Respecto al análisis de los datos se comenzará exponiendo el gran promedio
efectuado a partir de los datos de todos los sujetos, lo que permitió identificar la ventana
de interés (600-900ms. post estimulación). Luego se mostrarán pruebas Anovas que
revelan la existencia de un componente P600 significativamente mayor ante oraciones
incorrectas que ante correctas, y una modulación del mismo por el grado de aprendizaje
de las estructuras sintácticas. Además se estudió la lateralización y región predominante
de este componente.
Con. 2 Bare
Cat. B Cane
Cat. A Ducu Fadi
Con. 1 Pefa
Bare Siru Leda
Cane Soti
Bapa
Fadi Roli
Pefa Revu Cat. C
Leda Nomi Con. 3
Pere Bare
Sele Cane
Nili
Mene Fadi
Tese Pefa
Leda
b) Dispositivo experimental
Para el armado del dispositivo experimental se utilizaron los siguientes
componentes:
-Dos PCs convencionales
-Amplificador de 21 canales Akonic Bio-PC Systems.
-Placa digitalizadora de 256hz.
-Gorro con 19 electrodos y una entrada tierra (mismo fabricante).
-Conexión a tierra mediante jabalina.
Estos fueron dispuestos formando el dispositivo experimental diagramado en la
fig. 2.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 12
los 200 ms. previos al estímulo a los 1500 ms. posteriores al mismo. Además cada
ensayo estuvo sujeto a cierta condición experimental, en este caso “frase correcta” y
“frase incorrecta”.
Se le dio el nombre de artificio a toda anomalía en el trazado
electroencefalográfico. Son producto de actividades no relacionadas directamente con la
tarea tales como movimientos (particularmente los oculares y faciales debido a la
cercanía del rostro a los electrodos) o actividad sensorial, como la audición de un sonido
intenso. Es por esto que se aísla lo más posible al sujeto y se vela por su comodidad.
En la fig. 3 se muestra un segmento del trazado electroencefalográfico de un
sujeto de sexo masculino y 24 años de edad. Se indica en el mismo la señal de
sincronización (momento de estimulación), un artificio (parpadeo), dos actividades
rítmicas normales y la época. Un filtro pasabajos de 30hz fue aplicado sobre el trazado
original para obtener el de la figura.
Previo a todo análisis de los datos se determinaron los ensayos válidos (se
desecharon los otros) y se llevó a cabo un preprocesado de las señales. Existen dos tipos
de criterios independientes que debe satisfacer un ensayo para ser considerado válido,
G. D. Pasqualetti Aprendizaje de reglas gramaticales 14
Fig. 4. Gran promedio para cuatro canales representativos del P600 (en microvolts) vs. tiempo
(en segundos). Las líneas punteadas indican la ventana temporal de interés. Rojo: oraciones
incorrectas, azul: oraciones correctas.
La inspección visual del promedio general indicó una onda positiva para las
oraciones incorrectas en la ventana 600-900 ms. Si bien la positividad era observable en
los canales frontales, se hacía más definida en los centrales y parietales. Por su latencia
y distribución topográfica, el potencial observado resultó análogo al componente P600.
La fig. 5 muestra la reconstrucción, a partir de lo registrado por los electrodos,
del potencial craneal “gran promedio” a los 660ms de presentado el estímulo para
ambas condiciones experimentales. El gráfico fue generado con el programa de
distribución gratuita “Loreta”. El color rojo indica positividad y el azul negatividad; la
imagen superior corresponde a frases incorrectas y la inferior a correctas.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 16
promedio de los 15 canales para las frases correctas y la otra para las incorrectas. Se
efectuó entonces un Anova que arrojó como resultado un índice p=0,038, de donde se
concluyó que violaciones sintácticas se asocian a una positividad mayor que oraciones
correctas.
b) Lateralidad
Para observar efectos de lateralidad se armaron las listas promediando para cada
sujeto los valores de los canales frontales (F), temporales (T), centrales (C) y parietales
(P) de un hemisferio y de ambas condiciones experimentales; esto para ambos
hemisferios por separado. De donde se obtuvieron dos listas de 21 valores, cada una
correspondiendo a un hemisferio. Entonces se realizó un test Anova que arrojó como
resultado que ambas listas de valores diferían significativamente. El índice de la prueba
fue p = 0,008. De esto se concluyó que el potencial evocado está, efectivamente,
lateralizado a izquierda.
c) Región
Para estudiar la distribución topológica del P600 se promediaron, para cada
sujeto, los valores en ambas condiciones experimentales para los canales de tres
regiones por separado: anteriores (F7, F3, Fz, F4, F8), centrales (T3, C3, Cz, C4, T4) y
posteriores (T5, P3, Pz, P4, T6). De esto se obtuvieron 3 listas de 21 valores a las que se
les aplicó una Anova (p=0,01). Se concluyó entonces que el potencial es mayor en los
canales centrales y parietales que en los frontales.
Para estudiar el efecto del nivel de aprendizaje sobre el potencial se dividió a los
sujetos en dos grupos: aquellos que respondieron significativamente mejor que el azar y
aquellos que no. Para cada sujeto de cada grupo se promediaron los valores de todos los
canales centrales y posteriores en ambas condiciones experimentales. Como resultado se
obtuvieron dos conjuntos de valores que un Anova reveló que eran significativamente
distintos (p<0,02).
En la fig. 6 se grafica la distribución topográfica y los posibles generadores de la
onda de diferencia (frases incorrectas - correctas) para ambos grupos en la ventana 600 -
900 ms., para los sujetos que aprendieron (izquierda) y los que no aprendieron
(derecha). El color rojo indica positividad y el azul negatividad.
Fig. 6. Onda de diferencia por grupo: topografía y posibles generadores. El color rojo indica
positividad y el azul negatividad.
Puede notarse que la diferencia es mucho más acentuada en los sujetos que
aprendieron explícitamente la gramática. En el grupo que aprendió se habrían activado
bilateralmente los giros frontales y temporales (superior, medio e inferior), mientras que
en los sujetos que no aprendieron, la activación de estas áreas se limitó al hemisferio
izquierdo. En este último grupo se habrían activado, además, regiones parietales
izquierdas.
1.4 Discusión
En primer lugar se encontró un componente P600 significativo ante la aparición
de oraciones incorrectas en gramáticas artificiales. Además se establecieron algunas
características del potencial: estar lateralizado a izquierda y localizado principalmente
en la zona centro-parietal del cráneo. Los generadores neuronales estimados son
congruentes con estudios previos de resonancia funcional en los que se presentaron
G. D. Pasqualetti Aprendizaje de reglas gramaticales 19
CAPITULO 2
ANÁLISIS GENERAL POR CONDICIONES
2.1 Introducción
Se explicará el análisis intraensayo efectuado sobre los datos de 14 sujetos que
respondieron significativamente mejor que el azar, prueba G (p<0,05), 12 de los cuales
constituyeron el grupo que aprendió en el capítulo anterior.
Se comenzará describiendo el preprocesamiento de los datos (filtrado, selección
de canales, referencia, y remoción (o no) de la línea de base). Luego se explicará el
funcionamiento del clasificador y sus variantes de análisis que, junto con las variantes
en el preprocesamiento, determinan un conjunto de posibles procesamientos o
procesados de los trazados electroencefalográficos. Finalmente se determinarán criterios
para establecer cuándo el clasificador separa los ensayos de determinado sujeto por
condición experimental (frases correctas/incorrectas) con una significancia del 5% y,
tras comprobar que no existe un único procesamiento en que las condiciones de más de
dos sujetos puedan separarse, para determinar qué procesamiento usar para cada
individuo. Además se estudiará la importancia relativa de los posibles valores de cada
una de las variables que determinan un procesado.
2.2 Métodos
a) Preprocesado
El primer paso consistió en filtrar digitalmente la señal para deshacerse del
ruido de línea y posibilitar el análisis por bandas de frecuencia. Para la línea se utilizó
un filtro “notch” de segundo orden con una frecuencia de 50hz. y un ancho de banda de
100/35 hz. a un nivel de -3 dB, y para definir las bandas la función “eegfilt” del paquete
para análisis electroencefalográficos “EEGLAB” de “Matlab”. Los límites y nombres de
la bandas fueron los siguientes: 1-4hz (Delta); 4-8hz (Theta); 8-12hz (Alfa); 12-30hz
(Beta); 30-70hz (Gamma), y un sexto contenía al espectro completo 0-70hz. Además se
agregó un filtro con los mismos límites que el del análisis clásico, 1-20hz, con el fin de
hacer posibles comparaciones.
A continuación se seleccionó un subconjunto de canales para deshacerse de los
poco importantes para el fenómeno bajo estudio y/o propensos a presentar artificios. Un
primer grupo contuvo todos los canales; el segundo los 15 restantes tras desechar los
prefrontales y occipitales; y el tercero los 6 en que se manifiesta más intensamente el
G. D. Pasqualetti Aprendizaje de reglas gramaticales 21
potencial P600 (ver introducción), constituido por los canales centrales (C3, Cz, C4) y
parietales (P3, Pz, P4).
Luego se estableció la referencia. Una posibilidad fue referenciar al promedio,
lo que significa restarle a cada canal la señal obtenida del promedio de todos los
canales. Se quita así la variación común del potencial craneal. La otra referencia
utilizada fue conservar la auricular.
Entonces se llevó a cabo la validación de ensayos siguiendo los mismos criterios
que en el análisis clásico (ver ítem c, sección 1.2): respuestas correctas con menos de 2
segundos de latencia y ausencia de artificios.
Finalmente, tras separar los ensayos por condición experimental, se removió (o
no) la línea de base, restándole a cada canal el promedio de su trazado en los 200ms.
previos a la señal de sincronización en cada ensayo, y se examinó la misma ventana de
interés que en el examen precedente: 600-900 ms. post señal sincronización.
b) Clasificador
Se entrenó un discriminador lineal (Fischer 1936; Duda et al. 2000), cuyas
entradas fueron ciertas características de los trazados electroencefalográficos de cada
ensayo, y sus salidas las respuestas dadas por el participante en cada ocasión. Para ello
se utilizó cierto porcentaje de los ensayos válidos para cada participante. Luego fue
probado con los ensayos restantes, con la finalidad de estimar el desempeño en la
predicción del tipo de oración (correcta/incorrecta) a partir de las mismas características
del electroencefalograma (Lew et al. 2009). Debido a la baja cantidad de ensayos
disponibles se utilizó el método iterativo “bootstrapping” (Efron 1979), que consiste en
redefinir los ensayos de entrenamiento y testeo en cada iteración, con la intención de
mejorar los resultados del clasificador.
En cada iteración, i) se definieron dos subconjuntos del total de ensayos de cada
condición experimental como de entrenamiento y testeo; ii) se calculó un “vector
características” por ensayo; iii) se encontró un hiperplano que separa los “vectores
características” en entrenamiento de ambas condiciones experimentales, y se calculó la
performance del clasificador en el entrenamiento; iv) se calculó la performance en el
test a partir del hiperplano calculado y los ensayos de test. Se aclara a continuación cada
uno de los pasos.
i) El método exige que la cantidad de ensayos correspondientes a oraciones
correctas e incorrectas sea la misma. Para lograr este fin sin desperdiciar información se
G. D. Pasqualetti Aprendizaje de reglas gramaticales 22
1
Este porcentaje no es producto de un análisis teórico sino de la experiencia. Se vio que otros valores o
bien no mejoraban el desempeño del clasificador o lo empeoraban. Entre otras alternativas, se probó usar
como conjunto de entrenamiento todos los ensayos excepto uno, con el que se testeó, los resultados no
fueron satisfactorios.
2
Definida como el cociente entre la desviación estándar y la media.
3
Con esta palabra se quiere significar una adquisición individual del potencial (recuérdese que la
frecuencia de adquisición es de 256hz.).
4
Es importante notar que, en el análisis intercanal, el no definir una cantidad de bines es equivalente a
tener 78 (resultado del producto de la frecuencia de adquisición y la duración de la ventana de interés:
256 hz. x 300 ms.), es decir uno por adquisición.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 23
r r
Perf CT = ∑i θ ( X iCT .W ) / N T (7a)
r r
Perf IT
= ∑i θ (− X iIT .W ) / N T (7b)
Hay, además, ciertos parámetros que son comunes a todas las condiciones de
procesado: la ventana de interés (600-900ms. post estimulación), el porcentaje de
ensayos de entrenamiento (70%) y la cantidad de iteraciones (1000).
Debido a que al tomar referencia promedio la media intercanal se anula, fue
necesario excluir aquellas condiciones de procesado que tuvieran referencia promedio
en un análisis intercanal con estadístico promedio o varianza normalizada. El número de
condiciones previamente mencionado no incluye estas excepciones.
Entonces, producto del análisis anterior, se obtuvo, para cada uno de los 6720
procesamientos, una lista de 1000 valores de performance (uno por iteración) para el
entrenamiento y otra para el test. Y todo esto para cada sujeto.
d) Criterio de significancia
Cuando para un determinado sujeto, en cierta condición de procesado, el
porcentaje de veces en que la performance de test resultó mayor que 0,5 sea mayor o
igual al 95% del total de las pruebas (950/1000), se podrá asegurar que el clasificador
pudo separar exitosamente los ensayos por condición experimental con un grado de
significancia del 5%.
Factor Valores
Filtro (banda) Delta Theta Alfa Beta Gamma 0-70hz. 1-20hz.
25% 30,4% 16,4% 6% 0,6% 12,2% 9,2%
Bines 1 2 3 4 5 6 7 8 9 10
14,6% 9,8% 11,4% 14,4% 8,8% 5,4% 9,6% 8% 8,4% 7,6%
Tabla I. Se muestra, para cada factor, el porcentaje de veces que adoptó cada valor dentro
del conjunto de las 499 condiciones en que el discriminador tuvo éxito con al menos un sujeto.
Por lo tanto fue necesario usar el clasificador en una condición particular por
sujeto. Con el fin de determinar qué procesamiento usar en cada caso se estableció el
criterio siguiente: de entre todos los posibles, se elegirá aquel procesamiento que
maximice la media de las performance de entrenamiento. Esa condición de procesado
será llamada “condición de procesado ganadora”.
Entonces se calculó el porcentaje de performances de test mayores a 0,5 en la
condición de procesado ganadora para los 14 sujetos, encontrándose malos desempeños
para casi todos, lo que parecía implicar una falta de correlación entre entrenamiento y
test. Sin embargo este resultado negativo podía tener otra causa: aquellas condiciones en
que la dimensionalidad del espacio de vectores características sea grande tenderán a
arrojar mayores performances de entrenamiento (debido a que en un espacio de mayor
dimensionalidad se tiene más libertad para elegir el hiperplano divisor),
independientemente de la separabilidad inherente a los datos (propiedad necesaria para
lograr un buen desempeño en el test), lo que da preferencia a las condiciones de alta
dimensionalidad por sobre las otras. Lo que se observó resultó compatible con está
explicación: todas las condiciones ganadoras presentaban 8, 9 o 10 bines y, en el caso
intracanal, una tendencia al uso de todos los canales; maximizando así la dimensión de
los vectores características (ver ecs. 1a, 1b). En el capítulo siguiente se explora una
solución a este problema.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 28
CAPITULO 3
ANÁLISIS POR GRUPOS
3.1 Introducción
El presente capítulo describe la solución adoptada frente al problema surgido al
final del capítulo anterior: al aplicar el criterio según el cual se elige, para cada sujeto, el
procesamiento que maximiza la performance promedio en entrenamiento, los resultados
resultaron muy pobres. La solución adoptada consistió en dividir el espectro de 6720
procesamientos en grupos de condiciones de procesado cuyos vectores característica
tuvieran igual cantidad de elementos o dimensiones, y llevar a cabo el análisis,
siguiendo el criterio descripto, dentro de cada grupo por separado.
3.2 Métodos
Ciertos factores de procesado, como el filtrado o la referencia, no modifican la
dimensionalidad del espacio de vectores características, mientras que otros sí lo hacen.
Entonces se separaron las 6720 condiciones de procesado en conjuntos
isodimensionales (“grupos”) fijando en cada uno los 4 factores que influyen en dicha
dimensionalidad (ver ecs. 1a, 1b): número de bines, cantidad de canales y de
estadísticos y tipo de análisis (intra/intercanal). De esto surgieron 120 grupos, cada uno
compuesto por 84, 56 o 28 condiciones según consideren uno o dos estadísticos en un
análisis intra o intercanal5. Las condiciones dentro de un grupo dado difieren en cuanto
a los demás factores: filtro, referencia, línea de base y estadístico considerado.
5
El tipo de análisis influye indirectamente en la cantidad de condiciones del grupo a través de las
excepciones del caso intercanal que modifican la cantidad de posibles estadísticos y referencias.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 29
Fig. 8. Cantidad de sujetos para los que el clasificador pudo separar ambas condiciones
experimentales vs. número de grupo. La numeración de los grupos es arbitraria. Los 4 dígitos
que acompañan a los seis grupos con más sujetos indican de qué grupo se trata siguiendo la
convención descripta en el cuerpo principal del texto.
Los dígitos que acompañan los 6 grupos con más sujetos indican de qué grupo se
trata siguiendo la siguiente convención: el primer digito señala la cantidad de canales
(1: todos los canales; 2: excluyendo prefrontales y occipitales; 3: canales centrales y
parietales), el segundo el tipo de análisis (1: intracanal; 2: intercanal), el tercero la
cantidad de estadísticos utilizados (1: promedio, desviación estándar o varianza
normalizada; 2: promedio y desviación estándar o promedio y varianza normalizada), y
el cuarto la cantidad de bines.
Se pueden valorar los grupos según la cantidad de sujetos para los que el
discriminador tuvo éxito en la separación de los ensayos de test por condición
experimental. En este sentido el mejor es el “2111”, en que son 8 los sujetos, seguido
del “3112” con 5. Además cabe observar que en los 6 mejores grupos se lleva a cabo un
análisis intracanal y en 5 de ellos no se divide la ventana en bines (lo que es esperable
teniendo en cuenta que con los bines aumenta la dimensionalidad del espacio con las
dificultades que vimos que ello acarrea para elegir un buen test (ver sección 2.3).
Es elocuente el hecho de que el grupo “2111” este compuesto por los
procesamientos más similares al del análisis clásico: al igual que en ese caso se
desechan los canales prefrontales y occipitales, se analiza a nivel intracanal y no se
divide la ventana de interés. La diferencia radica en que ahora se considera, además del
promedio, la desviación estándar y la varianza normalizada (aunque esta última, como
G. D. Pasqualetti Aprendizaje de reglas gramaticales 30
CAPÍTULO 4
ANÁLISIS POR SUJETO: PREDICCIÓN DE LA VALIDEZ GRAMATICAL
4.1 Introducción
El análisis se centrará ahora en el grupo con mayor cantidad de sujetos para los
que el clasificador tuvo éxito en la condición de procesado ganadora, el grupo “2111”.
Se comenzará exponiendo gráficos que muestran el porcentaje de performances de test
mayores a 0,5 para cada sujeto, de donde se verá que en no todos se pudo separar ambas
condiciones experimentales. Entonces se presentarán algunos estudios llevados a cabo
con la finalidad de encontrar diferencias entre los sujetos en que se pudo separar ambas
condiciones experimentales y los que no: se mostrará la correlación entre el porcentaje
de performances de test mayores a 0,5 y la cantidad de ensayos de los sujetos y un
análisis considerando los ensayos con artificios de manera de aumentar la cantidad de
ensayos (a costa de la reintroducción de cierto ruido en la señal). También se enseñará
la correlación entre el porcentaje de performances de test mayores a 0,5 y el porcentaje
de respuestas correctas sobre respondidas, parámetro relacionado con el nivel de
aprendizaje del sujeto.
Fig. 9. Porcentaje de performances de test mayores a 0,5 vs. umbral; cada elemento
corresponde a un sujeto. Las líneas verdes separan los porcentajes para los que el discriminador
tiene éxito de los que no y la negra es la recta y=x.
Fig. 10. Porcentaje de performances de test mayores a 0,5 vs. umbral; cada elemento
corresponde a un sujeto para el que el discriminador tuvo éxito. La recta roja es el ajuste lineal
(en el borde superior izquierdo se encuentra su ecuación) y la línea punteada es la recta y=x.
Fig. 11. Promedio de las performance de test en la condición ganadora junto con las
correspondientes barras de error. Las estrellas rojas indican sujetos cuyo porcentaje de
performance de test resultó mayor o igual al 95%.
Fig. 12. Número de ensayos por sujeto; cruces verdes para sujetos en que el clasificador tuvo
éxito, cruces rojas para los que no.
Puede observarse que 5 de los sujetos para los que no pudo separarse las
condiciones experimentales (sujetos 2, 5, 10, 11 y 13) tienen pocos ensayos mientras
que, por otro lado, para los 4 individuos con mayor cantidad de ensayos (sujetos 1, 8, 9
y 12) el clasificador tuvo éxito. En síntesis, parece haber cierta correlación entre la
cantidad de ensayos y la cantidad de performances de test mayores a 0,5. Una prueba de
correlación lineal entre estas variables arrojó un coeficiente de 0,5967 (p=0,0243). La
fig. 13 ilustra esto. La línea roja es el ajuste lineal y en el borde inferior derecho se
muestra su expresión analítica.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 36
Fig. 13. Porcentaje de performance de test mayores que 0,5 vs. número de ensayos para los 14
sujetos. La línea roja es el ajuste lineal y su ecuación se presenta en el borde inferior derecho.
Fig. 14. Porcentaje de performances de test mayores a 0,5 vs. umbral considerando los ensayos
con artificios; cada elemento corresponde a un sujeto. Las líneas verdes separan los porcentajes
para los que el discriminador tiene éxito de los que no y la negra es la recta y=x.
Fig. 15. Porcentaje de performances de test mayores a 0,5 vs. porcentaje de respuestas correctas
sobre respondidas. La recta roja es producto de un ajuste lineal y en el borde inferior derecho se
muestra su ecuación.
CAPÍTULO 5
ANÁLISIS MEJOR GRUPO POR CONDICIONES Y FACTORES
5.1 Introducción
Se continuará aquí con el análisis del grupo “2111”, centrándose ahora en las
condiciones y factores que lo componen. Se comenzará mostrando el porcentaje de
condiciones de procesado de entrenamiento y test para las que el discriminador tuvo
éxito. Luego se expondrán análisis para determinar los valores más relevantes de cada
factor de procesado y apreciar la importancia relativa de las distintas bandas de
frecuencia, de ambas referencias, de la remoción (o no) de la línea de base y del
estadístico utilizado. Esto permitirá proseguir la comparación con el procesamiento
llevado a cabo en el análisis clásico.
Fig. 16. Porcentaje de condiciones de procesado (pertenecientes al grupo) para las que el
clasificador pudo separar ambas condiciones experimentales en el entrenamiento (en rojo) y en
el test (en verde) para cada sujeto.
puede observarse que cada sujeto sólo presenta unas pocas condiciones para las que el
clasificador pudo separar las condiciones experimentales a partir de los ensayos de test.
Análogamente a lo realizado en el capítulo 2 (en esa ocasión con la totalidad de
las condiciones de procesado), se efectuó un análisis con el fin de determinar la
importancia relativa de los posibles valores que puede adoptar cada factor de procesado,
esta vez sobre las condiciones pertenecientes al grupo “2111” con al menos un sujeto
para el que el clasificador tuvo éxito. En este caso son 20 los procesamientos que
cumplen esto, es decir el 23,8% de un total de 84. Al comparar este valor con el 7,4%
sobre el total de 6720 procesamientos cuando no se dividía en grupos, puede verse que
el porcentaje de condiciones significativas es considerablemente más elevado en el
grupo “2111” (alrededor del triple). Los resultados del análisis por factor se resumen en
la tabla siguiente.
Factor Valores
Filtro (banda) Delta Theta Alfa Beta Gamma 0-70hz. 1-20hz.
25% 20% 15% 10% 5% 5% 20%
Tabla II. Se muestra, para cada factor, el porcentaje de veces que adoptó cada valor dentro
del conjunto de las 20 condiciones del grupo en que el discriminador tuvo éxito con al menos un
sujeto.
Fig. 17. Porcentaje de performances de test mayores que 0,5 para ambos subgrupos (solo
promedio: cruces rojas, solo desviación estándar: puntos azules)
G. D. Pasqualetti Aprendizaje de reglas gramaticales 42
Puede observarse que los resultados se complementan mucho para los 8 sujetos,
pudiendo separarse ambas condiciones experimentales en sólo uno u otro de los
subgrupos, a excepción del sujeto 8, cuyos ensayos pueden ser separados en ambos, y
del 14 que no pueden serlo en ninguno6. Esto indica que la información relevante no
puede extraerse de uno u otro estadístico sino que ambos son necesarios para este tipo
de análisis.
Luego se separó el grupo “2111” en cuatro subgrupos que diferían en la
referencia considerada y en cuanto a la remoción de la línea de base. En el caso en que
se dejo la referencia auricular y se quito la línea de base el clasificador dejo de separar
las condiciones de 7 sujetos; en el que se conservó la referencia auricular pero no se
quitó la línea de base, de 6 sujetos; cuando se estableció la referencia promedio y se
removió la línea de base dejo de tener éxito para 3 sujetos; y cuando se estableció
referencia promedio y no se removió la línea de base para sólo 1 sujeto. Esto indica que
la referencia más importante es la promedio y que es preferible no quitar la línea de
base. Sin embargo, si se restringen los posibles análisis en este sentido, en el mejor de
los casos se arruina al menos un sujeto.
Finalmente se desglosó el grupo en tres que diferían en cuanto a las bandas
consideradas. Uno excluía los filtros que cubren varias bandas (0-70hz. y 1-20hz.), otro
las bandas Beta y Gamma y un tercero las bandas Delta, Theta y Alfa. En el primer caso
no se observaron cambios en la cantidad de sujetos para los que el clasificador pudo
separar ambas condiciones experimentales, en el segundo dejaron de poder separarse los
ensayos de 1 sujeto y en el tercero los de 3. De esto se concluye que las bandas Delta,
Theta y Alfa resultan imprescindibles, las Beta y Gamma tienen una importancia menor
y los filtros cuyo espectro resultante contiene varias o todas las bandas son
prescindibles.
En suma, de los 6720 procesamientos llevados a cabo, podemos decir que i)
aquellos que incluyen como estadístico al promedio y la desviación estándar son
imprescindibles mientras que considerar la varianza normalizada es innecesario; ii) los
que toman como referencia al promedio y no remueven la línea de base son
imprescindibles mientras que la referencia auricular y la remoción de la línea de base
tienen una importancia marcadamente menor; iii) es necesario incluir condiciones de
procesado en que se divida en bandas de frecuencias, de las cuales son fundamentales
6
Esto último se debe a que la performance del clasificador es una variable estocástica debido a la
naturaleza del bootstrapping y la fig. 19 fue construida a partir de una nueva corrida.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 43
las bandas Delta, Theta y Alfa y tienen una importancia mucho menor Beta y Gamma,
además los filtros que contienen frecuencias correspondientes a varias bandas son
prescindibles.
Al comparar estos resultados con el análisis clásico se observaron las siguientes
similitudes y diferencias: i) a diferencia de antes, no basta con considerar sólo el
promedio sino que es necesario tomar en cuenta la desviación estándar para obtener
resultados satisfactorios; ii) la referencia más relevante resulta ser la misma previamente
utilizada y lo mismo ocurre con la remoción de la línea de base; iii) ahora es necesario
llevar a cabo el análisis separando por bandas de frecuencia.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 44
DISCUSIÓN
desempeño del clasificador mejoró mucho aunque sin llegar a ser exitoso. En suma, de
los 6 sujetos para los que el discriminador no tuvo éxito, en 3 al parecer el motivo
radicó en la escasez de ensayos, en 1 a que durante la experiencia no contestó, por
equivocación, en muchas ocasiones (sujeto 13) y quedaron 2 sin explicación evidente
(sujetos 5 y 7). Para el primero de ellos el porcentaje de performances de test mayores
que 0,5 fue menor a 95% en las 6720 condiciones, mientras que para el segundo fue
mayor o igual a ese valor en alrededor de 50 casos (ver fig. 7, sección 2.3). Entonces es
posible que el fracaso del discriminador con el sujeto 5 se deba a que su EEG sea
excesivamente ruidoso, mientras que en el otro sujeto la causa puede ser la restricción al
grupo “2111”; quizá en algún otro grupo su condición ganadora coincida con alguna de
estas 50 condiciones, de manera que el clasificador tenga éxito también con él. El
número de ensayos fue sin duda un factor muy importante para el desempeño del
discriminador. El umbral crítico, en esta experiencia, estuvo en torno a los 25 ensayos.
De esto se desprende que al idear experiencias con la intención de llevar a cabo este tipo
de análisis es conveniente generar una buena cantidad de ensayos y al validarlos es
aconsejable utilizar métodos lo más laxos posible.
Por otro lado, se estudió la influencia del grado de aprendizaje de la tarea sobre
el desempeño del clasificador; una prueba de correlación lineal entre el porcentaje de
performances de test mayores que 0,5 y el porcentaje de respuestas correctas sobre
respondidas arrojó un índice de correlación de -0,0820 (p=0,7805) por lo que no pudo
identificarse una modulación del desempeño del clasificador por el grado de aprendizaje
de los sujetos, a diferencia de lo que se encontró en el análisis clásico (ver ítem d,
sección 1.3). Sin embargo en esa ocasión se comparó un grupo de sujetos que
respondieron significativamente peor que el azar con otro que lo hizo mejor que el azar,
mientras que aquí se buscó una modulación más fina dentro del grupo de sujetos que
aprendieron.
Respecto a los factores de procesado relevantes se verificó que i) aquellos que
incluyen como estadístico al promedio y la desviación estándar son imprescindibles
mientras que considerar la varianza normalizada es innecesario; ii) los que toman como
referencia al promedio y no remueven la línea de base son imprescindibles mientras que
la referencia auricular y la remoción de la línea de base tienen una importancia
marcadamente menor; iii) es necesario incluir condiciones de procesado en que se
divida en bandas de frecuencias, de las cuales son fundamentales las Delta, Theta y Alfa
G. D. Pasqualetti Aprendizaje de reglas gramaticales 47
y tienen una importancia mucho menor Beta y Gamma, además los filtros que contienen
frecuencias correspondientes a varias bandas son prescindibles.
Al comparar estos resultados con el análisis clásico se observaron las siguientes
similitudes y diferencias: i) a diferencia de antes, no basta con considerar sólo el
promedio sino que es necesario tomar en cuenta la desviación estándar para obtener
resultados satisfactorios; ii) la referencia más relevante resulta ser la misma previamente
utilizada y lo mismo ocurre con la remoción de la línea de base; iii) ahora es necesario
llevar a cabo el análisis separando por bandas de frecuencia.
Probablemente sería útil hallar un único estadístico que condense la información
de la desviación estándar y la media. Ello se intentó mediante la varianza normalizada,
aunque sin éxito. Esta posibilidad queda pendiente para futuras investigaciones. Otra
mejora al presente análisis podría consistir en tomar una ventana de interés variable por
sujeto, ya que nada asegura que el componente P600 tenga la misma latencia en
distintos individuos.
En síntesis, para 8 sujetos se logró identificar ciertas características de la
información electrofisiológica con las que predecir la condición experimental de cada
ensayo. Estas características no fueron las mismas en los ocho casos, e incluso difirieron
bastante (por ejemplo en algunos se trató del promedio y en otros de la desviación
estándar), lo que sugiere que pudiesen existir diferentes formas de procesamiento de la
información en el cerebro. Esto podría estar relacionado con distintos “estilos
cognitivos”, lo cual merecería ulterior investigación.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 48
CONCLUSIONES
A) Medición
Campo Cercano
- Perpendicular al generador: misma línea equipotencial, menor sensibilidad.
- Paralelo al mismo: máximo gradiente, mayor sensibilidad.
Máxima diferencia entre perpendicular y paralelo.
Campo Lejano
- Perpendicular al generador: misma línea equipotencial, menor sensibilidad.
- Paralelo al mismo: máximo gradiente, mayor sensibilidad.
Mínima diferencia entre perpendicular y paralelo.
Dicho esto, y teniendo en cuenta que cada canal del preamplificador diferencial
amplifica solo la diferencia entre la señal recibida por dos electrodos, resulta fácil
entender que se procure alejarse lo más posible de fuentes de ruido7 -tales como
monitores, celulares, etc.- y acercarse lo más posible a los generadores que se pretenden
medir. Además en el caso de que el ruido sea persistente puede probarse cambiar la
7
Como la separación entre electrodos es de 3 o 4cm. se recomienda una distancia de 1 a 2m. de la fuente
de ruido.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 50
orientación del sujeto de manera que los electrodos queden sobre las equipotenciales de
la señal indeseada.
B) Montajes y localización
Los montajes son las diferentes maneras en que pueden colocarse los electrodos
sobre el cráneo. Recordemos que la idea siempre es obtener información de la actividad
eléctrica cerebral por lo menos en dos direcciones para poder localizar a los distintos
generadores. Afortunadamente la sociedad de neurofisiología estableció las ubicaciones
y los nombres de cada electrodo, el sistema adoptado más frecuentemente es el “sistema
10/20” que se muestra en la figura A1, a continuación
BIBLIOGRAFÍA
Duda, R. O.; Hart, P. E.; Stork, D. H. (2000). Pattern Classification (2nd ed.). Wiley
Interscience.
Efron, B. (1979). Bootstrap Methods: another look at the jackknife. The Annals of Statistics 7,
1-26.
Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems. Annals of
Eugenics 7, 179-188.
Friederici, A.D. (1995). The time course of syntactic activation during language processing: A
model based on neuropsychological and neurophysiological data. Brain and Language, 50,
259-281.
Friederici, A.D.; Steinhauer, K.; Pfeifer, E. (2002). Brain signatures of artificial language
processing: Evidence challenging the critical period hypothesis. Proceedings of the National
Academy of Sciences, 99, 529-534.
Gunter, T.C.; Stowe, L.A.; Mulder, G. (1997). When syntax meets semantics. Psychophysiology
34, 660–676.
Hagoort, P.; Brown, C. M.; Groothusen, J.; (1993). The Syntactic Positive Shift (SPS) as an
ERP-measure of syntactic processing. Language and Cognitive Processes 8, 439-483.
Hahne, A.; Friederici, A. D. (1999). Electrophysiological evidence for two steps in syntactic
analysis. Early automatic and late controlled processes. Journal of cognitive neuroscience 11
(2), 194-205.
Kaan, E.; Harris, A.; Gibson, E.; Holcomb, P. The P600 as an index of syntactic integration
difficulty, Language and Cognitive Processes 15 (2): 159–201.
Lelekov, T.; Dominey, P.F.; Garcia-Larrea, L. (2000). Dissociable ERP profiles for processing
rules vs instances in a cognitive sequencing task. Neuroreport. 11(5):1129-32.
Lew, S.; Gutnisky, D.; Dragoi, V. (2009). Decoding the visual working memory in primary
visual cortex. 39th annual meeting of the Society for Neuroscience. Chicago, Illinois, EEUU.
Niedeggen, M.; Roesler, F.; Jost, K. (1999). Processing of incongruous mental calculation
problems: Evidence for an arithmetic N400 effect. Psychophysiology, 36,307-324.
Núñez-Peña, M.I.; Honrubia-Serrano, M.L. (2004). P600 related to rule violation in an
arithmetic task. Cognitive Brain Research, 18, 130-141.
Osterhout, L.; Holcomb, P. J. (1992). Event-related brain potentials elicited by syntactic
anomaly. Journal of Memory and Language 31 (6), 785-806.
Osterhout, L.; Holcomb, P. J.; Swinney, D. A. (1994). Brain potentials elicited by garden-path
sentences: Evidence of the application of verb information during parsing. Journal of
Experimental Psychology: Learning, Memory, and Cognition 20 (4), 786-803.
G. D. Pasqualetti Aprendizaje de reglas gramaticales 53
Tabullo, A.; Sevilla, Y.; Pasqualetti, G.; Vernis, S.; Segura, E.; Yorio, A.; Zanutto, B. S.;
Wainselboim, A. J. Expectancy modulates a Late Positive ERP in an artificial grammar task.
Brain Research (en revisión).
Tabullo, A.; Sevilla, Y.; Pasqualetti, G.; Yorio, A.; Zanutto, B. S.; Wainselboim, A. J. A P600
component in an artificial grammar without semantics: an EEG study of structural violation
type. 29th International Congress of Clinical Neurophysiology. 28 de Octubre al 1 de
Noviembre. Kobe, Japón. Póster.