Você está na página 1de 19

Universidad Nacional Autnoma de Mxico

Facultad de Filosofa y Letras

Anlisis estilomtrico comparativo como mtodo establecer relaciones de autora

Alejandro Ramrez Enrquez Lingstica forense 19/III/2013

Introduccin 1

Aunque los estudiosos de la teora literaria difieren en la definicin de lo que es el estilo, la mayora concuerda en que son las cualidades con las que cuentan los textos (en el sentido ms amplio posible, haciendo hincapi en la literalidad y la oralidad del mismo): temticas, organizacin del texto, preferencia por cierto tipo de conectores lgicos, el uso de la cantidad y tipo de figuras retricas, etc.; cuyas variaciones pueden ser conscientes e inconscientes. Tomando en cuenta lo anterior, la teora literaria desde un punto de vista estructuralista, dentro de la rama de la estilstica, considera que se pueden establecer relaciones estadsticas para la definicin puntual y cuantitativa del estilo de un autor, creando as la estilometra. La estilometra, por medio de estas relaciones, cree posible el poder establecer parmetros de comparacin entre distintos autores, para, entre otras cosas, conseguir establecer similitudes congruentes para determinar la autora de ciertos textos y corroborar la de otros en ciertos casos. Este enfoque es usado por la lingstica forense como prueba en casos legales. Por medio de las humanidades digitales, se han creado diversos programas para poder establecer y realizar el trabajo estilomtrico con mayor agilidad y precisin. As es como surge Signature. El objetivo de este trabajo es proporcionar criterios para determinar la autora de un autor desconocido, analizando y comparando tanto visual como matemticamente la informacin proporcionada por el programa sobre otros tres autores distintos. Para hacer ms rpida la medicin, manejar el menor nmero de cifras significativas. Tambin he de mencionar que decid hacer todas las mediciones tomando solamente los porcentajes de frecuencias, ya que considero que da una visin ms clara de las diferencias que estoy considerando. 2

Los parmetros que medir con Signature son los siguientes: Longitud de palabra por caracteres. Longitud de oraciones por palabra. Longitud de oraciones por cantidad de oraciones. Cantidad de puntuacin. Para este ltimo, he concluido que por el tipo de texto la medicin de ciertos signos de puntuacin es completamente innecesaria, por lo que me limitar a hacerlo con punto, punto y coma, coma, dos puntos y signo de interrogacin. Deteccin de similitudes para establecer vnculos de autora El programa nos proporciona cuatro autores conocidos y uno desconocido, el cual por economa del lenguaje llamar ignoto. El texto que trabajaremos es The Federalist. Como podemos ver en la imagen de la uno a la cuatro, las curvas lanzadas por el programa resultan ser muy similares para descartar a simple vista las que podran o no ser aproximativas para la determinacin de similitudes estilsticas, por lo que lo que proseguir a realizar ser la confrontacin de las grficas de autor ignoto contra cada uno de los autores para verificar primero visualmente las diferencias y as determinar en qu casos conviene hacer un anlisis matemtico puntual. Slo para especificarlo, en la imagen nmero tres (longitud de oracin), al contrario del resto, la diferencia de una con el resto es considerable por lo que considero tambin complicado trabajar con este dato, empero, lo usar en trminos de que sea til para el fin que busco.

Imagen 1. Grfica de la longitud de palabra

Imagen 2. Grfica de la longitud de oraciones

Imagen 3. Grafica de la longitud de prrafos

Imagen 4. Grfica de la puntuacin

Comenzando con la confrontacin, visualmente Hamilton con nuestro ignoto presentan una gran similitud entre ambos, por lo que es considerable realizar el anlisis de ciertos datos matemticos para poder confrontarlo con otro que cuente con el mismo grado de similitud visual. Considerando el primer factor mostrado en la imagen nmero uno, podemos ver como ambos autores utilizan casi con la misma frecuencia las palabras compuestas por un rango de dos a cuatro caracteres, empero muy probablemente estas palabras son nexos funcionales, lo que no nos dice mucho estilsticamente hablando, por lo que sera conveniente verificar los que usa. La diferencia porcentual que encontramos son las siguientes: Dos caracteres: 0.9% Tres caracteres: 0.2% Cuatro caracteres: 0.1% Cinco caracteres: 0.29% Seis caracteres: 0.4% Siete caracteres: 0.24%

Imagen 5. Ignoto vs. Hamilton: longitud de palabra Como mencion prrafos antes la disparidad en el criterio de longitud de oracin es considerablemente grande; sin embargo, existen algunos puntos mximos en los que las curvas son muy similares. Analizando matemticamente los datos de esos segmentos encontramos lo que las diferencias porcentuales son stas: Oraciones de una palabra: 0.23% Oraciones de dos palabras: 0.14% Oraciones de tres palabras: 0.04%

Imagen 6: Ignoto vs. Hamilton: longitud de oracin En lo que refiere a la longitud de prrafo, que se muestra en la imagen nmero siete, podemos notar como la concentracin de la actividad de focaliza en dos segmentos de grfica: el que contiene prrafos de una a tres oraciones y el segundo que va desde cuarenta y ocho a cincuenta oraciones. Aunque existe este segundo foco de actividad, el que predomina es el primer segmento que mencione. Esto me hace creer, sin leer el escrito, que el texto contiene muchas sentencias. Las diferencias porcentuales que encentr son las siguientes:

Imagen 7. Ignoto vs. Hamilton: longitud de prrafo

Imagen 8. Ignoto vs. Hamilton: cantidad de puntuacin

10

Imagen 9. Ignoto vs. Hammad: longitud de palabra

11

Imagen 10. Ignoto vs. Hammad: tamao de oracin.

12

Imagen 11. Ignoto vs. Hammad: longitud de prrafo.

Imagen 12. Ignoto vs. Hammad: cantidad de puntuacin

13

Imagen 13. Ignoto vs. Jay: longitud de palabra

14

Imagen 14. Ignoto vs Jay: longitud de oracin

Imagen 15. Ignoto vs Jay: longitud de prrafo.

15

Imagen 16. Ignoto vs. Jay: cantidad de puntuacin

16

Imagen 17. Ignoto vs. Madison: longitud de palabra

Imagen 18. Ignoto vs. Madison: Longitud de oracin

17

Imagen 19. Ignoto vs. Madison: longitud de oracin

18

Imagen 20. Ignoto vs. Madison: cantidad de puntuacin

19

Você também pode gostar