Você está na página 1de 3

INSTITUTO TECNOLGICO SUPERIOR DE LERDO

Ensayo de FORMATOS DE ARCHIVOS DE SECUENCIAS

ALUMNA Karla Daniela Romo Garca Grupo: 4B Carrera: Ingeniera en Informtica Materia: ORGANIZACIN ADMINISTRACIN DE DATOS Titular de la materia: Ricardo Bustamante Gonzlez.

Cd. Lerdo, Durango. 10 de Febrero 2012

INTRODUCCIN
En base a los tipos de archivos nos dice que hay dos tipos los ASCII que donde se asigna un valor numrico a cada carcter con lo que se pueden representar los documentos llamados, de texto plano es decir, los que son legibles para nosotros los seres humanos. Y los binarios vienen siendo todos los que conocemos como por ejemplo las imgenes, videos, ejecutables, comprimidos, procesados etc... En lo que es dentro de los archivos ASCII de uso comn por los programas de bioinformtica se encuentran los formatos de archivos de secuencias o archivos de secuencias y se caracterizan por tener distintos formatos y hacen posible su reconocimiento por parte de los programas de manipulacin y anlisis de secuencias.

DESARROLLO
FORMATOS DE ARCHIVOS DE SECUENCIAS
Algunos de los formatos de archivos de secuencias son los siguientes: FORMATO PHYLIP: Se utiliza frecuentemente como formato de entrada de diferentes programas; la primera lnea de este archivo debe de contener el nmero de especies o secuencias al analizarla segunda el nmero de caracteres (nucletidos o aminocidos) separados por espacios en blanco., luego se debe de colocar el nombre o identificador de cada especie o secuencias despus debe de colocarse la secuencia en si o sea los caracteres; en cdigo de una letra. Las secuencias pueden ser colocadas en columnas de diez caracteres para poder facilitar la lectura de estas columnas, tambin pueden colocarse lneas en blanco como separadora entre el primero y el segundo grupo de secuencias. Existe una forma alternativa en estos archivos, que se conoce como secuencial, en la que todos los datos de la primera especie son presentados y enseguida los de la segunda especie y as sucesivamente. GENBANK: su caracterstica principal es que proporciona al usuario informacin bastante completa sobre la secuencia.es utilizado para los reportes de secuencias tanto de nucletidos como de aminocidos que ya se encuentran es este formato. EMBL (EUROPEAN MOLECULAR BIOLOGY LABORATORY): los archivos en este formato son reportes generados por la base de datos de secuencias de nucletidos y de protenas ya que son respaldadas por el EMBL.en este formato tambin pueden ser utilizados por los programas GCG como en los archivos en formato GenBank.pero antes de que otra cosa pase su formato deber de ser cambiado al utilizarlo por este paquete.

PIR (Protein Idntification Resource): con este es con el que son generados los archivos provenientes de la base de datos PIR. FASTA: este es uno de los ms utilizados en la actualidad, este puede incluir una o ms secuencias lineales de nucletidos o aminocidos no alineadas. CLUSTAL: este cuenta con principales caractersticas como tanto nucletidos como aminocidos son representados por el cdigo de una letra; los gaps son indicados como un simple guion y hasta el final de las secuencias alineadas, pueden aparecer una especie de secuencia consenso con signo como,*,:y. Es uno de los ms utilizados por los programas de anlisis de secuencias.

MSF:este se utiliza para dos o ms secuencias alineadas, donde el punto representa un gap, los nucletidos aminocidos son representados en su cdigos de una letra y su secuencia es escrita en columna de diez letras cada una. MSF del GCG: Para poder utilizar como archivo de introduccin de datos uno con este formato, las siguientes caractersticas requieren ser especificadas: tipo de archivo, comienzo de la seccin correspondiente a la secuencia, comienzo de secuencia. RSF (Rich Squence File) este es utilizado por algunos programas del GCG y permite introducir una o ms secuencias para llevar a cabo un anlisis, y algunas de sus caractersticas son especificar el tipo de archivo, indicar el inicio de la seccin donde se da toda la informacin y los datos de las secuencias, escribir la secuencia y sus atributos o la informacin que se desee colocar sobre ella encerrado esta seccin del archivo entre llaves.

CONCLUSIONES:
Como nos dimos cuenta en los archivos de secuencias hay distintas caractersticas que liga un archivo con otro si uno de ellos le falta algo el otro no se puede utilizar o no funciona como debe respecto a la base de datos, las lneas de estos archivos deben de llevar un buen alineamiento una buena estructura para no cometer errores de programa y analizar de manera correcta las secuencias.

BIBLIOGRAFIAS:
Guzmn Vega Miguel/Apuntes complementarios de computacin/Tipos de archivos y archivos de secuencias/www.hipertext.info/documentos/archivos.htm Valderrama Jos/2002/informacin tecnolgica/ISSN0716-8756/paginas 90-93

Você também pode gostar