Indice
1.
Historia de la bioinformática
2. Relación entre la
biología y la Informática
3. ¿Qué es
bioinformática?
4. Biochips
5. Genómica
funcional
6.
Bibliografía
1. Historia de la
bioinformática
No se puede mirar la historia de la
bioinformática sin describir inicialmente la historia de
la biología.
En realidad son los biólogos y los bioquímicos
quienes hacen su primer acercamiento a la tecnología
computacional como elemento fundamental para su trabajo
diario.
La biocomputación ha sido la base para ayudar en las
grandes investigaciones
sobre la vida; el diagnóstico genético por ejemplo
tiene mucha influencia en la vida de todas las personas pero la
mayoría de la gente no está enterada de ello.
La tecnología proporciona un elemento
teórico y proporciona las herramientas
prácticas, para que los científicos puedan explorar
las proteínas
y el DNA. Esas son las moléculas grandes que consisten en
un encadenamiento de residuos más pequeños llamados
los nucleótidos o los aminoácidos, respectivamente.
Son bloques de edificio de la naturaleza, pero
estos bloques de edificio no se utilizan exactamente como los
ladrillos, la función de
la molécula final depende fuertemente del orden de estos
bloques. La estructura
(tridimensional) 3D de una proteína depende de la
secuencia individual de estos residuos numerados. El orden de
aminoácidos de una proteína dada se deriva del DNA
correspondiente. Este pedazo de DNA consiste en una secuencia
ordenada de nucleótidos.
Durante los últimos 20 años se ha
determinado que muchas proteínas
de diverso origen con una función
similar, también tienen secuencias similares de los
aminoácidos. Así, existen las secuencias
correspondientes del DNA que son similares aunque la
proteína bajo análisis ocurre en diversas especies tales
como ratones y seres humanos. Así pues, se han buscado
diferencias y semejanzas en el nivel del DNA entre un
ratón y un ser humano para muchas secuencias
similares.
Desde el principio de los años 90, muchos
laboratorios han estado
analizando el genoma completo de varias especies tales como
bacterias,
levaduras, ratones y seres humanos. Durante estos esfuerzos de
colaboración, se han generado cantidades enormes de
datos los
cuales se recogen y se almacenan en grandes bases de datos,
la mayoría de las cuales son publicadas y accesibles.
Además de recopilar todos estos datos, es
necesario comparar estas secuencias de nucleótidos o de
aminoácidos a las semejanzas y a las diferencias de cada
hallazgo. Puesto que no es muy conveniente comparar las
secuencias de varios (cientos) nucleótidos o
aminoácidos de manera manual, varias
técnicas de cómputo fueron
desarrolladas para solucionar este problema. Además,
éstos tienen menos errores que un acercamiento de manera
manual. El uso
de técnicas de cómputo para analizar
datos biológicos se refiere como Biocomputing o
Biocomputación.
Con el incremento en complejidad y capacidad tanto de las
computadoras
como de las técnicas de investigación, se necesitan "puentes"
humanos que puedan entender ambas disciplinas y sean capaces de
comunicarse con los expertos de los dos campos.
Históricamente, el uso de los ordenadores para resolver
cuestiones biológicas comenzó con el desarrollo de
algoritmos y
su aplicación en el entendimiento de las interacciones de
los procesos
biológicos y las relaciones filogenéticas entre
diversos organismos. El incremento exponencial en la cantidad de
secuencias disponibles, así como la complejidad de las
técnicas que emplean los ordenadores para la
adquisición y análisis de datos, han servido para la
expansión de la bioinformática.
2. Relación entre
la biología y
la Informática
Se debe distinguir entre tres acepciones en las que se
unen la biología y la informática, pero con objetivos y
metodologías bien diferenciadas:
Bioinformática o Biología Molecular Computacional:
investigación y desarrollo de
la infraestructura y sistemas de
información y comunicaciones
que requiere la biología molecular y la genética
(Redes y bases de datos
para el genoma, microarrays, …). (Informática aplicada a la biología
molecular y la genética)
Biología Computacional: computación que se aplica al entendimiento
de cuestiones biológicas básicas, no necesariamente
en el nivel molecular, mediante la modelización y simulación. (ecosistemas,
modelos
fisiológicos). (Informática y matemáticas aplicadas a la
biología)
Biocomputación: desarrollo y utilización de
sistemas
computacionales basados en modelos y
materiales
biológicos. (Biochips, biosensores, computación basada en ADN, redes de neuronas, algoritmos
genéticos). (Biología aplicada a la
computación).
Básicamente, los sistemas
informáticos que se emplean en este campo son:
- Bases de datos
Software para
visualización
Programas
para control de
reactivos, geles y otros materiales
Generación y ensamblaje de secuencias
Programas
para análisis de secuencias
Programas para predicción de estructura
de proteínas
Paquetes de integración y ensamblaje de mapas
genéticos
Software para
clasificación y comparación
Técnicas de Inteligencia
Artificial
Gestión de datos
Bases de datos locales o accesibles mediante redes de comunicaciones.
Literatura
médica y científica unida a las secuencias.
Distribución de datos
Redes de comunicaciones
Aplicaciones
Gestión de datos en el laboratorio
Automatización de experimentos
Ensamblaje de secuencias contiguas
Predicción de dominios funcionales en secuencias
génicas
Alineación de secuencias
Búsquedas en las bases de datos de estructuras
Predicción de genes
Predicción de la estructura de proteínas
Evolución molecular. Árboles filogenéticos
Información Científica
Documentos de
difusión y apoyo a la Bioinformática
Bioinformática es una disciplina
científica emergente que utiliza tecnología
de la información para organizar, analizar y
distribuir información biológica con la
finalidad de responder preguntas complejas en biología.
Bioinformática es un área de investigación
multidisciplinaria, la cual puede ser ampliamente definida como
la interfase entre dos ciencias:
Biología y Computación y esta impulsada por la
incógnita del genoma humano y la promesa de una nueva era
en la cual la investigación genómica puede ayudar
dramáticamente a mejorar la condición y calidad de
vida humana.
Avances en la detección y tratamiento de enfermedades y la producción de alimentos
genéticamente modificados son entre otros ejemplos de los
beneficios mencionados más frecuentemente. Involucra la
solución de problemas
complejos usando herramientas
de sistemas y computación. También incluye la
colección, organización, almacenamiento y
recuperación de la información biológica que
se encuentra en base de
datos.
Según la definición del Centro Nacional
para la Información Biotecnológica "National Center
for Biotechnology Information" (NCBI por sus siglas en Inglés,
2001):
"Bioinformática es un campo de la ciencia en
el cual confluyen varias disciplinas tales como: biología,
computación y tecnología
de la información. El fin último de este campo
es facilitar el descubrimiento de nuevas ideas biológicas
así como crear perspectivas globales a partir de las
cuales se puedan discernir principios
unificadores en biología. Al comienzo de la "revolución
genómica", el concepto de
bioinformática se refería sólo a la
creación y mantenimiento
de base de datos
donde se almacena información biológica, tales como
secuencias de nucleótidos y aminoácidos. El
desarrollo de este tipo de base de datos no solamente significaba
el diseño
de la misma sino también el desarrollo de interfaces
complejas donde los investigadores pudieran acceder los datos
existentes y suministrar o revisar datos
Luego toda esa información debía ser
combinada para formar una idea lógica
de las actividades celulares normales, de tal manera que los
investigadores pudieran estudiar cómo estas actividades se
veían alteradas en estados de una enfermedad. De
allí viene el surgimiento del campo de la
bioinformática y ahora el campo más popular es el
análisis e interpretación de varios tipos de datos,
incluyendo secuencias de nucleótidos y aminoácidos,
dominios de proteínas y estructura de
proteínas.
El proceso de
analizar e interpretar los datos es conocido como
biocomputación. Dentro de la bioinformática y la
biocomputación existen otras sub-disciplinas
importantes:
El desarrollo e implementación de herramientas que
permitan el acceso, uso y manejo de varios tipos de
información
El desarrollo de nuevos algoritmos (fórmulas matemáticas) y estadísticos con los
cuales se pueda relacionar partes de un conjunto enorme de datos,
como por ejemplo métodos
para localizar un gen dentro de una secuencia, predecir
estructura o función de proteínas y poder agrupar
secuencias de proteínas en familias
relacionadas."
La Medicina
molecular y la Biotecnología constituyen dos áreas
prioritarias científico tecnológicas como
desarrollo e Innovación Tecnológica. El
desarrollo en ambas áreas están estrechamente
relacionadas. En ambas áreas se pretende potenciar la
investigación genómica y postgenómica
así como de la bioinformática, herramienta
imprescindible para el desarrollo de estasDebido al
extraordinario avance de la genética molecular y la
genómica, la Medicina
Molecular se constituye como arma estratégica del
bienestar social del futuro inmediato. Se pretende potenciar la
aplicación de las nuevas
tecnologías y de los avances genéticos para el
beneficio de la salud. Dentro de las
actividades financiables, existen acciones
estratégicas, de infraestructura, centros de competencia y
grandes instalaciones científicas. En esta área, la
dotación de infraestructura se plasmará en la
creación y dotación de unidades de referencia
tecnológica y centros de suministro común, como
Centros de Bioinformática, que cubran las necesidades de
la investigación en Medicina Molecular. En cuanto a
centros de competencia, se
crearán centros de investigación de excelencia en
hospitales en los que se acercará la investigación
básica a la clínica, así como centros
distribuidos en red para el apoyo a la
secuenciación, DNA microarrays y DNA chips,
bioinformática, en coordinación con la red de centros de
investigación genómica y proteómica que se
proponen en el área de Biotecnología. En esta área la
genómica y proteómica se fundamenta como
acción estratégica o instrumento básico de
focalización de las actuaciones futuras.
Las tecnologías de la información
jugarán un papel
fundamental en la aplicación de los desarrollos
tecnológicos en el campo de la genética a la
práctica médica como refleja la presencia de la
Bioinformática médica y la Telemedicina dentro de
las principales líneas en patología molecular. La
aplicación de los conocimientos en genética
molecular y las nuevas
tecnologías son necesarios para el mantenimiento
de la competitividad
del sistema sanitario
no sólo paliativo sino preventivo. La
identificación de las causas moleculares de las enfermedades junto con el
desarrollo de la industria
biotecnológica en general y de la farmacéutica en
particular permitirán el desarrollo de mejores métodos de
diagnóstico, la identificación de
dianas terapéuticas y desarrollo de fármacos
personalizados y una mejor medicina preventiva
A finales de los años 80, la tecnología
que desembocaría en la plataforma GeneChip fue
desarrollada por cuatro científicos, en Affymax: Stephen
Fodor, Michael Pirrung, Leighton Read y Lubert Stryer. El
proyecto
original estaba destinado a la construcción de péptidos sobre
chips, pero desembocó en la capacidad para construir
secuencias de DNA sobre chips. La aplicación
práctica de esta idea se llevó a cabo por la empresa
Affymetrix, que comenzó a actuar como una
compañía independiente en el año
1993.
Los biochips, por tanto, surgieron de la
combinación de las técnicas
microelectrónicas y el empleo de
materiales
biológicos. Se basan en la ultraminiaturización y
paralelismo implícito y se concretan en chips de material
biológico de alta densidad de
integración válidos para realizar
distintos tipos de estudios repetitivos con muestras
biológicas simples.
Si en los microchips empleados en los ordenadores se
consigue una alta densidad de
integración de circuitos
electrónicos en una oblea de silicio, en los biochips se
logra una alta densidad de integración de material
genético en una oblea de silicio, cristal o plástico.
Los biochips están divididos en unas pequeñas
casillas que actúan cada una a modo de un tubo de ensayo en el
que se produce una reacción. El número de estas
casillas es muy elevado, llegando incluso a los centenares de
miles.
Cada casilla del chip posee una cadena de un
oligonucleótido, que puede corresponder a una
sección del gen de estudio (cuando se conoce su secuencia)
o a mutaciones del mismo. Debido a la extrema
miniaturización del sistema se pueden
analizar en un único chip todas las posibilidades de
mutación de un gen simultáneamente. Solo aquellos
fragmentos de DNA que hibriden permanecerán unidos tras
los lavados y dado que se conocen las secuencias y posiciones de
los oligonucleótidos empleados, tras los lavados se
produce el revelado que consiste en introducir el chip en un
escáner
óptico que va a ser capaz de localizar, mediante un
proceso
similar a la microscopía confocal, las cadenas marcadas
con el fluorocromo. Un ordenador analiza la información
procedente del escáner y
ofrece el resultado.
Otro tipo de diseño
permite la cuantificación de la expresión de
múltiples genes simultáneamente.
La potencia de estos
sistemas trae consigo la obtención, en tiempos muy breves,
de grandes volúmenes de información, (secuencias,
mutaciones, datos de expresión génica,
determinaciones analíticas de interés
clínico, screening con fármacos) que necesitan ser
gestionados con técnicas bioinformáticas para
extraer conocimiento
de utilidad en la
investigación biomédica.
Parece que el futuro pasa por la integración de estas
nuevas técnicas en el entorno clínico haciendo
posible el concepto de
análisis y diagnóstico en el "point-of-care". La
revista
Science destaca esta tecnología como uno de los 10 avances
científicos más significativos del año
1998.
La nomenclatura
empleada para referirse a estas nuevas tecnologías es
diversa y comienza por el término más general que
es el de "Biochip" y hace referencia al empleo de
materiales biológicos sobre un chip. Otros términos
más específicos son: "DNA chip", "RNA chip"
(según el material empleado) y "Oligonucleotide chip" o
"DNA microarray", que hacen referencia al material y a la forma
en la que se construye el chip. Existen también unos
términos comerciales con los que referirse a los biochips
que varían dependiendo de la tecnología
empleada.
Aplicaciones de los Biochips
A pesar de ser una tecnología muy reciente y que, por lo
tanto, está aún en vías de
experimentación, actualmente los biochips están
siendo aplicados en:
- Monitorización de expresión
génica: permite determinar cual es el patrón de
expresión génica y cuantificar el nivel de
expresión de manera simultánea para un elevado
número de genes. Esto permite realizar estudios
comparativos de activación de determinados genes en
tejidos sanos y
enfermos y determinar así la función de los
mismos. - Detección de mutaciones y polimorfismos:
Permite el estudio de todos los posibles polimorfismos y la
detección de mutaciones en genes complejos. - Secuenciación: Mientras que se han
diseñando algunos biochips para secuenciación de
fragmentos cortos de ADN, no existe
aún en el mercado
ningún biochip que permita secuenciar de novo secuencias
largas de ADN. - Diagnóstico clínico y detección
de microorganismos: Posibilitan la identificación
rápida empleando unos marcadores genéticos de los
patógenos. - Screening y toxicología de fármacos: el
empleo de los biochips permite el analizar los cambios de
expresión génica que se dan durante la
administración de un fármaco de forma
rápida, así como la localización de nuevas
posibles dianas terapéuticas y los efectos
toxicológicos asociados. - Seguimiento de terapia: los biochips permiten valorar
rasgos genéticos que pueden tener incidencia en la
respuesta a una terapia. - Medicina preventiva: El
conocimiento y posible diagnóstico de ciertos
caracteres genéticos asociados a determinadas
patologías permite una prevención de las mismas
antes de que aparezcan los síntomas
Si la genómica estructural es la rama de la
genómica orientada a la caracterización y
localización de las secuencias que conforman el ADN de los
genes, la genómica funcional consiste en la
recolección sistemática de información sobre
la función de los genes, mediante la aplicación de
aproximaciones experimentales globales que evalúen la
función de los genes haciendo uso de la información
y elementos de la genómica estructural. Se caracteriza por
la combinación de metodologías experimentales a
gran escala con
estudios computacionales de los resultados.
Con la genómica funcional el objetivo es
llenar el hueco existente entre el
conocimiento de las secuencias de un gen y su función,
para de esta manera desvelar el comportamiento
de los sistemas biológicos. Se trata de expandir el
alcance de la investigación biológica desde el
estudio de genes individuales al estudio de todos los genes de
una célula al
mismo tiempo en un
momento determinado.
Proteómica
El proteoma se puede definir como el conjunto de las
proteínas expresadas por un genoma. La PROTEOMICA es el
estudio de proteomas, así como la GENOMICA consiste en el
estudio de genomas. Configura una disciplina
fundamental de la era post-genómica que trata de descubrir
la constelación de proteínas que otorgan a las
células
su estructura y función.
Distintas tecnologías permiten obtener y comparar
"instantáneas" de las proteínas que se están
expresando en un momento determinado en una célula
(robótica,
electroforesis 2D, espectrometría de masas, chips,
bioinformática).
La Nueva Generación de Bioinformática
Se introduce el concepto de Bioinformática de Segunda
Generación caracterizada por:
En los últimos años, la bioinformática ha
trabajado con muchas bases de datos que almacenaban
información biológica a medida que iba apareciendo.
Esto no sólo ha tenido efectos positivos: muchos
científicos se quejan de la creciente complejidad que
representa encontrar información útil en este
"laberinto de datos". Para mejorar esta situación, se
desarrollan técnicas que integran la información
dispersa, gestionan bases de datos distribuidas, las seleccionan
automáticamente, evalúan su calidad, y
facilitan su accesibilidad para los investigadores. Se habla de
Bioinformática Integradora. En ella no deben faltar ayudas
para la navegación por la información, que cada
vez, con más énfasis, reside en Internet y no en bases de
datos locales.
¿Cual es la importancia de la
bioinformática?
Integración es la palabra clave para entender la
importancia de la bioinformática, ya que a través
de herramientas y utilizando la información ya depositada
en bases de datos alrededor del mundo estamos comenzando a
descubrir relaciones no triviales escondidas en el código
de la vida.
La bioinformática ha empezado a ocupar un papel central
como "la pega" que une a diversas áreas de la ciencia tales
como enzimología, genética, biología
estructural, medicina, morfología, y ecología entre muchos
otros. La pregunta crítica es ¿cómo
conseguir las relaciones importantes entre tanta
información? esta pregunta y muchos otros problemas
biológicos están siendo respondidos a través
de la bioinformática, uniendo o relacionando toda la
información que esta depositada en las bases de datos a
través sus asociaciones con los genes. Como un ejemplo
práctico de lo anterior, NCBI, el centro de
bioinformática del NIH, reciben y procesan en su sitio
Web alrededor
de 3 millones de requisiciones al día provenientes de
investigadores ubicados alrededor del mundo.
La Nueva Generación de Bioinformática
Se introduce el concepto de Bioinformática de Segunda
Generación caracterizada por:
En los últimos años, la bioinformática ha
trabajado con muchas bases de datos que almacenaban
información biológica a medida que iba apareciendo.
Esto no sólo ha tenido efectos positivos: muchos
científicos se quejan de la creciente complejidad que
representa encontrar información útil en este
"laberinto de datos". Para mejorar esta situación, se
desarrollan técnicas que integran la información
dispersa, gestionan bases de datos distribuidas, las seleccionan
automáticamente, evalúan su calidad, y
facilitan su accesibilidad para los investigadores. Se habla de
Bioinformática Integradora. En ella no deben faltar ayudas
para la navegación por la información, que cada
vez, con más énfasis, reside en Internet y no en bases de
datos locales.
Los procesos
celulares son gobernados por el repertorio de genes expresados y
su patrón de actividad temporal. Se necesitan herramientas
para gestionar información genética en paralelo.
Para ello se emplean nuevas tecnologías para
extracción de conocimiento,
minería de
datos y visualización. Se aplican técnicas de
descubrimiento de conocimiento a problemas biológicos como
análisis de datos del Genoma y Proteoma. La
bioinformática, en este sentido, ofrece la capacidad de
comparar y relacionar la información genética con
una finalidad deductiva, siendo capaz de ofrecer unas respuestas
que no parecen obvias a la vista de los resultados de los
experimentos.
Todas estas tecnologías vienen justificadas por la
necesidad de tratar información masiva, no individual,
sino desde enfoques celulares integrados (genómica
funcional, proteómica, expresión
multigénica,…). Los sistemas LIMS permiten la
integración y gestión de los datos de laboratorio.
- http://www.iibce.edu.uy/2000-08/index.html
- http://www.ugr.es/~eianez/Biotecnologia/forensetec.htm#3
- http://www.ideal.es/waste/genomabiochip.htm
- http://barrapunto.com/articles/100/02/10/2317259
- http://www.bioinformacion.net/biochip.htm
- http://www.inmuno.org/pdf/basesdedatos.pdf
- http://www.seis.es/i_s/i_s19/i_s19l.htm
Autor:
Ing. Oscar Zepeda García
Maestría en Ingeniería
de Sistemas Empresariales
Universidad Ibero
Americana