- Resumen
- ¿Qué hemos
aprendido? - ¿Cuántos genes
tenemos? - ADN repetitivo: ¿Útil
o inútil? - Estructura de los
genes - Comparándonos a otros
organismos - ¿Debemos patentar el
ADN? - ¿Quién ganó
la carrera? - Proyectos
futuros - Bibliografía
El genoma humano contiene una cantidad extraordinaria de
información acerca del desarrollo, la
fisiología, anomalías y evolución de la especie. Este
artículo pretende discutir sobre el análisis de la secuencia publicada en
febrero de este año y sobre algunos temas polémicos
al respecto. La comparación del genoma con otros genomas
secuenciados ha demostrado una gran similitud. De esta
comparación se observa que el número de genes
estimados en los humanos (entre 30 a 40 mil) es mucho menor al
esperado. Además existe mucha similitud entre la estructura de
los genes y las proteínas.
Sin embargo, los humanos parecen tener en promedio exones
más pequeños e intrones mucho más grandes.
Por su parte, las proteínas no parecen tener muchos
más dominios nuevos sino mas bien muchas nuevas
combinaciones de dominios ancestrales. Los elementos
transponibles y retroelementos parecen estar inactivos. La tasa
de mutación en la meiosis de los
machos es el doble que en las hembras y la tasa de
recombinación en los machos es menor que en las hembras.
La tasa de recombinación tiende a ser mucho mayor en
regiones distales de los cromosomas y en
aquellos más pequeños comparados con los cromosomas
grandes.
Palabras Claves: proyecto genoma,
genética
humana.
Artículo publicado en la revista de
divulgación Fontus, Nº 8: 169-202 (2001), de la
Asociación de Profesores de la Universidad de
Oriente, Cumaná, Venezuela.
ABSTRACT
The human genome contains an extraordinary amount of
information about the development, fisiology, anomalies and
evolution of the species. This article tries to discuss about the
sequence analysis published in February of this year and about
some controversial related issues. The comparison of the genome
with those of other species already sequenced have shown a great
similarity. From this comparison it is clear that the estimated
number of human genes (from 30 to 40 thousands) is a lot lower
than expected. There is great similarity on the structure of the
genes and the proteins. However, humans seem to have on average
smaller exons and larger introns. The proteins do not showed a
many new domains but new rearrangements of ancestral domains. The
transposable elements and retroelements seem to be inactive. The
mutation rate in the male meiosis is twice as much as in the
female meiosis and the recombination rate in the males is lower
than in the females. The recombination rate tend to be higher in
distal regions of the chromosome and in the small chromosomes
compared to the large ones.
Key Words: genome project, human genetics.
El Proyecto Genoma Humano es quizás el desarrollo
científico más significativo de los últimos
treinta años, comparable al de la caminata del hombre en la
luna a finales de los sesenta. A principios de
este año se comenzó a publicar los resultados de
los primeros análisis de la secuencia humana, comenzando
con los artículos aparecidos en las revistas
científicas Nature y Science en la primera semana de
febrero.
Este artículo pretende hacer un análisis
de los aspectos más resaltantes de esa información
y discutir sobre las polémicas suscitadas con la
publicación de la secuencia humana. Asimismo, éste
representa una continuación del artículo publicado
en un número anterior de Fontus (De Donato, 2000) y se
recomienda su lectura, sobre
todo para aquellas personas no especializados en el área
de Genética.
Durante el siglo pasado se inició la
búsqueda del conocimiento
para entender la naturaleza y
contenido del material hereditario, comenzando con el
redescubrimiento de las leyes de Mendel de la
herencia. La
consecución de hechos y descubrimientos se pueden dividir
en cuatro fases que se corresponden aproximadamente a los cuatro
cuartos del siglo XX. Primero se estableció la base
celular de la herencia (los cromosomas), después se
definió la base molecular de la herencia (la doble
hélice del ADN), luego se
conoció como es el flujo de información de la
herencia, con el descubrimiento de los mecanismos moleculares de
la
célula y su aplicación in vitro y en el
último cuarto de siglo se descifraron, primero genes y
después genomas completos, dando inicio al campo de la
genómica. Actualmente se han secuenciado 711 tipos de virus
y viroides, 264 plásmidos que se encuentran en diversas
especies, 207 organelos, 52 bacterias, un
hongo, una planta y tres animales,
incluyendo el hombre (se
puede obtener una lista en la página de NCBI, http://www.ncbi.nlm.nih.gov:80/PMGifs/
Genomes).
Todavía falta mucho por hacer para completar la
secuenciación del genoma humano, pero con la gran
mayoría de la información disponible libremente, se
ha podido tener una perspectiva global del genoma de nuestra
especie. Aunque muchos detalles van a cambiar al finalizar la
secuenciación, los aspectos más resaltantes de lo
que hemos aprendido se puede resumir en (International Human
Genome Sequencing Consortium, IHGSC, 2001):
1. La distribución de los diferentes elementos
del genoma es heterogénea, incluyendo genes, elementos
transponibles, contenido de GC, islas CpG y tasas de
recombinación.
2. Aunque el genoma humano sólo cuenta con cerca
del doble de los genomas del gusano (Caenorhabditis
elegans) y la mosca de la fruta (Drosophila
melanogaster), nuestros genes son mucho más complejos,
con más sitios alternativos de procesamiento que producen
un mayor número de tipos de proteínas.
3. Las proteínas humanas no sólo poseen
más dominios que son específicos de los vertebrados
sino que también tienen complejos rearreglos de dominios
preexistentes.
4. Cientos de genes humanos parecen haber resultado de
una transferencia horizontal desde bacterias y unas docenas
parecen haberse derivado de elementos transponibles.
5. Los elementos transponibles y retroelementos parecen
estar inactivos en el genoma humano.
6. La tasa de mutación en la meiosis de los
machos es el doble que en las hembras.
7. Las tasas de recombinación tienden a ser mucho
mayor en regiones distales (cerca de los telómeros) y en
los cromosomas más cortos, en un patrón que
promueve la ocurrencia de al menos un entrecruzamiento por brazo
cromosómico en cada meiosis.
Estimados recientes han colocado el número de
genes humanos entre 30 y 40 mil (Ewing & Green, 2000; IHGSC,
2001; Venter et al., 2001). De estos genes, más de
10.000 han sido catalogados en el libro "Online
Mendilian Inheritance in Man" (OMIM) (McKusick, 1998) el cual
contiene todos las enfermedades
genéticas en humanos y los genes mutantes que las causan.
Toda esta información está disponible vía
Internet (Tabla
1). La integración de la información de
esta base de datos
con la secuencia humana ha permitido la localización de
muchos de estos genes. Para el resto de los genes, es necesario
el uso de recursos de
bioinformática y del análisis de la
información de los genes conocidos hasta ahora.
Teniendo en cuenta que se han secuenciado unos 45
genomas de procariotas (bacterias) y cinco genomas de eucariotas
(organismos superiores), es lógico pensar que el
análisis de secuencias y la identificación de genes
es algo sencillo. Sin embargo, a pesar de lo que conocemos ahora,
los genomas más grandes son mucho más
difíciles de analizar y sus genes son mucho más
complejos, dificultando su identificación.
Se utilizan muchos métodos
para predecir la presencia de genes, los cuales están
basados en señales
específicas en la secuencia que permiten su
expresión de manera apropiada. Desafortunadamente, estos
métodos tienden a producir falsos positivos, lo que induce
a una sobreestimación del número de genes.
Además, estos métodos no funcionan bien en
secuencias no terminadas, como lo es la mayoría de la
secuencia humana.
Por otra parte, la información de secuencias
expresadas (EST y ADNc) y proteínas en humanos y otros
organismos proveen una forma más precisa para el
descubrimiento de los genes (Birney et al. 2001). Por
ejemplo, los algoritmos
matemáticos más efectivos integran métodos
de predicción de genes con comparación de
secuencias, entre los que podemos mencionar GeneWise, Genomescan
y Genie. En el caso de los humanos, la herramienta más
útil para encontrar genes son las secuencias de otros
genomas de vertebrados. Es por esto que en el futuro, cuando los
resultados de otros proyectos de
secuenciación como el del chimpancé, el
ratón, el pez zebra y el pez Tetraodon
nigroviridis, servirán para analizar aún mejor
el genoma humano.
Comparando el número de genes para la especie
humana con las otras especies que han sido secuenciadas,
éste parece ser bien bajo. A menos que el genoma humano
contenga muchos genes que no pueden ser encontrados por técnicas
convencionales, los humanos no le deben su complejidad a un
número mucho mayor de genes.
La gran mayoría de nuestros genes provienen un
pasado evolutivamente distante, donde sólo el 7,35 % de
las familias de genes que poseemos son específicos para
los vertebrados (IHGSC, 2001). De modo que la mayoría de
las funciones
celulares básicas han aparecido en la evolución
sólo una vez, y de ahí se han modificado y adaptado
en cada especie.
En los vertebrados, la aparición de nuevos genes
está asociada a dos tipos de funciones: aquellos que son
específicos de sus habilidades (tal como complejidad
neuronal, factores de coagulación y de respuesta inmune
adquirida) y aquellos que aumentan sus capacidades generales (tal
como genes para la señalización intra y
extracelular, desarrollo, muerte celular
programada y control de la
transcripción de genes).
ADN
REPETITIVO: ¿ÚTIL O INÚTIL?
Una observación bien intrigante al principio de
la era de la Biología Molecular,
fue que el tamaño de los genomas no se correlacionaba con
la complejidad del organismo. Por ejemplo, el hombre tiene un
genoma que es unas 200 veces más grande que el genoma de
la levadura (S. cerevisiae), pero 200 veces más
pequeño que el de Amoeba dubia (Gregory &
Hebert, 1999). Esto se conoce como la paradoja del valor C
(contenido de ADN) y fué explicado cuando se
conoció que los genomas podían contener una gran
cantidad de secuencia repetitiva que no posee ninguna función
aparente.
Tabla 2. Organización estimada de los distintos
tipos de secuencias del Genoma Humano (Datos tomados de
IHGSC, 2001).
Tipo de Secuencia | Número | Porcentaje del Genoma |
ADN No Repetitivo |
| 47% |
Transcrito | 30-40.000 | 28% |
Codificante | 30-40.000 | 1.4% |
ARN no mensajero | 750 | 5% |
No Transcrito | — | 19% |
ADN Repetitivo |
| 53% |
LINEs | 850.000 | 21% |
SINEs | 1.500.000 | 13% |
Elementos Retrovilares | 450.000 | 8% |
Transposones ancestrales | 300.000 | 3% |
Repeticiones en Bloque | ? | 8% |
El tamaño total estimado del genoma humano es de
3.200 Mb (Megabases, millones
de bases). De estas bases, 250 Mb corresponden a ADN
heterocromático (tabla 2), el cual contiene una gran
cantidad de ADN repetitivo que no posee función conocida o
es parte de las regiones centroméricas y
teloméricas. De todo el resto, sólo el 28 % es
transcrito a ARN mensajero para luego ser procesado y dejar
sólo un 1.4 % que codifica para las proteínas de
todo el cuerpo (IHGSC, 2001; Venter et al., 2001).
Además, existen unos 740 genes que codifican sólo
ARN con diferentes funciones en la célula, y
se espera que muchos más serán encontrados en corto
tiempo.
En el hombre, el ADN repetitivo comprende
aproximadamente el 53% de toda la secuencia y la mayoría
se derivan de elementos transponibles (Smit, 1999). En sentido
general, las repeticiones pueden agruparse en 5 clases (IHGSC,
2001):
1. Repeticiones derivadas de
transposones (secuencias de ADN que pueden cambiar su
posición en el genoma), referidas como repeticiones
interdispersa.
2. Copias retropuestas de genes celulares inactivos
total o parcialmente, referidas como seudogenes
procesados.
3. Repeticiones simples, que consisten de secuencias
simples que se repiten una tras otra en segmentos relativamente
cortos.
4. Segmentos duplicados, donde pequeños (10 – 300
kb) segmentos han sido copiados en otra parte del
genoma.
5. Bloques de ADN repetitivo localizado en regiones
específicas, tales como centrómeros,
telómeros (extremos de los cromosomas), grupos de genes
ribosomales y otros.
El ADN repetitivo generalmente es descrito como basura y se
descarta por no ser informativo. Sin embargo, él
representa una fuente extraordinaria de información acerca
de diversos procesos
biológicos. Las repeticiones constituyen un record
paleontológico que posee pistas claves de eventos y fuerzas
evolutivas que operan en la naturaleza. Cuando tienen un rol
pasivo, pueden ser usados para estudiar los procesos de
mutación y selección.
Cuando su rol es activo, el ADN repetitivo ha producido cambios
en el genoma, causando re-arreglos importantes en el orden de los
segmentos, creando nuevos genes o modificando y reordenando genes
existentes.
Al comparar el ADN repetitivo humano con el de otras
especies nos damos cuenta de que la porción
eucromática (segmento de cromosomas que contiene la
mayoría de los genes, en contraste con la
heterocromática que contiene casi exclusivamente ADN
repetitivo) contiene una mayor densidad de
copias de elementos transponibles que los segmentos
eucromáticos de las otras especies.
Para ver el
gráfico seleccione la opción "Descargar" del
menú superior
Además, el genoma humano está lleno
de copias de transposones ancestrales y sólo un 6% se
estima que está activo. En las otras especies, sin
embargo, los transposones son de origen reciente y entre un 25 a
87% está activamente moviéndose en el genoma
(IHGSC, 2001). Por último, en el genoma humano, 2 tipos de
repeticiones (LINE1 y Alu) representan el 60% de todas las
secuencias repetitivas dispersas, mientras que en los otros
genomas no existe dominancia de tipos específicos de
repeticiones.
Los genes de los organismos superiores (eucariontes) no
se presentan de manera continua, como en las bacterias
(procariontes), sino que poseen secuencias internas (intrones)
que no codifican para las proteínas (Figura 1). De modo
que en los eucariontes, una vez transcrito el ADN en ARN, existe
una fase de procesamiento de este último, donde las
secuencias internas son eliminadas (además de otras
modificaciones que sufre el ARN), quedando las secuencias
codificantes o exones de manera continua y listas para codificar
a las proteínas.
En el pasado, los intentos de estudiar la estructura
general de los genes humanos no habían arrojado resultados
exactos debido al pequeño número de genes
disponibles. En la tabla 3 se resumen algunas de las
características estructurales de los genes humanos
deducidas del análisis de unos 1.800 genes que
están completamente caracterizados desde el punto de vista
del ADN y el ARN lo que representaría una muestra de cerca
del 5% del total.
Existe una considerable variación en el
tamaño general de los genes y los intrones. Muchos genes
tienen un tamaño mayor al de 100.000 bp de largo. Por
ejemplo, el gen de la distrofina que causa la enfermedad de
distrofia muscular de Duchene (DMD) tiene un tamaño de 2.4
Mb (IHGSC, 2001). La variación del tamaño de los
exones es mucho menor aunque existen algunos casos extremos. Por
ejemplo, el gen titin tiene la secuencia codificante más
larga conocida hasta ahora, unos 80.780 bp, además de el
número más grande de exones, 178, y el exón
más largo, 17.106 bp (Labeit & Kolmerer,
1995).
Otra característica de los genes humanos, y puede
que en general para otras especies, es la distribución
diferencial a lo largo del genoma y su relación con la
alta proporción de las bases Guanina y Citosina
(GC).
Tabla 3. Características estructurales de los
genes humanos de una muestra de 1.800 genes (Modificado de IHGSC,
2001).
Característica | Moda | Promedio |
Tamaño Exones Internos | 122 bp | 145 bp |
Número Exones | 7 | 8.8 |
Tamaño Intrones | 1.023 bp | 3.365 bp |
Tamaño Secuencia Codificante | 1.100 bp | 1.340 bp |
Tamaño Proteína | 367 aa | 447 aa |
Tamaño Gen | 14.000 bp | 27.000 bp |
Las secuencias que contienen genes poseen una mayor
proporción de GC que las secuencias no génicas. En
el genoma humano se observa que la densidad de genes se
incrementa más de diez veces cuando la proporción
de GC pasa de 30% a 50% (IHGSC, 2001). En general se observa que
los intrones más grandes contienen una proporción
baja de GC, mientras que el tamaño de los exones no se ve
afectado por la proporción de GC. También es clara
la asociación de una baja proporción de GC en el
ADN repetitivo.
El análisis de las secuencias codificantes, a
través de la comparación de los genes con los ARN
mensajeros ha mostrado el alto número de genes que
presentan procesamiento alternativo. Durante el procesamiento del
ARN mensajero en los eucariontes, los intrones son eliminados y
sólo el ADN codificante (exones) es traducido a la
proteína. Sin embargo, se ha determinado que muchos de los
genes utilizan procesamiento alternativo que permite producir dos
o más tipos de proteínas de un solo gen. Un
análisis del número de secuencias transcritas
producidas de los genes del cromosoma 22 demuestra que existen en
promedio 2,6 tipos por gen (IHGSC, 2001). Un análisis
similar en el cromosoma 19 demuestra un promedio de 3,2. Estos
valores
seguramente aumentarán a medida que se estudien más
tipos distintos de ARN mensajero. En el hombre, este
número parece ser mayor que en otras especies,
posiblemente explicando la mayor complejidad de nuestra
especie.
COMPARÁNDONOS A OTROS
ORGANISMOS
La comparación del genoma humano con los de
moscas (D. melanogaster) y gusanos (C. elegans) han
llevado a la conclusión de que las diferencias
físicas y de comportamiento
entre especies no están relacionadas de manera simple al
número de genes.
El tamaño típico de las secuencias
codificantes, y por ende las proteínas, tiene un
tamaño similar en las tres especies (1.311 bp en el
gusano, 1.497 bp en la mosca y 1.340 en el humano). De la misma
forma, la mayoría de los exones internos son
aproximadamente del mismo tamaño en estas especies, entre
unos 50 a 200 bp, pero en el gusano y la mosca el rango de
variación es mayor, resultando en un mayor tamaño
promedio de exones para estas dos especies (cerca de 200 bp
versus 145 bp en humanos).
Por el contrario, el tamaño de los intrones
difiere bastante de los del gusano y mosca. En estas dos
especies, la mayoría de los intrones varía entre 50
a 2.000 bp, con un tamaño promedio de 267 bp para el
gusano y 487 bp para la mosca. En los humanos, la moda se encuentra
alrededor de 1.000 bp y un rango muy amplio que produce un
promedio de más de 3.300 bp por intrón (IHGSC,
2001). Esto produce un incremento en el tamaño de los
genes en humanos comparados con moscas y gusanos.
Algunos genes humanos parecen provenir directamente de
bacterias, más que evolucionados desde las ellas. Esto
podría implicar que las bacterias son capaces de
transferir genes a vertebrados (Baltimore, 2001).
Por otra parte, más del 90% de los dominios
(unidades estructurales) que se encuentran en las
proteínas humanas están también presentes en
la mosca y el gusano (Rubin, 2001). Pareciera que la
evolución de los vertebrados ha requerido la
invención de pocos dominios nuevos, y que la nueva
arquitectura
se basara en el uso diferencial de segmentos bastante antiguos
evolutivamente. Sin embargo, los dominios en las proteínas
humanas han sido mezclados en muchas nuevas combinaciones que han
producido casi el doble de re-arreglos diferentes en nuestro
genoma.
A nivel de las proteínas, el 60% de las que
existen en nuestro genoma muestran cierto grado de similitud a
proteínas de otras especies. Aproximadamente un tercio de
las proteínas de humanos, moscas, gusanos y levaduras no
muestran similitud a proteínas de otras especies (Rubin,
2001). Estas proteínas puede que retengan funciones
similares en cada genoma y que sus secuencias divergieran, o que
puedan haber adquirido nuevas funciones específicas para
cada especie.
Se argumenta que el sistema de
patentes ha sido una fuerza que ha
ayudado al desarrollo de muchos descubrimientos y ha generado
productos
clínicamente útiles (Bobrow & Thomas, 2001).
Además se argumenta que las inversiones de
alto riesgo o de sumas
muy elevadas sólo pueden ser hechas respaldadas por un
sistema de patentes que permita el retorno de los recursos
invertidos a corto o mediano plazo y una ganancia acorde con la
inversión. Pero la interrogante se presenta
ahora con el Proyecto Genoma Humano: ¿Puede tener el mismo
efecto positivo en el área de la Genómica? y
más aún, ¿Puede este sistema mantener una
influencia positiva para el progreso de la ciencia y
el beneficio de la mayoría? Las respuestas a estas
preguntas son muy inciertas, aún en opiniones de sectores
parcializados a extremos de privatización o libre acceso a la
información.
Muchos miles de patentes con derechos sobre secuencias de
ADN humano han sido otorgadas, incluyendo secuencias de ADN
genómico, ADN complementario, marcadores de secuencias
expresadas (ESTs), mutaciones y polimorfismos de
nucleótido simple (SNPs). La pregunta que podemos hacer
ahora es ¿servirán estas patentes para desarrollar
nuevos productos con aplicaciones clínicas o son meras
oportunidades de obtener un posible beneficio algún
día? Algunas secuencias han sido usadas para generar
pruebas
diagnósticas para la fibrosis cística y el cáncer de
mama.
Sin embargo, el otorgar derechos exclusivos de genes que
producen enfermedades a un único beneficiario ha generado
un amplio debate, que va
hasta el cuestionamiento de las secuencias de ADN como parte de
una invención. Si tomamos en cuenta que el ADN
genómico se encuentra en todos los seres humanos, su
secuencia no representa una invención (el espíritu
de la patente) sino quizás un descubrimiento.
Además, se puede difícilmente respaldar la idea que
la secuenciación de un segmento de ADN particular es una
inversión que debe ser respaldada por una patente si se
sabe que hoy en día un laboratorio
modesto puede secuenciar unas 150.000 bases al día a un
costo de unos 20
Bs por base (2,7 centavos de dólar).
Es necesario resaltar que el sistema de patentes en
ésta área está destinado a producir un caos
legal si no se toman las medidas necesarias para regular la
patentabilidad de la información. Por ejemplo, los
componentes de las unidades genéticas funcionales del
cuerpo humano
(exones, SNPs, mutaciones, dominios de proteínas, ARN
mensajeros y regiones de control) son todas parte integral del
mecanismo biológico que actúa en la célula.
Si la secuencia de ADN de todos estos componentes son
identificados y luego tratados como
invenciones separadas, cualquier producto con
uso clínico es probable que cruce las barreras legales de
varias de las patentes (Bobrow & Thomas, 2001).
Este es un debate que debe llevarse a varios niveles de
discusión, tales como la ONU, los poderes
legislativos de las naciones y del público en general. El
aspecto principal de la discusión debe ser la
reformulación del sistema de patentes de modo que ajuste
su capacidad de definir la invencionalidad y utilidad
requerida para su patentabilidad. Además debe definirse
muy bien el camino a seguir con respecto a los diversos
Patrimonios de la Humanidad, entre los que se encuentra el Genoma
Humano.
La declaración conjunta de la publicación
del primer borrador de la secuencia humana en julio del
año pasado, por parte de los sectores público
(International Human Genome Sequence Consortium) y privado
(Celera Genomics), en presencia del presidente de los Estados Unidos de
América
parecía determinar un empate entre los dos esfuerzos. Sin
embargo, la publicación de un análisis de las
secuencias por ambas partes (IHGSC, 2001; Venter et al.,
2001) en febrero de este año reinició el debate de
quien posee más méritos por descifrar la mayor
parte del Genoma Humano.
La compañía Celera Genomics fue fundada
con el objetivo de
producir la secuencia completa del genoma humano en un
período más corto y con una inversión mucho
más pequeña que la iniciativa pública. El
objetivo inicial fue de generar la secuencia con una cobertura de
10X. Sin embargo, los datos presentados por Celera muestran una
cobertura de 5,1 veces del genoma, más el uso de otras 2,9
veces del genoma proveniente de la iniciativa pública que
está disponible libremente a través de Internet. La
compañía justifica el uso de secuencias
públicas porque con ello se ahorraron unos 60 millones de
dólares.
Los miembros del proyecto público argumentan que
la información tomada por Celera no fue al azar, sino
más bien cuidadosamente escogida para cubrir todo el
genoma, aprovechando al máximo la información
generada por el sector
público. Ellos sostienen que en realidad Celera
utilizó el equivalente al 7,5X de la secuencia del genoma
humano (Butler, 2001). En este sentido, John Sulston, antiguo
director de uno de los centros más importantes del IHGSC
comenta que:
" Por tres años al proyecto público se
le dijo que éramos ineficientes, lentos y no
teníamos razón al proceder de manera cautelosa, y
que el Whole Genome Shotgun [enfoque metodológico
empleado por Celera Genomics] obviaba la necesidad de todos
estos pasos que representaban un derroche. A la final, se
transpira que nosotros somos los que hemos garantizado que
exista una secuencia del genoma humano. Nosotros salvamos el
día".
Aunque se han hecho grandes progresos en la
secuenciación del genoma humano, todavía falta
mucho por hacer. Ahora se está avanzando hacia varias
direcciones que permitirán el uso y aplicación de
toda la información que se ha generado y se seguirá
generando en los próximos años. Entre los proyectos
que se contempla terminar a corto o mediano plazo se
encuentran:
1. Terminación de la secuencia del genoma humano.
Se estima que se producirá una secuencia terminada, de lo
que existe hoy en día, a mediados del este año y la
mayoría de los huecos deberían ser cerrados para el
2003.
2. Desarrollo del índice integrado de genes (IGI)
y proteínas (IPI). El análisis de las secuencias
del genoma, así como de la información de otras
fuentes
producirá un listado detallado de todos los genes y
proteínas que contienen las células
humanas.
3. Identificación a gran escala de
regiones reguladoras. Para entender cómo la célula
regula los genes es necesario conocer las secuencias responsables
de las funciones celulares definidas por regulación
específica de los genes de los distintos tipos
celulares.
4. Secuenciación adicional de genomas de otras
especies. Existen proyectos que han comenzado a secuenciar los
genomas del ratón, el pez zebra, los peces
Tetraodon nigroviridis y Takifugu rubripes.
Además existen planes para secuenciar algún otro
primate y otros organismos que ayudarán a caracterizar los
genomas de vertebrados y no vertebrados.
5. Terminación el catálogo de la
variación humana. Actualmente se han identificado
más de 1.4 millones de SNPs a lo largo de todo el genoma y
se extenderá hasta descubrir casi la totalidad de las
diferencias entre distintos seres humanos, lo que
permitirá la aplicación de esta información
en el descubrimiento de las causas de muchas
enfermedades.
6. Paso de la secuencia a la función de los
genes. El análisis de toda la información generada
nos permitirá descubrir la función de cada uno de
los genes y nos llevará a desarrollar nuevas
tecnologías para el diagnóstico y tratamiento de enfermedades
genéticas.
AGRADECIMIENTOS
Deseo expresar mi más cordial agradecimiento a
Carmen Alfonsi e Isabel Mimbela de Loroño por la lectura
crítica
del manuscrito.
BALTIMORE, D. (2001). Our Genome Unveiled.
Nature 409:814-816.
BIRNEY, E.; BATEMAN, A.; CLAMP, M.E. AND HUBBARD,
T.J. (2001). Mining the Draft Human Genome. Nature
409:827-828.
BOBROW, M. AND THOMAS, S. (2001). Patents in a
Genetic Age. Nature 409:763-764.
BUTLER, D. (2001). Publication of Human Genomes
Sparks Fresh Sequence Debate. Nature
409:747-748.
DE DONATO, M. (2000). El Libro de la Vida
¿Tiene Acaso Todas las Respuestas? Fontus
Nº 7:17-44.
EWING, B. AND GREEN, P. (2000). Analysis of
Expressed sequence Tags Indicates 35,000 Human Genes.
Nature Genet. 25:232-234.
GREGORY, T.R. AND HEBERT, P.D. (1999). The
Modulation of DNA Content: Proximate Causes and Ulitmate
Consecuences. Genome Res. 9:317-324.
INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM,
IHGSC. (2001). Initial Sequencing and Analysis of the Human
Genome. Nature 409:860-921.
LABEIT, S. & KOLMERER, B. (1995). Titins: giant
proteins in charge of muscle ultrastructure and elasticity.
Science 270:293-296.
MCKUSICK, V.A. (1998). Mendilian Inheritance in
Man. Catalogs of Human Genes and Genetic Disorders. Johns
Hopkins University Press, Baltimore, USA.
RUBIN, M.G. (2001). Comparing Species. Nature
409:820-821.
SMIT, A.F. (1999). Interspersed repeats and other
mementos of transposable elements in mammalian genomes.
Curr. Opin. Genet. Dev. 9:657-663.
VENTER, C.J.; ADAMS, M.D.; MYERS, E.W.; LI, P.W.;
MURAL, R.J.; SUTTON, G.G.; SMITH, H.O.; YANDEL, M.; EVANS,
C.A.; HOLT, R.A.; GOCAYNE, J.D.; AMANATIDES, P.; BALLEW,
R.M.; HUSON, D.H.; WORTMAN, J.R.; ZHANG, Q.; KODIRA, C.D.;
ZHENG, X.H.; CHEN, l.; SKUPSKI, M., et al. (2001). The
Sequence of the Human Genome. Science
291:1304-1351.
Dr. MARCOS DE DONATO
Lab. Genética Molecular, IIBCA, Universidad de
Oriente.
Cumaná, estado Sucre,
Venezuela