Prácticas de Bioinformática – FILOGENIA

 



Análisis, comparación y reconstrucción filogenética de secuencias de DNA mitocondrial




 

En esta práctica utilizaremos secuencias de DNA mitocondrial de la especie humana actual, del hombre de Neandertal y de otras especies cercanas de primates para elaborar un árbol filogenético de estas especies. Los pasos que se van a seguir son los siguientes:

 

A. Búsqueda de secuencias similares en bases de datos

B. Localización de la secuencia problema en el DNA mitocondrial

C. Comparación dos a dos de las secuencias de distintos individuos de la especie humana actual

D. Comparación dos a dos del DNA de la especie humana actual y el DNA del hombre de Neandertal

E. Comparación dos a dos entre el humano moderno y otras especies próximas de primates

F. Reconstrucción filogenética de las secuencias de DNA mitocondrial

 


 

A.   Búsqueda de secuencias similares en bases de datos

 

1.    Abre el archivo de secuencias. Estas secuencias han sido obtenidas por estudiantes y corresponden a una región de su DNA mitocondrial. Son las secuencias problemas con las que vamos a trabajar.

 

2.    Selecciona una de las secuencias, excluyendo las regiones ricas en nucleótidos sin resolver (NNNNN) del inicio y final de la secuencia.

 

3.    Crea un archivo de texto y pega la secuencia en él. En este archivo se guardarán también todas las secuencias que se usarán posteriormente.

 

4.    Ve al BLAST (Basic Local Alignment Tool) del NCBI (National Center for Biotechnology Information) y elige nucleotide blast.

 

5.    Haz click dentro del cuadro de entrada de datos y pega la secuencia que has copiado. Selecciona la base de datos Others (nr/nt).

 

6.    Haz click en el botón BLAST. Aparece una ventana que informa sobre el trabajo enviado y el tiempo esperado que tardarás en obtener el resultado.

 

7.    En los resultados obtendrás un gráfico de los mejores hits (coincidencias). A continuación BLAST devuelve los resultados de la búsqueda listando los alineamientos de más a menos similitud en una tabla en la que para cada alineamiento hay varias columnas con información.

 

8.    Como podrás ver en sus descripciones (segunda columna), las secuencias obtenidas corresponden a DNAs mitocondriales completos. Para descubrir a que región del genoma mitocondrial presenta similitud nuestra secuencia iremos a ver uno de los alineamientos haciendo click en su valor Score (tercera columna). Una vez vemos el alineamiento entre la secuencia introducida (query) y la encontrada en la base de datos (subject) nos fijamos en las posiciones alineadas de la secuencia subject. Si entramos en el número de acceso del GenBank (enlace situado sobre el alineamiento) y miramos la información sobre las diferentes partes de esta secuencia encontraremos a qué región del DNA mitocondrial pertenece.

 

9.    En el alineamiento obtenido en el BLAST fíjate en los nucleótidos no emparejadas contando los pares no conectados por líneas verticales. Anota el número (no incluyas los nucleótidos sin resolver N ni las inserciones/deleciones (gaps) señaladas con el símbolo "-").

 

Inicio


 

B. Localización de la secuencia problema en el genoma mitocondrial

 

(a) Mitocondria. (b) Mapa del genoma mitocondrial humano.

 

 

1.      Conéctate a Mitomap, the mitochondrial DNA databank. Entra en el enlace The Annotated Human Mitochondrial DNA Sequence que se encuentra bajo el título General References y haz click en el enlace con el número de acceso de GenBank de la secuencia de referencia del genoma mitocondrial humano.

 

2.      Haz click en el enlace FASTA que se encuentra en la parte superior derecha de la página de GenBank para que se nos muestre la secuencia en este formato. Copia la secuencia completa del DNA mitocondrial (es importante copiar también la primera línea que empieza por el símbolo “>” ya que esto es lo que define el formato FASTA).

 

3.      A continuación vamos a alinear nuestra secuencia inicial con el genoma mitocondrial completo utilizando el programa de alineamiento múltiple de secuencias ClustalW del EBI (European Bioinformatics Institute).

 

4.      Copia en la ventana para introducir datos la secuencia del genoma mitocondrial completo en formato FASTA y a continuación tu secuencia mitocondrial inicial también en este formato. Para ello deberás introducir una línea como encabezamiento de esta secuencia que empiece por el símbolo “>” seguido de una descripción de la secuencia (por ejemplo, >Secuencia_problema1).

 

5.      Acepta las opciones por defecto. Haz click en el botón Submit. La respuesta puede tardar unos minutos. Verás una pantalla de espera hasta que obtengas tus resultados con el alineamiento. En este caso, un asterisco (*) entre las bases indica que existe un nucleótido idéntico en ambas secuencias en esa determinada posición, y un espacio blanco indica la presencia de diferencias. Notarás que la secuencia problema se alinea cerca del extremo de la secuencia de DNA mitocondrial.

 

Inicio

 


 

C. Comparación dos a dos de secuencias de distintos individuos de la especie humana actual

 

1.       Vuelve al programa de alineamiento múltiple ClustalW. Copia y pega en el recuadro para introducir datos la secuencia problema que ya has usado. Llámala ">Secuencia1”.

 

2.       Copia otra secuencia problema del archivo de secuencias del DNA mitocondrial.

 

3.       Dentro de la ventana de datos del ClustalW, añade la nueva secuencia agregándole una primera línea con el nombre “>Secuencia 2”. Asegúrate que la primera línea está en la izquierda del todo.

 

4.       Haz click en el botón Submit y espera los resultados.

 

5.       Compara las secuencias alineadas. Cuenta las bases sin emparejar (sin incluir las Ns) y anótalas.

 

6.       Repite los pasos 1-5 para comparar la secuencia 1 con una tercera secuencia. Anota también el número de diferencias.

 

7.       Recuerda la búsqueda con el BLAST que hiciste anteriormente. ¿Cuántas diferencias anotaste en el paso A.9? La comparación de los humanos modernos debería dar entre 0 y 10 bases no iguales en este fragmento de secuencia.

 

Inicio

 


 

D. Comparación dos a dos del DNA de la especie humana actual

y el DNA del hombre de Neandertal

 

 

1.      Ve al enlace del National Center for Biotechnology Information (NCBI) y selecciona la base de datos de Nucleotides (GenBank) en el menú Search de la parte superior.

 

2.      Introduce las palabras neandertal hypervariable region I en la casilla del buscador. Haz click en el botón Search y espera los resultados.

 

3.      Observa que se obtienen varias secuencias. Entra en la última secuencia de la región hipervariable del DNA mitocondrial neandertal, pues fue la primera que se secuenció y es la homóloga a las que hemos analizado (número de acceso de GenBank AF011222).

 

4.      Comprueba en el informe del Genbank que se trata de la secuencia que buscamos y cópiala en formato FASTA igual que se ha hecho antes.

 

5.      Pega esta secuencia junto con la secuencia problema inicial en el ClustalW, nombra la secuencia "Neandertal" para simplificar el nombre del GenBank y genera un alineamiento de ambas. ¿Cuántas posiciones presentan cambios nucleotídicos entre estas dos secuencias? Compara este número con el número de cambios obtenido entre dos humanos actuales que has alineado antes.

 

Inicio

 


 

E. Comparación dos a dos entre el humano moderno y otras especies próximas de primates

 

wpe23.jpg (51478 bytes)

 

1.      En el GenBank (NCBI) selecciona Genome en el menú Search y escribe en la casilla del buscador el nombre de una especie cercana a la especie humana (Pan troglodytes para el chimpancé, Gorilla gorilla para el gorila, Pan paniscus para el bonobo...) seguido de las palabras mitochondrion complete genome.

 

2.      Accede a las secuencias de cada una de las especies buscadas (chimpancé, orangután...) entrando en el enlace con el número de acceso de GenBank (casilla superior izquierda de la tabla que aparece en la siguiente pantalla) y guarda la región homóloga de la secuencia (que se encuentra hacia el final de la página, entre los nucleótidos 15420 – 15780 aproximadamente. En este caso copiamos la parte de la secuencia que nos interesa a partir del archivo del GenBank porque aquí indica las posiciones.

 

3.      Pon estas secuencias en formato FASTA al pegarlas en el archivo de secuencias añadiendo en cada una en una línea aparte el nombre la especie a la que pertenece (>Chimpance, >Gorilla…). No importa que tengan los números copiados del GenBank en medio.

 

4.      A continuación vamos a alinear cada una de estas secuencias con la secuencia problema inicial utilizando el ClustalW.

 

5.      Analiza el alineamiento de las secuencias. ¿Hay más posiciones diferentes que en la comparación con humanos? ¿Por qué?

 

6.      Repite este análisis con otra especie.

 

Inicio

 


 

 

F. Reconstrucción filogenética de las secuencias de DNA mitocondrial

 

1.      Para hacer un árbol filogenético utilizaremos las secuencias obtenidas hasta ahora pero también tendremos que buscar secuencias adicionales hasta tener al menos:

2 secuencias problema

2 secuencias del hombre de Neandertal

1 secuencia de gorila

1 secuencia de chimpancé

1 secuencia de orangután

Es importante que todas estas secuencias correspondan a la misma región del genoma mitocondrial (hypervariable región I, o D-loop) ya que sino no se podrían alinear entre ellas.

 

2.      También debemos añadir una especie externa como la vaca o el ratón, que actuará como outgroup y nos permitirá enraizar el árbol resultante.

 

3.      Haz un alineamiento múltiple con el ClustalW introduciendo todas estas secuencias a la vez en formato FASTA e inequívocamente identificadas en la ventana de datos de este programa. Esta vez modificaremos los parámetros entrando en el botón More options del STEP3 – Set your Multiple Sequence Alignment Options, donde cambiaremos el Formato a Pearson/FASTA. Si queréis ver el alineamiento tal y como los hemos visto hasta ahora podéis utilizar el ClustalW sin cambiar nada primero y después volver atrás o abrir otra ventana y hacerlo de nuevo con la modificación indicada.

 

4.      Una vez tengamos los resultados veremos que esta vez nos muestra cada secuencia por separado en formato FASTA pero con cambios respecto a cómo las hemos introducido inicialmente. Copiamos el conjunto de todas las secuencias en este formato.

 

5.      Vamos a la herramienta ClustalW – Phylogeny y pegamos las secuencias alineadas en formato FASTA en la ventana de datos. Seleccionaremos el método Neighbor-Joining para hacer el árbol (clustering method), apretamos el botón Submit y esperamos los resultados.

 

6.      En la parte inferior de la página nos muestra el árbol sin enraizar. Podemos ver los valores de distancia si hacemos click en el botón Show distances. En la parte superior tenemos el contenido del archivo con la información del árbol. Copiaremos esta información y la guardaremos en un archivo tipo texto (.txt, podemos utilizar la Libreta o Bloc de Notas). Es importante recordar dónde guardamos el archivo y el nombre que le damos.

 

7.      Abrimos el programa TreeView en el ordenador y abrimos este archivo con la información del árbol filogenético. Este árbol, al igual que el que se nos ha mostrado antes, no está enraizado. Enraízalo definiendo como outgroup la especie más alejada de la filogenia que has obtenido en este apartado (Tree -> Define outgroup, y a continuación Tree -> Root with outgroup).

 

8.      Ahora interpreta correctamente el árbol resultante. ¿Qué concluirías respecto a la cuestión de si el hombre europeo actual surge de la mezcla del hombre de Neandertal con el hombre procedente de la última gran migración africana?

 

9.      Ahora vuelve a la página del ClustalW – Phylogeny y haz de nuevo el árbol seleccionando como clustering method, UPGMA. Esta vez el árbol que se muestra está enraizado. ¿Hay diferencias entre este árbol filogenético y el calculado con el método anterior también basado en distancias?

 

Inicio

 


 

Referencias

Lalueza, Carles (2005). Genes de neandertal. Editorial síntesis

 



ATGCATGCTTAGCCATGATCCAAGGGATCATCGGA