Bioinformática de la diversidad nucleotídica en mamíferos
- Egea Sanchez, Raquel
- Antonio Barbadilla Prados Director/a
- Sonia Casillas Viladerrams Codirector/a
Universidad de defensa: Universitat Autònoma de Barcelona
Fecha de defensa: 28 de julio de 2009
- Julio A. Rozas Liras Presidente/a
- Hernán Dopazo Secretario/a
- David Posada González Vocal
Tipo: Tesis
Resumen
La variación genética es la piedra angular del proceso de evolución biológica. Son las diferencias entre los individuos de una población las que, al magnificarse en el tiempo y el espacio, producirán nuevas poblaciones, especies y toda la diversidad biológica existente. La genética de poblaciones es la ciencia encargada de estudiar la variación genética dentro y entre poblaciones para explicar esta variación en términos de origen, mantenimiento e importancia biológica. Tras la obtención de un número explosivo de secuencias nucleotídicas en distintos genes y especies, se necesitan herramientas bioinformáticas que primero almacenen de forma eficiente y accesible los datos disponibles y, posteriormente, realicen estimas y análisis para la obtención de nueva información biológica. La selección natural es un proceso evolutivo por el que varían las frecuencias de los caracteres hereditarios que contribuyen de forma diferencial a la supervivencia o al éxito reproductivo de los individuos de una población. En este trabajo se ha desarrollado una herramienta Web para la detección de la selección natural a nivel molecular mediante el test de McDonald y Kreitman (MKT) a partir de secuencias nucleotídicas de diferentes clases de regiones genómicas y loci. El sitio Web Standard and Generalized MKT es la primera herramienta que permite la realización del MKT a través de Internet. Permite la realización del MKT estándar y generalizado, esto es, comparando cualquier para de tipos de sitios íntimamente ligados, asumiendo que uno de los dos evoluciona de forma neutra y tratando de detectar la huella de la selección natural en el otro tipo de sitio. El sitio Web también permite la realización de un verdadero test multiloci en el que se pueden analizar varios loci independientes, ya que el test tiene en cuenta la heterogeneidad entre ellos. En segundo lugar, se han optimizado herramientas bioinformáticas de minería de datos para la recopilación, desde bases de datos públicas de secuencias nucleotídicas, de todas las secuencias con las que sea posible estimar la diversidad nucleotídica de cualquier gen de la clase mamíferos, para su posterior incorporación en una base de datos de conocimiento pública (MamPol). MamPol es la primera base de datos de polimorfismo en mamíferos que permite la búsqueda de conjuntos polimórficos en función de sus medidas de diversidad nucleotídica asociadas. También permite comparar valores de diversidad entre distintas especies o grupos taxonómicos y generar distribuciones gráficas de cualquier medida de diversidad. MamPol ofrece varios índices de confianza que, además de permitir filtrar los resultados por la calidad de los datos primarios y de los alineamientos, muestran que el sistema de obtención, tratamiento y análisis de secuencias utilizado y su posterior almacenamiento en una base de datos relacional proporcionan un enriquecimiento considerable en cuanto a los datos de diversidad disponibles. Finalmente, se han realizado dos análisis utilizando los datos obtenidos en los pasos anteriores para probar la hipótesis de que las especies amenazadas tienen significativamente menor diversidad nucleotídica que las especies no amenazadas. Para ello se comparan en primer lugar los niveles medios de diversidad nucleotídica y posteriormente los niveles de diversidad nucleotídica mitocondrial entre taxones en riesgo de extinción y taxones no amenazados. Los resultados muestran que la pérdida de diversidad genética puede ser una de las causas de la extinción de las especies de mamíferos y que el genoma mitocondrial puede seguir usándose como marcador neutro para el estudio del tamaño y la historia de las poblaciones de mamíferos. Además, las herramientas desarrolladas en esta tesis han sido implementadas en la base de datos de polimorfismo de Drosophila (DPDB) y han contribuido a resolver varias cuestiones de la genética de poblaciones fuera de esta tesis doctoral.