Una investigación internacional en la que participa el Instituto de Biología Integrativa de Sistemas (I2SysBio), centro mixto del Consejo Superior de Investigaciones Científicas (CSIC) y la Universidad de Valencia, consigue completar las versiones 4 y 5 del genoma de referencia de la vid (vitis vinifera) en las que se encuentran una gran cantidad de genes relacionados con la respuesta al estrés por plagas, por la falta de agua o genes determinantes de la capacidad aromática de los frutos. La información obtenida permitirá diseñar el viñedo del futuro más resistente al cambio climático que amenaza gravemente a la industria del vino. Estos trabajos han sido publicados en las revistas Horticulture Research y G3 Genes|Genomes|Genetics.
Si bien la secuenciación de la vid se completó, por primera vez, en 2007, esta primera versión y las que le siguieron estaban incompletas, con muchas regiones aún desconocidas. Muchos de estos fragmentos del genoma, que ahora han sido correctamente ensamblados, corresponden a regiones centroméricas y teloméricas (es decir, del centro y los extremos de los cromosomas), que estaban constituidas de un considerable número de repeticiones que hacía difícil su lectura, motivo por el cual no se tenían en versiones anteriores del genoma.
Qué se ha logrado con este nuevo estudio sobre el genoma de la vid
Contar con la mejor versión de un genoma abre las puertas a conocer el 100% de los genes de una especie. Ahora, y gracias a esta investigación, se podrá estudiar la función de todos ellos y se podrá asociar a caracteres de interés para la industria vitivinícola, mediante la utilización de herramientas de la biología computacional. En este sentido, la mejora genética, mediante métodos tradicionales (breeding), también se verá favorecida.
La versión 4 del genoma demostró el pedigrí del cultivo utilizado llamado PN40024. Inicialmente se creía que correspondía a la variedad Pinot Noir, cruzada nueve veces por endogamia, el análisis genómico posterior demostró que era en realidad la variedad Helfnsteiner (un cruce entre Pinot Noir y Schiava Grossa). Esta versión también permitió generar un recurso muy valorado: una anotación de todos los genes del genoma manualmente curada por miembros de la comunidad científica. Con la versión 5 del genoma, podemos decir hoy que tenemos la secuencia completa del genoma de la vid.
Qué tecnología se empleado para descifrar el genoma de la vid
La tecnología empleada se basa en la secuenciación de fragmentos largos (long read sequencing). Se trata de una técnica de secuenciación de ADN que permite secuenciar fragmentos de ADN mucho más largos que los métodos tradicionales de secuenciación de lectura corta. Mientras que la versión 4 utiliza la tecnología estándar de PacBio de secuencias largas, la versión 5 utiliza la tecnología HIFi o de alta fidelidad. Las lecturas HiFi se producen utilizando el modo de secuenciación por consenso circular en los sistemas de lectura larga PacBio. Las lecturas de alta fidelidad proporcionan una alta resolución con una precisión de lectura de una sola molécula del 99,9 %.
Proyecto Cost Grapedia
Los dos trabajos científicos han sido desarrollados en el marco del proyecto Cost Grapedia, una base de datos federativa propuesta como una plataforma de acceso abierto destinada a abordar los desafíos en el acceso y utilización de los datos genéticos, ómicos y de fenotipado relacionados con la vid. José Tomás Matus, investigador del Programa Ramón y Cajal de la Universitat de València y el I2SysBio (CSIC – UV), es el coordinador de esta iniciativa financiada por la Oficina Europea Cost (Cooperation in Science and Technology).