Nuevo sistema para encontrar secuencias de ADN más rapidamente
Especialistas del departamento de ciencias de la computación de la Universidad Carnegie Mellon han desarrollado un procedimiento para rastrear secuencias de ADN en cuestión de minutos, una mejora notable en tanto que ya antes esto requería días.
La tecnología, concebida por Carl Kingsford y Brad Solomon, del Departamento de Biología Computacional, está desarrollada para hallar secuencias de ADN y ARN a través de una nueva estructura de datos de indexación, llamada Sequence Bloom Trees, o bien SBT. El Instituto Nacional de Salud (NHI por sus iniciales en inglés) tiene una base gigantesca de datos de secuencias, en conjunto unos 3 mil billones de pares de bases que los especialistas usan para conseguir información sobre los procesos biológicos básicos relacionados a posibles curas para el cáncer.
Se precisarían miles y miles de discos duro para guardar todas y cada una esas secuencias. Y buscar las deseadas, por lo común secuencias de cincuenta a doscientos pares bases, entre los miles y miles de billones, resulta una labor enorme.
“La base de datos contiene un número inestimable de conocimientos que todavía no hemos descubierto – asegura Kingsford –. El primordial inconveniente es que es realmente difícil efectuar una búsqueda”.
El SBT marcha de igual forma que el catálogo de una biblioteca. En un primer nivel el sistema comprueba si la secuencia de ADN está en la base de datos. Si es de esta forma, la busca prosigue dividiendo todo el índice en 2 mitades y determinando en cuál de ellas se halla. Entonces vuelve a dividirlo y de este modo consecutivamente hasta el momento en que se hallan las secuencias deseadas.
Kingsford y Solomon probaron su técnica sobre un fichero de dos mil seiscientos cincuenta y dos análisis de sangre, mama y cerebro, cada uno de ellos de los que de manera frecuente poseen más de mil millones de pares de bases de ARN. El SBT completaba la labor en unos veinte minutos promedio, un avance de enormes proporciones teniendo presente que a las técnicas existentes hasta la data, como SRA-BLAST y STAR, les llevaría dos con dos días y novecientos veintiuno días, respectivamente. Por si no fuera suficiente con lo anterior se pueden efectuar hasta doscientos.000 exploraciones simultáneas. Los estudiosos de diferentes áres pueden hacer empleo de SBT en tanto que se trata de un software de código abierto.
El trabajo se ha publicado en la revista Nature.