banner
Centro de Noticias
Empresa integral

Identificación de cepas de Bacillus mediante MALDI TOF MS mediante un enfoque geométrico

Jul 14, 2023

Scientific Reports volumen 5, número de artículo: 16989 (2015) Citar este artículo

7500 Accesos

33 citas

1 altmétrica

Detalles de métricas

La identificación de microorganismos mediante espectrometría de masas MALDI TOF se basa en la comparación del espectro de masas del organismo estudiado con el de las cepas de referencia. Es un método rápido y fiable. Sin embargo, las bases de datos y programas comerciales están diseñados principalmente para la identificación de cepas clínicamente importantes y solo pueden usarse para modelos particulares de espectrómetro de masas. La necesidad de plataformas abiertas y bases de datos de referencia es obvia. En este estudio describimos un enfoque geométrico para la identificación de microorganismos mediante espectros de masas y demostramos sus capacidades analizando 24 cepas pertenecientes al grupo Bacillus pumilus. Este método se basa en representar espectros de masas como puntos en un espacio multidimensional, lo que nos permite utilizar distancias geométricas para comparar los espectros. La delimitación de microorganismos realizada mediante un enfoque geométrico se correlaciona bien con los resultados del análisis filogenético molecular y la agrupación utilizando Biotyper 3.1. Los tres métodos utilizados nos permitieron dividir de manera confiable las cepas en dos grupos correspondientes a especies estrechamente relacionadas, Bacillus pumilus y Bacillus altitudinis. El método desarrollado por nosotros se implementará en una interfaz web diseñada para utilizar bases de datos de referencia abiertas para la identificación de microorganismos. Los datos están disponibles en http://www.bionet.nsc.ru/mbl/database/database.html.

Al estudiar cepas bacterianas aisladas de ambientes extremos, requerimos una identificación rápida y confiable de cepas bacterianas, incluidas las del género Bacillus. El género Bacillus contiene bacterias grampositivas aeróbicas o anaeróbicas facultativas en forma de bastón que forman esporas intracelulares. Incluye más de 80 especies válidas1. Los representantes de este género abundan en el suelo, el aire y el agua y se utilizan ampliamente como fuente de enzimas industriales para las industrias alimentaria, textil y química2. También se utilizan como huéspedes de expresión de genes recombinantes3, así como fuente de genes recombinantes4. Las cepas de Bacillus son prometedoras para la agricultura como rizobacterias promotoras del crecimiento vegetal5 y para su uso en sistemas de descontaminación6,7.

En los últimos 30 años se revisó sustancialmente la sistemática del género. Algunas especies fueron aisladas en nuevos géneros: Alicyclobacillus, Paenibacillus, Aneurinibacillus, Brevibacillus, Halobacillus, Virgibacillus, Filobacillus y Jeotgalibacillus. Además, el género Bacillus contiene varios grupos de especies estrechamente relacionados, cuya delimitación es difícil. Por ejemplo, el grupo Bacillus cereus incluye Bacillus cereus, Bacillus anthracis y Bacillus thuringiensis, que son genéticamente muy similares, pero sin embargo se consideran especies separadas debido a su diferente patogenicidad8. Otro ejemplo es el grupo Bacillus subtilis, que contiene la especie Bacillus subtilis subsp. subtilis, Bacillus amyloliquefaciens, Bacillus licheniformis, Bacillus atrophaeus, Bacillus mojavensis, Bacillus vallismortis, Bacillus subtilis subsp. spizizenii y Bacillus sonorensis. Las secuencias del gen 16S rRNA de estas especies tienen más del 99% de similitud de secuencia, por lo que no se pueden distinguir basándose únicamente en ella9. Se aisló una nueva especie, Bacillus safensis, de B. pumilus basándose en la secuencia del gen gyrB10 y se describieron tres especies más utilizando el enfoque de taxonomía polifásica: Bacillus altitudinis, Bacillus stratosphaericus y Bacillus aerophilus11. Estas especies tienen secuencias del gen 16S rRNA estrechamente relacionadas y forman el grupo B. pumilus12.

Los métodos clásicos de identificación de microorganismos, como las pruebas bioquímicas y la secuenciación de ADN, requieren mucho tiempo y trabajo. El enfoque desarrollado más recientemente que utiliza espectrometría de masas MALDI TOF es simple y rápido. Se basa en la comparación del espectro de proteínas de la muestra estudiada con una base de datos de espectros de referencia13. Varios estudios demostraron una alta reproducibilidad de este método siempre que se utilicen protocolos estándar14,15,16,17. Se sabe que la precisión de la identificación tolera diferentes condiciones de crecimiento17,18,19.

La aplicación eficaz del enfoque de espectrometría de masas requiere una base de datos de referencia completa, así como un software específico para comparar espectros. Actualmente hay varias plataformas comerciales disponibles: Biotyper (Bruker Daltonicks), Saramis (Shimadzu), Microbelynx (Waters Corporation) y Andromas. Estas plataformas están diseñadas para modelos concretos de espectrómetros de masas y son bastante caras. También están orientados al diagnóstico clínico y contienen especies y cepas predominantemente patógenas. Debido a estas limitaciones, los grupos de investigación tienen que diseñar sus propias bases de datos, algoritmos matemáticos y software “internos”. Algunos productos comerciales, como Statgraphics Plus 5.1 (Statpoint Technologies) y BioNumerics 6.0 (Applied-Maths) permiten crear bases de datos "internas", pero se requieren plataformas abiertas que incluyan bases de datos completas por el usuario y software para análisis de espectros de masas para un desarrollo eficaz. del campo20.

Uno de los primeros intentos de crear una base de datos de este tipo fue BGP-database21 (http://bgp.sourceforge.net). Otro ejemplo es el banco Spectra (http://www.spectrabank.org), que es una base de datos de listas masivas de características de especies o cepas. Actualmente contiene unos 200 ejemplares. Las listas de masas características se pueden comparar utilizando SPECLUST22, que realiza análisis de conglomerados mediante la construcción de un dendrograma. Sin embargo, no puede realizar búsquedas en bases de datos y no se ajusta a la intensidad máxima relativa.

Los métodos geométricos que representan datos fuente como puntos en un espacio multidimensional se utilizan ampliamente para datos de espectrometría de masas. Se aplican principalmente en el análisis de conglomerados y la representación gráfica de la división de espectros en grupos utilizando métodos como PCA y MDS23,24. Las distancias métricas, como las distancias euclidianas, se pueden utilizar como criterio para comparar espectros desconocidos con bases de datos. Por ejemplo, se propusieron las distancias de Hamming23 y Mahalanobis25.

Dado que nuestro principal objetivo es desarrollar una plataforma para una base de datos abierta para la identificación de microorganismos, los algoritmos matemáticos deben ser sencillos y no requerir muchos cálculos, pero al mismo tiempo deben ser muy precisos. Usamos el siguiente algoritmo implementado usando el programa JACOBI-4 desarrollado en ICiG SB RAS26: (1) Un conjunto de datos representados como (m/z; intensidad) se transfiere en un plano de coordenadas (x; y), donde xi son discretos. con un intervalo específico, yi se calcula para cada nodo xi de acuerdo con la fórmula de la curva de pico, que permite representar el espectro como un vector en un espacio multidimensional y calcular un centroide para el conjunto de vectores para los microorganismos probados. Esta transformación permite aplicar todos los métodos geométricos; (2) Se calcula una matriz de distancias euclidianas y coeficientes de Jaccard (JC) que representan medidas de disimilitud/similitud de espectros para los vectores obtenidos. El valor de 1 − JC es una métrica27 y por tanto es adecuada para nuestros objetivos; (3) Se utilizó el método de Coordenadas Principales (PCo) y la construcción de dendrogramas para realizar análisis de conglomerados y visualización de datos.

El objetivo de este estudio fue probar si el enfoque presentado en este estudio podría usarse para identificar especies estrechamente relacionadas. Como ejemplo, tomamos un conjunto de cepas del grupo B. pumilus que tenían más del 98% de similitud de secuencia para el gen 16S rRNA. Para las 24 cepas estudiadas, obtuvimos series de espectros de masas y calculamos centroides para el análisis de conglomerados. Estos datos se compararon con los resultados de la secuenciación del gen 16S rRNA y el análisis del programa MALDI Biotyper 3.1 (Bruker Daltonics). Los centroides obtenidos se utilizaron como base de datos de referencia para la identificación de dos réplicas de las cepas estudiadas. La identificación se basó en distancias euclidianas y se utilizó JC como medidas de similitud.

Como no pudimos identificar de manera confiable las cepas utilizando la base de datos GenBank (http://blast.ncbi.nlm.nih.gov/Blast.cgi) basada en secuencias del gen 16S rRNA, las comparamos con secuencias de cepas tipo del grupo Bacillus pumilus. : B. pumilus (AY456263), B. altitudinis (AJ831842) y B. safensis (AB681259) (Fig. 1a). B. stratosphaericus y B. aerophilus se excluyeron del análisis porque sus secuencias de ARNr 16S eran idénticas a las de B. altitudinis y estas cepas no estaban en los catálogos de cepas microbianas. En nuestro conjunto de datos se detectaron dos grupos denominados grupos A y P con el soporte de arranque de 96. El grupo A incluía cepas aisladas de manantiales termales de Kamchatka (KT), rizosfera de plantas superiores del oblast de Novosibirsk (RG), así como como la cepa tipo B. altitudinis (AJ831842). El grupo P contenía cepas de lagos salinos del oblast de Novosibirsk (NR), depósitos minerales complejos del oblast de Kemerovo y cepas tipo de B. pumilus (AY456263) y B. safensis (AB681259). Dentro de los grupos, las cepas estaban estrechamente relacionadas, excepto las cepas Cd1 y KH2, que formaron un único subgrupo dentro del grupo A con el soporte de arranque de 73. La visualización de las secuencias en BioEdit nos permitió encontrar seis sustituciones de marcadores (Fig. 1b ) que distinguió estos grupos. Otras sustituciones no fueron informativas. Las secuencias de los genes 16S rRNA de las cepas aisladas de las fuentes termales de Kamchatka (KT) y de la rizosfera de plantas superiores del oblast de Novosibirsk (RG) eran idénticas a B. altitudinis AJ831842, mientras que las de las cepas de los lagos salinos de Novosibirsk El oblast (NR) y los depósitos minerales complejos del oblast de Kemerovo (KR) no diferían de B. pumilus (AY456263). B. safensis (AB681259) se diferenciaba por una única sustitución de nucleótido de B. pumilus (AY456263), lo que nos permitió identificar las cepas NR y KR como B. pumilus (Fig. 1b). Las cepas KH2 y Cd1 tenían patrones idénticos de estas seis sustituciones de marcadores a la cepa tipo B. altitudinis (AJ831842) y al resto del grupo A. La secuencia de la cepa tipo B. safensis (AB681259) difería de la de B. pumilus (AY456263) en una sustitución de marcador. Con base en esto, identificamos a los representantes del grupo A como B. altitudinis y del grupo P, a B. pumilus.

Análisis filogenético.

( a ) Árbol filogenético construido utilizando el algoritmo de Máxima Verosimilitud para las secuencias del gen 16S rRNA. Los números sobre las ramas indican soporte de arranque. Las distancias de secuencia representan el número de sustituciones por 1000 nucleótidos. Se utilizaron las siguientes secuencias de cepas tipo para comparación: B. pumilus (AY456263), B. safensis (AB681259) y B. altitudinis (AJ831842); B. licheniformis (EF433410) se utilizó como grupo externo. (b) Fragmentos de la alineación que contienen sustituciones de marcadores. Los números en la línea inferior indican sus posiciones en la secuencia de B. altitudinis (AJ831842).

Los espectros de masas se obtuvieron y procesaron como se describe en la sección Materiales y métodos. Para determinar la significancia estadística se tomaron 12 muestras para cada cepa y se tomaron tres espectros independientes para cada muestra. La mayoría de los espectros obtenidos contenían de 50 a 60 picos de masa en el rango de 2 a 10 kDa. La matriz de distancias euclidianas entre centroides, transformada mediante el análisis de coordenadas principales, se visualizó como dos gráficos bidimensionales en las coordenadas PCo1, PCo2 y PCo1, PCo3 (Fig. 2a, b). En ambas proyecciones, los dos grupos se diferencian por la posición en el eje PCo1 que proporciona mayor cantidad de información. Las cepas de B. altitudinis se clasificaron en el grupo A y las cepas de B. pumulus, en el grupo P. Se utilizó la prueba t de Welsh para verificar la separación de los centroides de deformación en los grupos A o P (t = 11,16; p < 10-6; df = 22). La distancia entre los centros de las muestras A y P a lo largo del eje PCo1 fue 2,4 y las desviaciones estándar para estas muestras fueron 0,57 y 0,39, respectivamente. También debemos señalar que el grupo P tuvo mayor varianza a lo largo de los ejes PCo2 PCo3 en comparación con el grupo A, lo que indica que tiene mayor heterogeneidad. El análisis de conglomerados se realizó mediante la construcción de un dendrograma mediante el método de Ward utilizando las 23 coordenadas obtenidas transformando la matriz de distancias euclidianas (Fig. 2c). A modo de comparación, se muestra un dendrograma filoproteómico creado con Biotyper 3.1 (Fig. 2d). Ambos dendrogramas demuestran dos grupos que corresponden a los grupos A y P en el gráfico (Fig. 2a, b) y el árbol del gen 16S rRNA (Fig. 1a).

Análisis filoproteómico.

Posición de los centroides de los espectros en el plano de coordenadas principales: (a) PCo1, PCo2; (b) PCo1, PCo3. Las proporciones de la varianza total para esos ejes fueron 29,2% para PCo1, 13,2% para PCo2 y 10,4% para PCo3, lo que suma 52,9%. Los grupos A y P están enmarcados. Dendrogramas construidos en base a las distancias entre los centroides de los espectros mediante el método de Ward (c) y mediante la agrupación de MSP en Biotyper 3.1 (d). Las cepas se dividieron en dos grupos que corresponden a B. altitudinis (A) y B. pumilus (P); (e) Experimento de laboratorio húmedo: identificación de los centroides estudiados para dos réplicas biológicas utilizando JC, distancias euclidianas y Biotyper 3.1 (criterio de corte - 2.0, que Bruker define como "identificación segura de género, identificación probable de especies"). (e) Experimento de laboratorio húmedo: identificación de los centroides estudiados para dos réplicas biológicas utilizando JC, distancias euclidianas y Biotyper 3.1 (criterio de corte - 2.0, que Bruker define como "identificación segura de género, identificación probable de especies"). Coincidencia de nivel de cepa: caso en el que el centroide de la muestra analizada y el centroide más cercano en la base de datos pertenecen a la misma cepa.

Realizamos un análisis SPECLUST que arrojó una lista de picos comunes y específicos de grupo. Se encontraron ocho picos en todas las cepas estudiadas: 3048, 3621, 4914, 5208, 6622, 7242, 7729 y 9830 Da. El grupo A se distinguió por la presencia del pico de 6671 Da, mientras que el grupo P tuvo tres picos característicos: 3765, 4589 y 6870 Da. Los espectros de masas promedio visualizados en vista de gel demuestran que los grupos A y P difieren por la presencia de picos específicos del grupo, así como por sus intensidades relativas (Fig. 3). Por ejemplo, los picos de 4914, 6622, 7729 y 9830 Da tienen intensidades más altas en el grupo A. Varios picos de alta intensidad en 6032, 6048, 6063, 6099 y 6117 Da no demostraron especificidad de grupo. Las cepas de B. altitudinis tuvieron solo el pico de 6099 Da, mientras que una cepa de B. pumilus puede tener cualquiera de estos picos. Probablemente esta sea la causa de la alta dispersión a lo largo de los ejes PCo2 y PCo3. Sugerimos que estos picos representan una única proteína que es altamente polimórfica en el grupo B. pumilus.

Vista en gel de espectros de masas promediados.

Los picos comunes se indican con asteriscos; picos característicos del grupo A, por (a); picos característicos del grupo P, por (p). Se enmarca un grupo de picos de alta intensidad en el rango de 6032-6117 Da.

La validación cruzada se realizó mediante dos métodos: excluyendo uno de cada diez conjuntos aleatorios de muestras de espectros y excluyendo todos los espectros de una cepa aleatoria. Para el primer método, los espectros se asignaron correctamente a los centroides en el 96,7% de los casos. La precisión de la determinación del grupo (A o P) fue del 99,9%.

Los centroides obtenidos se utilizaron como base de datos de referencia y como conjunto de datos de entrenamiento para calcular un criterio de corte para la identificación de las cepas estudiadas. El valor del criterio de corte JC fue 0,278 para el grupo A y 0,158 para el grupo P y para las distancias euclidianas, 3,35 y 3,01, respectivamente. Realizamos dos experimentos independientes en laboratorio húmedo para la verificación del método. La Figura 2e muestra los resultados de la verificación de cepas utilizando nuestra base de datos de referencia y Biotyper 3.1. La precisión de la identificación fue del 100% para las distancias euclidianas y del 98% para JC. Debemos señalar que el único espécimen no identificado estaba en el límite de la corrección de la identificación; su puntuación fue de 0,277, mientras que el valor de corte para ese grupo fue de 0,278. También se han tenido en cuenta las coincidencias a nivel de deformación, cuando el centroide de la muestra analizada y el centroide más cercano en la base de datos se obtuvieron para una misma deformación. La tasa de estas coincidencias fue del 33,3% para JC y Biotyper. Para la distancia euclidiana fue del 20,8%.

El perfil de proteínas mediante espectrometría de masas MALDI TOF demostró ser confiable para la identificación de especies estrechamente relacionadas, incluidas Bacillus spp.28,29,30,31. Sin embargo, actualmente está restringido por la ausencia de bases de datos y software gratuitos y por el hecho de que las bases de datos comerciales están orientadas principalmente a cepas encontradas en la práctica clínica. Sólo el fabricante puede agregar nuevos datos a estas bases de datos. Por tanto, la creación de plataformas y bases de datos abiertas es una tarea urgente.

Este objetivo requiere un método simple y confiable con alta fidelidad que permita utilizar un amplio espectro de técnicas de análisis. En este estudio, proponemos un algoritmo para representar espectros de masas como vectores en un espacio euclidiano multidimensional. Se pueden utilizar muchos métodos geométricos con este algoritmo. Elegimos la distancia euclidiana como el enfoque más simple y directo para el espacio euclidiano. Como alternativa, también implementamos coeficientes de Jaccard, que permiten calcular la similitud de los espectros. Además, 1 − JC es una distancia geométrica, lo que la hace adecuada para métodos geométricos como PCo.

Como modelo para probar este enfoque, utilizamos 24 cepas estrechamente relacionadas del grupo B. pumilus de la colección del Instituto de Citología y Genética SB RAS, que tenían más del 98% de similitud de secuencia para el gen 16S rRNA. Las cepas estudiadas se aislaron de varios hábitats extremos en varias regiones de Rusia, incluidos manantiales termales, lagos salinos, depósitos minerales complejos, etc. Para estas especies encontramos picos característicos en los espectros de masas y sustituciones de nucleótidos características en el gen 16S rRNA. Se utilizaron secuencias de ARNr 16S para validar los resultados del análisis de espectrometría de masas. Los centroides de los espectros de masas de las cepas estudiadas se separaron en dos grupos, lo que fue confirmado por la prueba t de Welsh, incluso si solo se utiliza la primera coordenada de la matriz PCo (PCo1). Estos grupos corresponden a los dos grupos detectados en el árbol filogenético. El dendrograma construido mediante el método de Ward utilizando las 23 coordenadas también arroja resultados similares. Realizamos un análisis adicional de los datos de espectrometría de masas utilizando Biotyper 3.0 como verificación adicional. Los tres métodos utilizados nos permitieron distinguir de manera confiable entre dos grupos que corresponden a dos especies, B. pumilus (P) y B. altitudinus (A).

La base de datos de referencia obtenida se utilizó para la identificación de los microorganismos estudiados mediante experimentos de laboratorio húmedo. La precisión de la identificación fue del 98% para JC y del 100% para distancias euclidianas. El análisis de Biotyper 3.1 tuvo una precisión de identificación del 100% cuando se utilizó 2.0 como puntuación de corte, que Bruker define como "identificación segura de género, identificación probable de especies". La puntuación de la cepa KG16(3) no identificada para el análisis JC se ubicó en el límite del valor de corte para el grupo A. En este estudio tuvimos valores de corte separados para cada especie, porque los centroides del grupo A eran significativamente más compactos en el espacio geométrico 1 - JC que los centroides del grupo P (datos no mostrados). Por tanto, la puntuación de corte para el grupo A fue más estricta (0,278) que para el grupo P (0,158). Si se promediaron los valores de corte para los dos grupos, el algoritmo JC tuvo una precisión de identificación del 100%. Además, una mayor tasa de coincidencias a nivel de deformación para JC que para la distancia euclidiana puede ofrecer un mejor rendimiento de este método para la identificación del nivel de deformación.

Por lo tanto, demostramos que el enfoque propuesto en este estudio es adecuado para la identificación de especies estrechamente relacionadas en función de sus espectros de masas utilizando B. pumilus y B. altitudinis como modelo. La representación teórica de los espectros de masas como vectores en el espacio euclidiano permite utilizar un número prácticamente ilimitado de coordenadas para cada centroide, lo que nos permite utilizar tanto listas de picos como espectros de masas sin procesar que describen el espectro como una curva como datos de origen. Nos permitirá tener en cuenta la forma de los picos y abandonar el algoritmo de picos. Los centroides, las distancias euclidianas y las descripciones de las deformaciones están disponibles en Internet: http://www.bionet.nsc.ru/mbl/database/database.html.

De la colección de microorganismos extremófilos de ICiG SB RAS seleccionamos 24 cepas que fueron identificadas como pertenecientes al grupo B. pumilus según sus características morfológicas y bioquímicas. Este grupo contenía cepas aisladas de ambientes extremos de varias regiones de Rusia, incluidas fuentes termales, lagos salinos, depósitos minerales complejos, etc. (Tabla 1).

Se amplificó un fragmento del gen ribosomal 16S rRNA utilizando los cebadores bacterianos universales 16S-8-fB (5′-AGRGTTGATCCT GGCTCA-3′) y 16S-1350-rB (5′-GACGGCGGTGTGTACAAG-3′) en un volumen de 30 microlitros en un termociclador MyCycler (BioRad) que utiliza ADN polimerasa TaqSE (SibEnzyme, Novosibirsk) según las instrucciones del fabricante. Los productos amplificados se purificaron utilizando el KIT de purificación por PCR (Fermentas). La secuenciación de ADN se realizó utilizando el kit BigDye terminator 3.1 (Applied Biosystems) de acuerdo con las instrucciones del fabricante en SB RAS Genomics Core Facility. Las secuencias se analizaron y editaron utilizando el programa BioEdit (//www.mbio.ncsu.edu/BioEdit/bioedit). Se utilizaron las siguientes secuencias de cepas tipo para el análisis filogenético: B. pumilus (AY456263), B. altitudinis (AJ831842) y B. safensis (AB681259); B. licheniformis (EF433410) se utilizó como grupo externo. Las secuencias fueron alineadas por ClustalW232 y los árboles filogenéticos se construyeron utilizando el algoritmo de Máxima Verosimilitud33 implementado en MEGA 6.034. Todas las secuencias de ARNr 16S obtenidas por nosotros se depositaron en GenBank (Tabla 1).

Se tomaron doce colonias separadas para cada cepa. Las colonias se transfirieron a un tubo Eppendorf de 1,5 ml mediante un asa de transferencia microbiana y se resuspendieron en 300 microlitros de agua desionizada. Para la inactivación de células bacterianas se añadieron 900 microlitros de etanol; Las células se resuspendieron y sedimentaron mediante centrifugación durante 2 minutos a 15600 g. Se eliminó el sobrenadante y el sedimento se secó durante 5 minutos en un concentrador de vacío Eppendorf. Las paredes celulares bacterianas se destruyeron añadiendo 50 microlitros de ácido fórmico al 70%. Las proteínas se extrajeron mediante la adición de 50 microlitros de acetonitrilo seguido de agitación vigorosa. La mezcla se centrifugó durante 2 minutos a 15600 gy el sobrenadante se transfirió a un tubo limpio para análisis de espectrometría de masas.

Para el análisis de espectrometría de masas, se transfirió 1 microlitro de extracto proteico a una placa de acero inoxidable y se dejó secar a temperatura ambiente. Posteriormente se añadió 1 microlitro de matriz (6 mg/ml de ácido α-ciano-4-hidroxicinámico en solución de acetonitrilo/agua/ácido trifluoroacético (50:47,5:2,5, v/v)). Los espectros se obtuvieron utilizando un espectrómetro de masas Ultraflex III MALDI TOF / TOF (Bruker Daltonics) en modo lineal positivo con una frecuencia de láser de 100 Hz en el rango de masa de 2000-20000 Da. El voltaje en el electrodo acelerador fue de 25 kV; tensión IS2, 23,45 kV; voltaje de lente, 6 kV; no se produjo ningún retraso en la extracción.

Para cada colonia obtuvimos tres espectros sumando 500 pulsos de láser (5 × 100 pulsos de varias posiciones de la célula objetivo). La calibración se realizó utilizando proteínas de Escherichia coli: RL36 - 4365,3 Da, RS22 - 5096,8 Da, RL34 - 5381,4 Da, RL32 - 6315,0 Da, RL29 - 7274,5 Da, RS19 - 10300,1 Da.

Se obtuvieron un total de 36 espectros para cada cepa. Se realizó una inspección visual para todos los espectros además del análisis por computadora.

El aplanamiento, la extracción de la línea base y la selección de picos para los espectros de masas obtenidos se realizaron utilizando mMass35 (www.mmass.org).

Las listas de masas obtenidas en mMass se procesaron utilizando el siguiente algoritmo:

Un conjunto de espectros se representa como {(xj, yj), j = 1…Lm; m = 1…M}, donde xj es el número de pico, yj es la función de la intensidad de la señal, Lm es el número de picos para cada espectro, M es el número de espectros. Los espectros se dividen en clases Q.

Cada espectro se proyecta en una cuadrícula uniforme en la coordenada x. Para cada espectro, la cuadrícula tiene los mismos límites (Xbeg, Xend), número de puntos N y ancho medio de ventana K medido en puntos. Los parámetros Xbeg, Xend, N y K los establece el usuario. El espaciado de la cuadrícula h y el tamaño de la mitad del ancho w se calculan en función de los parámetros de entrada:

Se debe cumplir la siguiente condición para cada espectro: Xbeg < Xmin − w; Xend > Xmax + w, donde Xmin y Xmax son los valores mínimo y máximo de la coordenada x para cada espectro.

Para cada punto de malla i encontramos todas las coordenadas x xj en el rango [ih − w, ih + w] con intensidades de señal yj distintas de cero. Para cada señal enmarcada, su impacto en el punto i se calcula mediante la fórmula:

donde f(x) = 1 − 3x2 + 2|x|3 cuando |x| ≤ 1 y f(x) = 0 en caso contrario.

El impacto resumido zi en el punto i se calcula mediante la fórmula:

para cada xj dentro de la ventana [ih − w, ih + w], donde S es el método de combinación (suma, promedio, máximo). Como resultado de este algoritmo, se obtuvieron vectores de tamaño N para cada espectro.

En este trabajo utilizamos los siguientes parámetros: Xbeg = 1000; Xend = 15000; norte = 14000; K = 5; El método de combinación fue promediar.

Cuando se proyectaron los espectros en la cuadrícula, se calcularon los centroides para cada una de las clases Q. Se calculó y procesó una matriz de distancias euclidianas entre todos los centroides mediante el análisis de coordenadas principales (PCo), lo que nos permitió representar todos los centroides de clase como puntos en un espacio euclidiano multidimensional con una dimensión no mayor que Q − 1. El criterio t de Welsh fue utilizado para validar los grupos estudiados en el gráfico PCo. Los dendrogramas se construyeron utilizando el método de Ward mediante el programa PAST36.

Los coeficientes de Jaccard se calculan según la fórmula37:

donde x = {xi : xi ≥ 0}, y = {yi : yi ≥ 0} son representaciones vectoriales de espectros.

Las frecuencias máximas se analizaron utilizando SPECLUST con el procedimiento ≪pico en común≫. La búsqueda se realizó en el rango de 2 a 10 kDa, lo que proporciona la reproducibilidad de pico óptima con el valor del parámetro "Ancho en puntuación de coincidencia de pico" de 5 Da. Además, los espectros se analizaron visualmente.

Además, se generaron "espectros principales" (MSP) en Biotyper 3.1 para los espectros de masas obtenidos y se construyó un diagrama filoproteómico utilizando parámetros estándar18.

Para los experimentos de laboratorio húmedo, todas las cepas estudiadas se cultivaron en las mismas condiciones que para la muestra de entrenamiento (Tabla 1). Para la espectrometría de masas tomamos tres réplicas para cada muestra, un espectro por cada réplica. Los centroides de las muestras se calcularon como se describe en la sección Análisis filoproteómico de datos de espectrometría de masas.

El objetivo de los experimentos era asignar cada espécimen analizado a los grupos A o P, o a una especie separada. Los radios de corte del grupo i (A o P) se calcularon utilizando la siguiente fórmula38:

donde Xi es el conjunto de i centroides; d(x, y) es la distancia entre los espectros x e y.

Un centroide de la muestra analizada pertenece a la "zona de atracción" del grupo i si su distancia de al menos un centroide de este grupo no excede Radi. Si el espécimen pertenece a una o más "zonas de atracción" de diferentes grupos, se asigna al grupo del centroide más cercano. Si un ejemplar no pertenece a la “zona de atracción” de ningún grupo de la base de datos, se trata como una especie desconocida.

Cómo citar este artículo: Starostin, KV et al. Identificación de cepas de Bacillus mediante MALDI TOF MS mediante enfoque geométrico. Ciencia. Rep. 5, 16989; doi: 10.1038/srep16989 (2015).

Blackwood, KS, Turenne, CY, Harmsen, D. y Kabani, AM Reevaluación de objetivos basados ​​en secuencias para la identificación de especies de bacilos. Revista de Microbiología Clínica 42, 1626–1630 (2004).

Artículo CAS Google Scholar

Schallmey, M., Singh, A. & Ward, OP Desarrollos en el uso de especies de bacilos para la producción industrial. Revista canadiense de microbiología 50, 1–17 (2004).

Artículo CAS Google Scholar

Variar, PS et al. Bacillus megaterium: de simple bacteria del suelo a huésped de producción de proteínas industriales. Microbiología y biotecnología aplicadas 76, 957–967 (2007).

Artículo CAS Google Scholar

Pan, J., Huang, Q. y Zhang, Y. Clonación de genes y expresión de una serina proteasa alcalina con función depilatoria de bacillus pumilus. Microbiología actual 49, 165–169 (2004).

Artículo CAS ADS Google Scholar

Sunar, K., Dey, P., Chakraborty, U. y Chakraborty, B. Eficacia del biocontrol y actividad promotora del crecimiento vegetal del bacillus altitudinis aislado de las colinas de Darjeeling, India. Revista de microbiología básica 55, 91–104 (2015).

Artículo CAS Google Scholar

Das, K. & Mukherjee, AK Eficiencia de biodegradación del petróleo crudo de cepas de bacillus subtilis y pseudomonas aeruginosa aisladas de un suelo contaminado con petróleo del noreste de la India. Tecnología de biorecursos 98, 1339–45 (2007).

Artículo CAS Google Scholar

Dawkar, VV, Jadhav, UU, Jadhav, SU y Govindwar, SP Biodegradación del tinte textil disperso marrón 3rel por bacillus sp. Vus. Revista de Microbiología Aplicada 105, 14-24 (2008).

Artículo CAS Google Scholar

Rasko, DA, Altherr, MR, Han, CS y Ravel, J. Genómica del grupo de organismos bacillus cereus. Revisiones de microbiología FEMS 29, 303–29 (2005).

CAS PubMed Google Académico

Jeyaram, K. y col. Diferenciación distintiva de especies estrechamente relacionadas del grupo bacillus subtilis con importancia industrial. Revista de métodos microbiológicos 87, 161–164 (2011).

Artículo CAS Google Scholar

Satomi, M., La Duc, MT y Venkateswaran, K. Bacillus safensis sp.nov., aislado de naves espaciales y superficies de instalaciones de ensamblaje. Revista internacional de microbiología sistemática y evolutiva 56, 1735-1740 (2006).

Artículo CAS Google Scholar

Shivaji, S. y col. Bacillus aerius sp. nov., bacillus aerophilus sp. nov., bacilo estratosférico sp. nov. y bacilo altitudinis sp. nov., aislado de tubos criogénicos utilizados para recolectar muestras de aire de grandes altitudes. Revista internacional de microbiología sistemática y evolutiva 56, 1465–1473 (2006).

Artículo CAS Google Scholar

Liu, Y. et al. Diversidad filogenética del grupo bacillus pumilus y el ecotipo marino revelado mediante análisis de secuencia multilocus. MÁS UNO 8, e80097 (2013).

Artículo CAS ADS Google Scholar

Wilkins, C., Lay, J. (eds) Identificación de microorganismos mediante espectrometría de masas (John Wiley & Sons, Inc., 2006).

Wang, Z., Russon, L., Li, L., Roser, DC y Long, SR Investigación de la reproducibilidad espectral en el análisis directo de proteínas bacterianas mediante espectrometría de masas de tiempo de vuelo de ionización/desorción láser asistida por matriz. Comunicaciones rápidas en espectrometría de masas: RCM 12, 456–64 (1998).

3.0.CO;2-U" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291097-0231%2819980430%2912%3A8%3C456%3A%3AAID-RCM177%3E3.0.CO%3B2-U" aria-label="Article reference 14" data-doi="10.1002/(SICI)1097-0231(19980430)12:83.0.CO;2-U">Artículo CAS ADS Google Scholar

Mellmann, A. y col. Evaluación de la espectrometría de masas de tiempo de vuelo, ionización y desorción láser asistida por matriz en comparación con la secuenciación del gen 16s rrna para la identificación de especies de bacterias no fermentadoras. Revista de microbiología clínica 46, 1946–54 (2008).

Artículo CAS Google Scholar

Mellmann, A. y col. Alta reproducibilidad entre laboratorios de la identificación de especies de bacterias no fermentadoras basada en espectrometría de masas por desorción, ionización y tiempo de vuelo asistida por matriz. Revista de Microbiología Clínica 47, 3732–3734 (2009).

Artículo CAS Google Scholar

Seibold, E., Maier, T., Kostrzewa, M., Zeman, E. y Splettstoesser, W. Identificación de francisella tularensis mediante espectrometría de masas de tiempo de vuelo, desorción, ionización y desorción láser asistida por matriz de células completas: rápida, confiable y robusta y una diferenciación rentable a nivel de especies y subespecies. Revista de Microbiología Clínica 48, 1061–1069 (2010).

Artículo CAS Google Scholar

Freiwald, A. & Sauer, S. Clasificación filogenética e identificación de bacterias mediante espectrometría de masas. Protocolos de la naturaleza 4, 732–42 (2009).

Artículo CAS Google Scholar

Šedo, O., Várová, A., Vad'urová, M., Tvrzová, L. y Zdráhal, Z. La influencia de las condiciones de crecimiento en la diferenciación de cepas dentro del grupo de lactobacillus acidophilus utilizando el tiempo de desorción/ionización por láser asistida por matriz -perfiles de espectrometría de masas de vuelo. Comunicaciones rápidas en espectrometría de masas: RCM 27, 2729–36 (2013).

ADS del artículo Google Scholar

Kliem, M. & Sauer, S. La esencia del diagnóstico microbiano basado en espectrometría de masas. Opinión actual en microbiología 15, 397–402 (2012).

Artículo CAS Google Scholar

Carbonnelle, E. y col. Identificación rápida de estafilococos aislados en laboratorios de microbiología clínica mediante espectrometría de masas de tiempo de vuelo, desorción, ionización y desorción láser asistida por matriz. Revista de microbiología clínica 45, 2156–2161 (2007).

Artículo CAS Google Scholar

Alm, R. et al. Detección e identificación de isoformas de proteínas mediante análisis de conglomerados de espectros de masas maldi-ms. Revista de investigación del proteoma 5, 785–792 (2006).

Artículo CAS Google Scholar

De Bruyne, K. y col. Identificación de especies bacterianas a partir de espectros de masas maldi-tof mediante análisis de datos y aprendizaje automático. Microbiología sistemática y aplicada 34, 20–9 (2011).

Artículo CAS Google Scholar

Zhang, L., Vranckx, K., Janssens, K. y Sandrin, TR Uso de espectrometría de masas maldi-tof y una base de datos personalizada para caracterizar bacterias autóctonas de un entorno de cueva único (cavernas Kartchner, Arizona, EE. UU.). Revista de experimentos visualizados e52064 (2015).

Liu, Q. y col. Comparación de selección y clasificación de características para datos de maldi-ms. Genómica de BMC 10 Suppl 1, S3 (2009).

Artículo de Google Scholar

Polunin, D., Shtayger, I. & Efimov, V. Software Jacobi4 para análisis multivariado de datos de microarrays. Vestnik NSU 12, 90–98 (2014).

Google Académico

Levandowsky, M. & Winter, D. Distancia entre series. Naturaleza 239, 174-174 (1972).

Google Académico

Fernández-No, IC et al. Caracterización y perfilado de bacillus subtilis, bacillus cereus y bacillus licheniformis mediante toma de huellas dactilares masivas maldi-tof. Microbiología de alimentos 33, 235–242 (2013).

Artículo de Google Scholar

Hotta, Y., Sato, J., Sato, H., Hosoda, A. y Tamura, H. Clasificación del género bacillus basada en el análisis maldi-tof ms de proteínas ribosómicas codificadas en los operones s10 y spc. Revista de Química Agrícola y Alimentaria 59, 5222–5230 (2011).

Artículo CAS Google Scholar

Lasch, P. y col. Identificación de bacillus anthracis mediante espectrometría de masas de tiempo de vuelo, ionización y desorción láser asistida por matriz y redes neuronales artificiales. Microbiología aplicada y ambiental 75, 7229–7242 (2009).

Artículo CAS Google Scholar

Branquinho, R. et al. Diferenciación de bacillus pumilus y bacillus safensis mediante maldi-tof-ms. Más uno 9, e110127 (2014).

ADS del artículo Google Scholar

Thompson, JD, Gibson, TJ y Higgins, DG Alineación de secuencias múltiples utilizando clustalw y clustalx. Protocolos actuales en bioinformática Capítulo 2, Unidad 2.3 (2002).

Dempster, A., Laird, N. & Rubin, DB Máxima probabilidad de datos incompletos mediante el algoritmo em. Revista de la Royal Statistical Society 39, 1–38 (1977).

MathSciNet MATEMÁTICAS Google Scholar

Tamura, K., Stecher, G., Peterson, D., Filipski, A. y Kumar, S. Mega6: Análisis de genética evolutiva molecular versión 6.0. Biología molecular y evolución 30, 2725–2729 (2013).

Artículo CAS Google Scholar

Strohalm, M., Kavan, D., Novák, P., Volný, M. & Havlícek, V. mmass 3: un entorno de software multiplataforma para el análisis preciso de datos espectrométricos de masas. Química analítica 82, 4648–51 (2010).

Artículo CAS Google Scholar

Hammer, Ø., Harper, D. a. T. & Ryan, PD Paquete de software de estadística paleontológica para educación y análisis de datos. Paleontología Electrónica 4, 9-18 (2001).

Google Académico

Jaccard, P. Nuevas investigaciones sobre distribución. Boletín de la Sociedad Vaudoise de Ciencias Naturales 44, 223–270 (1908).

Google Académico

Deza, MM & Deza, E. Enciclopedia de distancias (Springer Berlin Heidelberg, 2009).

Descargar referencias

El trabajo de KVS, EAD, AVB, ASR y SEP fue apoyado por el proyecto presupuestario VI.58.1.3. El trabajo de VME contó con el apoyo de la Fundación Científica Rusa (Proyecto No 14-24-00123). Los autores desean expresar su agradecimiento al personal de la Reserva Estatal de Biosfera de Kronotsky por su ayuda en el trabajo en la caldera de Uzon.

Instituto de Citología y Genética, Rama Siberiana de la Academia de Ciencias de Rusia, Novosibirsk, 630090, Federación de Rusia

Konstantin V. Starostin, Evgeny A. Demidov, Alla V. Bryanskaya, Vadim M. Efimov, Alexey S. Rozanov y Sergey E. Peltek

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

KVS y EAD realizaron experimentos de EM y análisis de datos. AVB realizó aislamiento y cultivo de cultivos microbianos. El algoritmo matemático fue desarrollado por VMEASR y realizó una secuenciación de ARNr de 16 segundos. La SEP supervisó este proyecto. Todos los autores participaron en la redacción del manuscrito.

Los autores no declaran tener intereses financieros en competencia.

Este trabajo está bajo una licencia Creative Commons Attribution 4.0 International. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en la línea de crédito; Si el material no está incluido bajo la licencia Creative Commons, los usuarios deberán obtener permiso del titular de la licencia para reproducir el material. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/

Reimpresiones y permisos

Starostin, K., Demidov, E., Bryanskaya, A. et al. Identificación de cepas de Bacillus mediante MALDI TOF MS mediante enfoque geométrico. Representante científico 5, 16989 (2015). https://doi.org/10.1038/srep16989

Descargar cita

Recibido: 27 de marzo de 2015

Aceptado: 22 de octubre de 2015

Publicado: 23 de noviembre de 2015

DOI: https://doi.org/10.1038/srep16989

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Microbiología y Biotecnología Aplicadas (2023)

Nanociencia Aplicada (2023)

Investigación de la papa (2022)

Ecología microbiana (2019)

Microbioma (2017)

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.