El contenido del genoma predice las preferencias catabólicas de carbono de las bacterias heterótrofas

Microbiología de la naturaleza (2023)Citar este artículo

5 altmétrico

Detalles de métricas

Las bacterias heterótrofas (bacterias que utilizan fuentes de carbono orgánico) son taxonómica y funcionalmente diversas en todos los entornos. Es un desafío mapear las interacciones metabólicas y los nichos dentro de las comunidades microbianas debido a la gran cantidad de metabolitos que podrían servir como fuentes potenciales de carbono y energía para los heterótrofos. No está claro si sus nichos metabólicos pueden entenderse utilizando principios generales, como un pequeño número de categorías metabólicas simplificadas. Aquí realizamos perfiles metabólicos de alto rendimiento de 186 cepas de bacterias heterótrofas marinas cultivadas en medios que contienen uno de los 135 sustratos de carbono para determinar las tasas de crecimiento, los tiempos de retraso y los rendimientos. Mostramos que, a pesar de la alta variabilidad en todos los niveles de taxonomía, los nichos catabólicos de las bacterias heterótrofas pueden entenderse en términos de su preferencia por fuentes de carbono glucolíticas (azúcares) o gluconeogénicas (aminoácidos y ácidos orgánicos). Esta preferencia está codificada por el número total de genes que se encuentran en las vías que alimentan los dos modos de utilización del carbono y se puede predecir utilizando un modelo lineal simple basado en recuentos de genes. Esto permite descripciones generales de las comunidades microbianas en términos de modos predominantes de catabolismo del carbono. La preferencia entre azúcar y ácido también está asociada con el contenido de GC genómico y, por tanto, con los requisitos de carbono y nitrógeno de su proteoma codificado. Nuestro trabajo revela cómo la evolución de los genomas bacterianos está estructurada por limitaciones fundamentales arraigadas en el metabolismo.

Esta es una vista previa del contenido de la suscripción, acceda a través de su institución

Acceda a Nature y a otras 54 revistas de Nature Portfolio

Obtenga Nature+, nuestra suscripción de acceso en línea con la mejor relación calidad-precio

$29.99 / 30 días

cancelar en cualquier momento

Suscríbete a esta revista

Reciba 12 números digitales y acceso en línea a artículos

$119.00 por año

sólo $9.92 por número

Alquila o compra este artículo

Los precios varían según el tipo de artículo.

desde $ 1,95

a$39.95

Los precios pueden estar sujetos a impuestos locales que se calculan durante el pago.

Todos los datos genómicos y de crecimiento están disponibles en https://doi.org/10.17632/xfh8t8568g.1. Todos los aislados están disponibles en MG (Europa) u OXC (EE. UU.) previa solicitud. Todos los ensamblajes de genomas están disponibles en BioProjects PRJNA319196 y PRJNA478695, con la excepción de las cepas 1A06 (PRJNA318805), 12B01 (PRJNA13568), 13B01 (PRJNA318805), DSS-3 (BioSample SAMN02604003), así como AS40, AS56, AS. 88 y AS94 (PRJNA996876 ). Los datos originales se proporcionan con este documento.

Todo el código necesario para reproducir las figuras está disponible en https://doi.org/10.17632/xfh8t8568g.1.

Huttenhower, C. y col. Estructura, función y diversidad del microbioma humano sano. Naturaleza 486, 207–214 (2012).

Artículo CAS Google Scholar

Thompson, LR y cols. Un catálogo comunitario revela la diversidad microbiana multiescala de la Tierra. Naturaleza 551, 457–463 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Sunagawa, S. y col. Estructura y función del microbioma oceánico global. Ciencia 348, 1261359 (2015).

Artículo PubMed Google Scholar

Pontrelli, S. y col. La alimentación cruzada metabólica estructura el ensamblaje de comunidades degradantes de polisacáridos. Ciencia. Adv. 8, eabk3076 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Gralka, M., Szabo, R., Stocker, R. & Cordero, OX Interacciones tróficas y los impulsores del ensamblaje de comunidades microbianas. actual. Biol. 30, R1176–R1188 (2020).

Artículo CAS PubMed Google Scholar

Pollak, S. y col. Explotación de bienes públicos en comunidades naturales de bacterioplancton. Ciencia. Adv. 7, eabi4717 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Moran, MA El microbioma oceánico global. Ciencia 350, aac8455 (2015).

Artículo PubMed Google Scholar

Datta, MS, Sliwerska, E., Gore, J., Polz, MF y Cordero, OX Las interacciones microbianas conducen a sucesiones rápidas a microescala en partículas marinas modelo. Nat. Comunitario. 7, 11965 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Enke, TN y cols. Conjunto modular de comunidades microbianas marinas que degradan polisacáridos. actual. Biol. 29, 1528-1535 (2019).

Artículo CAS PubMed Google Scholar

Fahimipour, AK y Gross, T. Mapeo del espacio del nicho metabólico bacteriano. Nat. Comunitario. 11, 4887 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Kehe, J. y col. Las interacciones positivas son comunes entre las bacterias cultivables. Ciencia. Adv. 7, eabi7159 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Kirchman, DL La ecología de Cytophaga-Flavobacteria en ambientes acuáticos. Microbiol FEMS. Ecológico. 39, 91-100 (2002).

CAS PubMed Google Académico

Buchan, A., LeCleir, GR, Gulvik, CA & González, JM Maestros recicladores: características y funciones de las bacterias asociadas con la proliferación de fitoplancton. Nat. Rev. Microbiol. 12, 686–698 (2014).

Artículo CAS PubMed Google Scholar

Machado, D., Andrejev, S., Tramontano, M. y Patil, KR Rápida reconstrucción automatizada de modelos metabólicos a escala genómica para especies y comunidades microbianas. Ácidos nucleicos res. 46, 7542–7553 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Barberán, A., Caceres Velazquez, H., Jones, S. & Fierer, N. Escondido a simple vista: extracción de registros de especies bacterianas para obtener información sobre rasgos fenotípicos. mSphere 2, e00237-17 (2017).

Artículo PubMed PubMed Central Google Scholar

Mende, DR et al. ProGenomes2: una base de datos mejorada para anotaciones funcionales, taxonómicas y de hábitat precisas y consistentes de genomas procarióticos. Ácidos nucleicos res. 48, D621–D625 (2020).

CAS PubMed Google Académico

Sueoka, N. Correlación entre la composición básica del ácido desoxirribonucleico y la composición de aminoácidos de la proteína. Proc. Acad. Nacional. Ciencia. Estados Unidos 47, 1141-1149 (1961).

Artículo CAS PubMed PubMed Central Google Scholar

Hellweger, FL, Huang, Y. & Luo, H. La limitación de carbono impulsa la evolución del contenido de GC de una bacteria marina en un modelo a escala de genoma individual. ISME J. 12, 1180–1187 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Shenhav, L. & Zeevi, D. La conservación de recursos se manifiesta en el código genético. Ciencia 370, 683–687 (2020).

Artículo CAS PubMed Google Scholar

Mende, DR et al. Impulsores ambientales de una zona de transición genómica microbiana en el interior del océano. Nat. Microbiol. 2, 1367-1373 (2017).

Artículo CAS PubMed Google Scholar

Musto, H. y col. Nivel genómico de GC, temperatura óptima de crecimiento y tamaño del genoma en procariotas. Bioquímica. Biofísica. Res. Comunitario. 347, 1–3 (2006).

Artículo CAS PubMed Google Scholar

Estrela, S. et al. Atractores funcionales en el ensamblaje de comunidades microbianas. Sistema celular. 13, 29–42 (2022).

Artículo CAS PubMed Google Scholar

Amarnath, K. y col. Los intercambios metabólicos inducidos por el estrés entre tipos de bacterias complementarias subyacen a un mecanismo dinámico de resistencia al estrés entre especies. Nat. Comunitario. 14, 3165 (2023).

Artículo CAS PubMed PubMed Central Google Scholar

Estrela, S., Diaz-Colunga, J., Vila, JC, Sanchez-Gorostiaga, A. y Sanchez, A. La diversidad engendra diversidad bajo la construcción de nichos microbianos. Preimpresión en bioRxiv https://doi.org/10.1101/2022.02.13.480281 (2022).

Schink, SJ y cols. La especialización en glucólisis/gluconeogénesis en microbios está impulsada por limitaciones bioquímicas de la detección de flujo. Mol. Sistema. Biol. 18, e10704 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Basan, M. y col. Un equilibrio universal entre crecimiento y retraso en entornos fluctuantes. Naturaleza 584, 470–474 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Plucain, J. y col. Epistasis y especificidad alélica en la aparición de un polimorfismo estable en Escherichia coli. Ciencia 343, 160-164 (2014).

Artículo de Google Scholar

Blount, ZD, Borland, CZ & Lenski, RE Contingencia histórica y evolución de una innovación clave en una población experimental de Escherichia coli. Proc. Acad. Nacional. Ciencia. Estados Unidos 105, 7899–7906 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Le Gac, M., Plucain, J., Hindré, T., Lenski, RE y Schneider, D. Dinámica ecológica y evolutiva de linajes coexistentes durante un experimento a largo plazo con Escherichia coli. Proc. Acad. Nacional. Ciencia. Estados Unidos 109, 9487–9492 (2012).

Artículo PubMed PubMed Central Google Scholar

Hershberg, R. & Petrov, DA Evidencia de que la mutación está universalmente sesgada hacia la AT en bacterias. PLoS Genet. 6, e1001115 (2010).

Artículo PubMed PubMed Central Google Scholar

Ely, B. El contenido genómico de GC disminuye en la mayoría de los genomas bacterianos. MÁS UNO 16, e0244163 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Maddamsetti, R. & Grant, NA Evolución divergente de tasas de mutación y sesgos en el experimento de evolución a largo plazo con Escherichia coli. Genoma Biol. Evolución. 12, 1591-1603 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Yakovchuk, P., Protozanova, E. y Frank-Kamenetskii, MD Contribuciones del apilamiento y emparejamiento de bases a la estabilidad térmica de la doble hélice del ADN. Ácidos nucleicos res. 34, 564–574 (2006).

Artículo CAS PubMed PubMed Central Google Scholar

Lassalle, F. y col. Evolución del contenido de GC en genomas bacterianos: se expande la hipótesis de la conversión genética sesgada. PLoS Genet. 11, e1004941 (2015).

Artículo PubMed PubMed Central Google Scholar

Shenhav, L. & Zeevi, D. La conservación de recursos se manifiesta en el código genético. Ciencia 370, 683–687 (2020).

Artículo CAS PubMed Google Scholar

Smriga, S., Ciccarese, D. y Babbin, AR Las bacterias desnitrificantes responden y dan forma a gradientes de microescala dentro de matrices de partículas. Comunitario. Biol. 4, 570 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Gowda, K., Ping, D., Mani, M. y Kuehn, S. La estructura genómica predice la dinámica de los metabolitos en las comunidades microbianas. Celda 185, 530–546 (2022).

Artículo CAS PubMed Google Scholar

Moran, MA y cols. La secuencia del genoma de Silicibacter pomeroyi revela adaptaciones al medio marino. Naturaleza 432, 910–913 (2004).

Artículo CAS PubMed Google Scholar

Ben-Haim, Y. et al. Vibrio coralliilyticus sp. nov., un patógeno dependiente de la temperatura del coral Pocillopora damicornis. En t. J. Sistema. Evolución. Microbiol. 53, 309–315 (2003).

Artículo CAS PubMed Google Scholar

Hehemann, JH et al. La radiación adaptativa mediante ondas de transferencia de genes conduce a una partición de recursos a pequeña escala en los microbios marinos. Nat. Comunitario. 7, 12860 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Bankevich, A. y cols. SPAdes: un nuevo algoritmo de ensamblaje del genoma y sus aplicaciones a la secuenciación unicelular. J. Computación. Biol. 19, 455–477 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Parks, DH, Imelfort, M., Sknnerton, CT, Hugenholtz, P. & Tyson, GW CheckM: evaluación de la calidad de los genomas microbianos recuperados de aislados, células individuales y metagenomas. Genoma Res. 25, 1043-1055 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Hyatt, D. y col. Pródigo: reconocimiento de genes procarióticos e identificación del sitio de inicio de la traducción. Bioinformación de BMC. 11, 119 (2010).

Artículo de Google Scholar

Huerta-Cepas, J. et al. EGGNOG 4.5: un marco de ortología jerárquica con anotaciones funcionales mejoradas para secuencias eucariotas, procarióticas y virales. Ácidos nucleicos res. 44, D286-D293 (2016).

Artículo CAS PubMed Google Scholar

Zhang, H. y col. DbCAN2: un metaservidor para la anotación automatizada de enzimas activas en carbohidratos. Ácidos nucleicos res. 46, W95-W101 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Chaumeil, PA, Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: un conjunto de herramientas para clasificar genomas con la base de datos de taxonomía genómica. Bioinformática 36, 1925-1927 (2020).

Artículo CAS Google Scholar

Shen, W. & Ren, H. TaxonKit: un conjunto de herramientas de taxonomía NCBI práctico y eficiente. J. Genet. Genómica 48, 844–850 (2021).

Artículo PubMed Google Scholar

Ebrahim, A., Lerman, JA, Palsson, BO y Hyduke, DR COBRApy: reconstrucción y análisis basados en restricciones para Python. Sistema BMC. Biol. 7, 74 (2013).

Artículo PubMed PubMed Central Google Scholar

Wolfram Mathematica v. 13.2 (Wolfram, 2022).

R: un lenguaje y un entorno para la informática estadística (R Core Team, 2022).

Yu, G., Smith, DK, Zhu, H., Guan, Y. & Lam, TTY Ggtree: un paquete R para visualización y anotación de árboles filogenéticos con sus covariables y otros datos asociados. Métodos Ecología. Evolución. 8, 28–36 (2017).

Artículo de Google Scholar

Paradis, E. y Schliep, K. Ape 5.0: un entorno para la filogenética moderna y los análisis evolutivos en R. Bioinformatics 35, 526–528 (2019).

Artículo CAS PubMed Google Scholar

Tamura, K., Stecher, G. y Kumar, S. MEGA11: Análisis genético evolutivo molecular versión 11. Mol. Biol. Evolución. 38, 3022–3027 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Schliep, KP phangorn: Análisis filogenético en R. Bioinformatics 27, 592–593 (2011).

Artículo CAS PubMed Google Scholar

Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M. & Tanabe, M. KEGG como recurso de referencia para la anotación de genes y proteínas. Ácidos nucleicos res. 44, D457–D462 (2016).

Artículo CAS PubMed Google Scholar

Heinken, A. y col. Reconstrucción metabólica a escala genómica de 7.302 microorganismos humanos para la medicina personalizada. Nat. Biotecnología. https://doi.org/10.1038/s41587-022-01628-0 (2023).

Heinken, A., Magnúsdóttir, S., Fleming, RMT y Thiele, I. DEMETER: curación simultánea eficiente de reconstrucciones a escala del genoma guiadas por datos experimentales y anotaciones genéticas refinadas. Bioinformática 37, 3974–3975 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Callahan, BJ y cols. DADA2: inferencia de muestras de alta resolución a partir de datos de amplicones de Illumina. Nat. Métodos 13, 581–583 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Hubert, B. SkewDB, una base de datos completa de GC y otras 10 asimetrías para más de 30.000 cromosomas y plásmidos. Ciencia. Datos 9, 92 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Lagadec, E., Småge, SB, Trösse, C. & Nylund, A. Los análisis filogenéticos de cepas noruegas de Tenacibaculum confirman una alta diversidad bacteriana y sugieren la circulación de cepas virulentas ubicuas. PLoS One 16, e0259215 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Ekborg, NA et al. Saccharophagus degradans gen. nov., sp. nov., un degradador marino versátil de polisacáridos complejos. En t. J. Sistema. Evolución. Microbiol. 55, 1545-1549 (2005).

Artículo CAS PubMed Google Scholar

Descargar referencias

Agradecemos a S. Estrela (Universidad de Yale y Universidad de Stanford) por proporcionar datos de composición de la comunidad de sus experimentos de enriquecimiento (Fig. 4d); A. Sichert por ensamblar genomas; y M. d. Bello, X. Shan, T. Hwa así como a todos los miembros del laboratorio Cordero y la colaboración de Simons PriME por sus enriquecedoras discusiones. Reconocemos la financiación del premio Simons Collaboration: Principios de ecosistemas microbianos (PriME) número 542395 (OXC) y el premio de beca posdoctoral de la Fundación Simons número 599207 (MG).

Matti Gralka

Dirección actual: Grupo de Biología de Sistemas, Instituto de Ámsterdam para la Vida y el Medio Ambiente (A-LIFE) y Instituto de Ciencias Biológicas y Moleculares de Ámsterdam (AIMMS), Vrije Universiteit Amsterdam, Ámsterdam, Países Bajos

Shaul Pollak

Dirección actual: División de Ecología Microbiana, Centro de Microbiología y Ciencia de Sistemas Ambientales, Universidad de Viena, Viena, Austria

Departamento de Ingeniería Civil y Ambiental, Instituto de Tecnología de Massachusetts, Cambridge, MA, EE. UU.

Matti Gralka, Shaul Pollak y Otto X. Cordero

También puedes buscar este autor en PubMed Google Scholar.

MG diseñó el estudio, realizó todos los experimentos, analizó todos los datos y escribió el manuscrito inicial. SP analizó los datos genómicos de la base de datos proGenomes. MG, SP y OXC discutieron los resultados. OXC dirigió el proyecto y editó el manuscrito.

Correspondencia a Matti Gralka o Otto X. Cordero.

Los autores declaran no tener conflictos de intereses.

Nature Microbiology agradece a Sara Mitri, Seppe Kuehn y los demás revisores anónimos por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

El árbol y la taxonomía se crearon utilizando el flujo de trabajo de clasificación GTDB-tk utilizando parámetros estándar de una alineación de 120 genes marcadores. La leyenda corresponde a las sustituciones esperadas por sitio. En la Tabla complementaria 1 se proporciona una lista completa de todas las cepas.

a, Número de fuentes de carbono que sustentan el crecimiento por cepa. b, Fracción de todas las cepas que pudieron utilizar un sustrato determinado como única fuente de carbono y energía. c, Faltó una fuerte correlación entre el número de fuentes de carbono que sustentan el crecimiento, la tasa de crecimiento y el rendimiento. Rendimiento promedio (puntos azules) y tasa (cuadrados rojos) agrupados por la cantidad de fuentes de carbono que respaldaron el crecimiento, mostrados como la media ± sd (para un total de n = 182 cepas que muestran crecimiento en al menos un sustrato). Las líneas y los valores P se derivan de regresiones lineales. Las especies más generalistas (más fuentes de carbono consumidas) logran un rendimiento promedio ligeramente mayor, pero el tamaño del efecto probablemente no sea relevante en la práctica. d, Para cada condición (sustratos × cepa), trazamos la tasa de crecimiento y el rendimiento, que están ligeramente correlacionados positivamente (regresión lineal P = 2 × 10−6, R2 = 0,005). Los puntos del extremo derecho corresponden a la tasa de crecimiento máxima detectable dado nuestro espaciado de los puntos de tiempo experimentales. e, Pendientes lineales para la regresión del rendimiento por cepa con la tasa de crecimiento; sólo 3/186 cepas exhibieron una correlación estadísticamente significativa (regresión lineal) entre tasa y rendimiento. La línea vertical corresponde a la pendiente de la regresión sobre todas las condiciones.

a – c, distancia de fenotipo, definida como la distancia del coseno entre vectores de consumo, en función de la distancia genómica entre pares de cepas, donde la distancia genómica es la distancia GTDB-tk (a), la distancia de Bray-Curtis entre el contenido de genes ( b; basado en el número de copias de KEGG KO) o el contenido del módulo (c; basado en la abundancia de módulos KEGG). Los puntos son la media ± sd de contenedores logarítmicos; n = 16.471 comparaciones totales.

a, Análisis de componentes principales de la matriz de tasas de crecimiento completa, reproducida de la Fig. 1 en el texto principal. b, Cargas promedio de categorías de sustratos de grano fino normalizadas a la unidad de longitud. Cargas detalladas de todos los sustratos en el análisis de componentes principales en a. El análisis completo de los componentes principales muestra una clara separación de las preferencias por los aminoácidos orgánicos (incluidos los alcoholes y aromáticos) y los aminoácidos. c,d, Cargas individuales por sustrato para cada componente principal (PC; izquierda). Tenga en cuenta que todos los ácidos tienen cargas negativas en PC1, pero todos los ácidos orgánicos, excepto dos, cambian de signo en PC2 en relación con los aminoácidos. Diagramas de dispersión del primer componente principal (basado en la matriz de tasa de crecimiento completa) versus el SAP como se define en el texto principal, y el segundo componente principal versus la preferencia aminoácido-ácido orgánico definida de manera análoga (derecha). Cada punto es un aislamiento diferente, coloreado por orden taxonómico (como en la Fig. 1). Los valores de P se derivan de regresiones lineales.

a, Nuevo análisis de datos de Kehe y colegas11. El mapa de calor corresponde a sus datos ampliados fig. 2 (densidad óptica final en cada condición), excepto con filas y columnas ordenadas por similitud de coseno. b, el análisis de componentes principales de esta matriz muestra la agrupación de los dos órdenes taxonómicos y su alineación con las cargas promedio de ácidos y azúcares. c, Árbol filogenético basado en GTDB-tk de especies contenidas en las bases de datos de rasgos IJSEM y DEMETER, así como proGenomas (por nombre de especie). Tenga en cuenta que dos grandes filos, Actinobacteriota y Firmicutes, no están representados en absoluto en nuestra biblioteca de cepas.

a, Histogramas suaves de los coeficientes de correlación por pares entre los vectores de crecimiento de las cepas en los tres experimentos (V1, V2, V3; V3 es el experimento que se analiza principalmente en el texto principal). b, Gráficos de dispersión del SAP medido para cada cepa entre los tres experimentos replicados. Los valores de P se derivan de regresiones lineales.

La integridad, cobertura y duplicación se definen en detalle en Métodos. a, Predecir la cobertura a partir de la integridad (modelo lineal) generalmente produce ajustes de mayor calidad que predecir la cobertura a partir de la duplicación. b, Después de corregir por completitud, la duplicación tiende a explicar más residuos que la completitud después de corregir por duplicación. c, Ni la duplicación ni la cobertura de ninguna vía individual se correlacionaban muy fuertemente con el SAP, y si la duplicación o la cobertura de una vía determinada era más predictiva de la SAP dependía de la vía. d, Ilustrando el concepto de duplicación funcional en el ejemplo de la vía de degradación de galactosa (vía KEGG ko00052). Se muestra la parte central de la vía que convierte la lactosa y otros oligosacáridos primero en β-d-galactosa, que se transforma a través de múltiples pasos en α-D-glucosa-6-fosfato, que luego ingresa a la glucólisis. Para alguna reacción, encontramos múltiples ortólogos en las mismas cepas (por ejemplo, hasta seis ortólogos de K01785 (galM, aldosa 1-epimerasa, EC:5.1.3.3). Estos ortólogos no son duplicados exactos, como lo ilustra el árbol en a la derecha. El árbol se basa en un alineamiento de secuencia múltiple de todas las secuencias anotadas K01785 en todas las cepas. Hemos resaltado las seis copias encontradas en las cepas de Zobellia A2M03, que están distribuidas alrededor del árbol y a menudo agrupadas con ortólogos que se encuentran en especies lejanamente relacionadas. De hecho, en todos los ortólogos altamente duplicados (número máximo de ortólogos por cepa de al menos seis), la distancia por pares (calculada a partir de los múltiples alineamientos de secuencias para cada ortólogo de KEGG utilizando la función dist.ml del paquete phangorn en R), Era casi igualmente probable que fuera mayor entre ortólogos de la misma cepa en relación con ortólogos de diferentes cepas, como que iba a ser más pequeño. Por lo tanto, los ortólogos "duplicados" en una cepa probablemente representan variantes funcionales de diferente origen evolutivo. e, f, Distancias promedio entre ortólogos de KEGG dentro y entre cepas de genes asociados con el catabolismo del azúcar y el ácido. Los ortólogos de KEGG en negro tienen una diferencia de más del 10% entre las dos distancias. Los puntos representan la media ± sem; el número de comparaciones difiere para cada gen, de n = 496 a n = 179.101. g, Comparación entre el crecimiento medido y previsto en sustratos individuales. El crecimiento previsto se derivó de simulaciones FBA de modelos metabólicos a escala genómica creados con CarveMe utilizando parámetros estándar (sin relleno). Este procedimiento arrojó un 58% de predicciones correctas (línea vertical), lo que estuvo dentro del rango de predicciones correctas logrado cuando la comparación se realizó con etiquetas barajadas (distribución, obtenida barajando etiquetas 1000 veces, midiendo cada vez la proporción de predicciones correctas).

a – d, Número de CAZimas (a, b, glicosil hidrolasas; y c, d, polisacárido liasas) y su correlación con los SAP (b, d). b,d, Los recuadros muestran −log10P por orden, el log10 negativo del valor P obtenido de regresiones lineales del número CAZyme con SAP dentro de cada orden; −log10P > 2 (línea vertical) corresponde a una correlación significativa al nivel del 5%, corregida por Bonferroni para pruebas múltiples. b, Los símbolos cuadrados corresponden a los cuadrados de la Fig. 1d. Estas son excepciones a la preferencia metabólica media por orden, como el género Tenacibaculum, especialista en ácidos, en los Flavobacteriales, que incluye patógenos de peces60. Por el contrario, los órdenes Pseudomonadales y Rhodobacterales (comúnmente pensados para especializarse en sustratos simples13) tendían a preferir ácidos (SAP <0), pero también encontramos el género Pseudomonadales, especialista en azúcares Saccharophagus, que son conocidos degradadores de azúcar61. Las cepas Flavobacteriales y Pseudomonadales con fenotipos atípicos para su taxonomía tendieron a tener menos o más CAZimas que sus parientes cercanos, respectivamente. Los puntos pequeños corresponden a aislamientos individuales, los puntos grandes con barras de error indican la media ± DE para cada orden (a,c, n = 28 (Pseudomonadales), 34 (Rhodobacterales), 20 (Vibrionales), 58 (Alteromonadales), 32 (Flavobacteriales). )) o contenedor de SAP (b,d, número total de cepas n = 182).

a, El contenido de GC (medido en todas las regiones codificantes previstas) está relativamente conservado a nivel de orden en nuestra biblioteca de cepas (n = 28 (Pseudomonadales), 34 (Rhodobacterales), 20 (Vibrionales), 58 (Alteromonadales) y 32 (Flavobacteriales). )). b, El contenido de GC predice los requisitos de carbono y nitrógeno por aminoácido codificado. Todas las secuencias de proteínas se calificaron manualmente según el número de átomos de carbono y nitrógeno de cada aminoácido. c, Los mismos datos que en la Fig. 3b sin agrupación: el contenido de GC se correlaciona con el contenido de GC genómico en todo el conjunto de cepas, pero no dentro de los órdenes, posiblemente porque el contenido de GC evoluciona muy lentamente y, por lo tanto, se conserva relativamente por debajo del nivel de orden. En particular, esta correlación fue mucho más fuerte que la correlación entre el contenido de GC y otras características básicas de los genomas, como el número de regiones codificantes (ajuste del modelo lineal, P = 0,2), y no hubo una diferencia prácticamente significativa entre el contenido de GC de genes en las vías catabólicas del azúcar y del ácido (e). d, Debido a la correlación entre el contenido de GC y los requisitos de nutrientes y SAP, la SAP tiene una correlación positiva/negativa con el número de átomos de carbono/nitrógeno por aminoácido codificado. Los puntos pequeños corresponden a cepas individuales, los puntos grandes con barras de error indican la media ± sd para los cinco órdenes principales. Las líneas y los valores P se derivan de regresiones lineales. e, El contenido promedio de GC de genes catabólicos de azúcar y ácido es muy similar. Gráfico de dispersión del contenido de GC de todos los genes anotados como genes de azúcar/ácido (Tabla complementaria 5), extraídos de los genomas y promediados por cepa. La línea corresponde a un contenido igual de GC en genes de azúcar/ácido. f, Residuos del ajuste lineal en a, que muestran una tendencia débil pero estadísticamente significativa (P = 6 × 10−16) para que los genomas con alto contenido de GC tengan un contenido de GC ligeramente mayor en genes de azúcar que en genes ácidos. g, Ejemplo de correlación y regresión lineal de la abundancia de vías con contenido de GC en más de n = 11.000 genomas de referencia diversos (proGenomas). h, al extraer los coeficientes de regresión lineal (pendientes) para cada vía, todos los cuales fueron altamente significativos, se obtiene una imagen similar a la Fig. 2b, es decir, las vías del azúcar tendieron a disminuir y las vías ácidas tendieron a aumentar en abundancia en función de Contenido de GC. Las pendientes de las vías del azúcar (n = 7) y del ácido (n = 26) son significativamente diferentes entre sí (prueba t, dof = 31, T = −4,26, P = 0,00017).

a, Distribución taxonómica y distribución de SAP en las comunidades sintéticas, coloreadas por orden (Fla, Flavobacteriales; Vib, Vibrionales; Alt, Alteromonadales; Pse, Pseudomonadales; Rho, Rhodobacterales; Cyt, Cytophagales). b, Riqueza a lo largo del tiempo en comunidades sintéticas que crecen en una de las cuatro fuentes de carbono (Fig. 4a). Los puntos con barras de error indican la media ± DE en seis réplicas. c, Contenido de GC promedio ponderado por abundancia de comunidades enriquecidas con ácidos o azúcares. El GC promedio del genoma para OTU individuales se estimó utilizando SkewDB (Métodos). Las distribuciones son estadísticamente significativamente diferentes (prueba t de Welch bilateral $T=6.95,{\rm{dof}}=13.8,{P}=7.5\times {10}^{-6}$). d, Riqueza final en comunidades sintéticas que crecen en cuatro concentraciones diferentes de GlcNAc. Las comunidades estaban formadas por una mezcla compleja de cepas, de las cuales sólo aproximadamente la mitad eran capaces de consumir GlcNAc en monocultivo (consumidores). Por lo tanto, las especies restantes (que se alimentan cruzadamente) deben haberse alimentado de metabolitos excretados por los consumidores. e,f, Número promedio de átomos de C o N por aminoácido codificado en las comunidades, ponderado por la abundancia de cada cepa. Se muestra el promedio de los últimos cinco puntos temporales. Los asteriscos indican diferencias significativas entre las condiciones (P = {2, 0,2, 5,8, 6,2} × 10−6 de arriba a abajo en e y P = {0,01, 3,0, 3,8, 1,4} × 10−5 de arriba a abajo en f) en una prueba de Mann-Whitney de dos colas (usando la corrección de Bonferroni para pruebas múltiples). d–f,h, Los puntos pequeños corresponden a réplicas (incluidos diferentes factores de dilución, n = 12 puntos por condición), los puntos grandes con barras de error indican la media ± sd g, Composición funcional de comunidades sintéticas que crecen en cuatro concentraciones diferentes de GlcNAc como la única fuente de carbono (pero no de nitrógeno). Las composiciones finales de especies se muestran como gráficos de barras, donde cada especie está coloreada según su SAP. A concentraciones bajas de GlcNAc, dominaron más especies especializadas en ácidos (SAP negativo, tonos verdes). Esta tendencia no fue impulsada por un cambio en la abundancia relativa de consumidores (que fue más o menos constante en todas las condiciones), sino por consumidores y alimentadores cruzados con un SAP más bajo dominando en concentraciones más bajas de carbono. h, Este patrón se mantuvo al perturbar a las comunidades. Las cuatro comunidades replicadas en el factor de dilución intermedio (cultivadas durante seis ciclos a la concentración más alta y más baja (GlcNAc 20 y 0,02 mM, respectivamente) se transfirieron a todas las demás concentraciones, en paralelo a las comunidades no perturbadas. De acuerdo con la observación no perturbada , un aumento/disminución en la concentración de GlcNAc condujo a un aumento/disminución en cSAP, respectivamente. Este efecto fue en general más fuerte para perturbaciones más severas, por ejemplo, compare las comunidades cambiadas de 20 mM a 2 mM (amarillo) con las de 20 mM a 0,02 mM comunidades cambiadas (rojo).

Tabla complementaria 1. Lista de cepas. Tabla complementaria 2. Lista de sustratos. Cuadro complementario 3. Conjunto de datos completo de tasas de crecimiento. Tabla complementaria 4. Vías de KEGG utilizadas para predicciones de SAP. Tabla complementaria 5. KO utilizados para las predicciones de SAP. Tabla complementaria 6. Lista de KO de azúcar/ácido en nuestras cepas. Tabla complementaria 7. SAP previsto para genomas de referencia. Tabla complementaria 8. OTU para comunidades sintéticas en cuatro fuentes de carbono.

Los datos de origen de las Figs. 1–4.

Springer Nature o su licenciante (por ejemplo, una sociedad u otro socio) posee los derechos exclusivos de este artículo en virtud de un acuerdo de publicación con los autores u otros titulares de derechos; El autoarchivo por parte del autor de la versión manuscrita aceptada de este artículo se rige únicamente por los términos de dicho acuerdo de publicación y la ley aplicable.

Reimpresiones y permisos

Gralka, M., Pollak, S. y Cordero, OX El contenido del genoma predice las preferencias catabólicas de carbono de las bacterias heterótrofas. Microbiol natural (2023). https://doi.org/10.1038/s41564-023-01458-z

Descargar cita

Recibido: 08 de febrero de 2023

Aceptado: 24 de julio de 2023

Publicado: 31 de agosto de 2023

DOI: https://doi.org/10.1038/s41564-023-01458-z

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Blog

El contenido del genoma predice las preferencias catabólicas de carbono de las bacterias heterótrofas