Surfaces protéiques fortuitement compatibles amorcées par le contrôle allostérique dans la photoprotection des cyanobactéries

Nouvelles

MaisonMaison / Nouvelles / Surfaces protéiques fortuitement compatibles amorcées par le contrôle allostérique dans la photoprotection des cyanobactéries

May 20, 2023

Surfaces protéiques fortuitement compatibles amorcées par le contrôle allostérique dans la photoprotection des cyanobactéries

Écologie de la nature et évolution

Nature Ecology & Evolution volume 7, pages 756–767 (2023)Citer cet article

3160 accès

138 Altmétrique

Détails des métriques

Des interactions très spécifiques entre protéines sont une condition préalable fondamentale à la vie, mais leur évolution reste un problème non résolu. En particulier, les interactions entre des protéines initialement non apparentées nécessitent qu'elles évoluent sur des surfaces correspondantes. Il n'est pas clair si de telles compatibilités de surface ne peuvent être construites que par sélection par petites étapes incrémentielles, ou si elles peuvent également émerger fortuitement. Ici, nous avons utilisé la phylogénétique moléculaire, la reconstruction de séquences ancestrales et la caractérisation biophysique des protéines ressuscitées pour retracer l'évolution d'une interaction allostérique entre deux protéines qui agissent dans le système de photoprotection des cyanobactéries. Nous montrons que cette interaction entre la protéine caroténoïde orange (OCP) et son régulateur indépendant, la protéine de récupération de fluorescence (FRP), a évolué lorsqu'un précurseur de FRP a été acquis horizontalement par les cyanobactéries. Les précurseurs de FRP pourraient déjà interagir avec et réguler l'OCP avant même que ces protéines ne se rencontrent pour la première fois dans une cyanobactérie ancestrale. L'interaction OCP-FRP exploite une ancienne interface dimère dans OCP, qui est également antérieure au recrutement de FRP dans le système de photoprotection. Ensemble, nos travaux montrent comment l'évolution peut facilement façonner des systèmes réglementaires complexes à partir de composants préexistants.

Les interactions allostériques entre protéines sont une forme omniprésente de régulation biochimique dans laquelle le site actif d'une protéine est affecté par la liaison d'une autre protéine à un site distal1. Comment ces interactions évoluent est un problème non résolu en biochimie évolutive. Cela nécessite que les deux protéines (le régulateur et la cible) développent une interface correspondante ainsi qu'un mécanisme qui traduit la liaison du régulateur à un changement au niveau du site actif de la protéine cible. Si tous les résidus qui participent à cette interface et au mécanisme de transmission devaient évoluer de novo, la construction d'une telle interaction nécessiterait plusieurs substitutions dans les deux protéines. Étant donné qu'il est très peu probable que de longues trajectoires génétiques impliquant plusieurs substitutions dans plusieurs protéines soient fixées par une dérive génétique aléatoire, les interactions existantes sont généralement supposées avoir été construites par étapes de mutation incrémentielles. Chaque étape ajouterait un seul résidu d'interaction et serait conduite à la fixation par la sélection naturelle agissant directement sur une fonction associée à l'interaction2. Cependant, dans quelques systèmes protéiques, des interfaces ou des voies allostériques préexistaient fortuitement chez l'un des deux partenaires3,4,5,6. Cela indique que certains aspects de ces interactions sont apparus par hasard, qui ont ensuite été exploités par d'autres composants apparus plus tard.

On ne sait toujours pas dans quelle mesure la sélection directe est nécessaire pour façonner ces composants restants d'une interaction, comme la surface d'interaction d'un nouveau régulateur qui exploite une surface préexistante sur sa cible. En principe, ces caractéristiques pourraient également être entièrement accidentelles si elles étaient initialement fixées pour des raisons sans rapport avec l'interaction. Dans tous les cas bien étudiés, nous ne pouvons pas répondre à cette question car les deux composants proviennent du même génome où la cible et le régulateur se seraient toujours rencontrés, de sorte que la sélection peut ou non avoir agi pour adapter le régulateur à sa nouvelle cible3,4,5,6. On ne sait donc pas si une interaction biologiquement significative s'est réellement produite par hasard.

Ici, nous abordons ce problème en étudiant l'évolution d'une interaction allostérique dans le système de photoprotection des cyanobactéries7,8. Les organismes photoactifs doivent se protéger des fortes irradiations lumineuses causant des photodommages. Chez les cyanobactéries, cette protection est médiée par la protéine caroténoïde orange (OCP)9,10, un capteur d'intensité lumineuse photoactif avec un caroténoïde intégré symétriquement dans ses deux domaines qui est capable de changer la conformation d'un orange inactif (OCPO) à un état rouge activé (OCPR) dans des conditions de forte luminosité11. L'OCPR activé se lie au complexe d'antennes cyanobactériennes captant la lumière, le phycobilisome, pour dissiper l'excès d'excitation du phycobilisome sous forme de chaleur11,12. Deux paralogues OCP (OCP2 et OCPx) peuvent se détacher du phycobilisome et récupérer passivement en OCPO dans l'obscurité11,13. Cependant, le paralogue OCP1 le plus courant repose sur une régulation allostérique pour la photo-récupération : OCP1 interagit avec la protéine de récupération de fluorescence (FRP), un petit régulateur dimérique qui met fin à l'interaction avec le phycobilisome et accélère fortement la rétro-conversion de l'OCPR dans l'état orange au repos14,15 (Fig. 1a). Bien que l'évolution probable de l'OCP à partir de précurseurs non photo-commutables ait été récemment démontrée16, on ne sait pas encore comment le FRP a été recruté dans le système de photoprotection des cyanobactéries en tant que nouveau régulateur allostérique.

a, Mécanisme de photoprotection exclusive aux cyanobactéries, médiée par l'OCP, impliquant un contrôle allostérique par le FRP (cyan) dans les paralogues de l'OCP1. Structures utilisées (ID PDB) : 7EXT (réf. 57), 3MG1 (réf. 58), 4JDX (réf. 25) et 7SC9 (réf. 29). PBS, phycosbilisome. b, phylogénie ML réduite des paralogues OCP avec une vitesse relative de récupération de la photoconversion indiquée, et protéines ancestrales reconstruites (Anc) de clades sélectionnés. Les CTDH cyanobactériennes sont le groupe externe. Les nombres en gras comptent les taxons des paralogues OCP désignés. Les nombres en italique sont les probabilités bootstrap de Felsenstein de 100 répliques. Les longueurs de branche représentent les substitutions moyennes par site. L'arborescence complète est illustrée dans les données étendues Fig. 1. c, spectres d'absorption ultraviolet-visible de l'état orange inactif et rouge actif d'AncOCPall par rapport à l'OCP1 existant de Synechocystis sp. PCC 6803 (SYNY3 ; lignes pointillées). d–f, Récupération après photoconversion d'OCP ancestraux à 20 °C avec (cyan) ou sans SYNY3 FRP (noir), et constantes de temps de récupération moyennes respectives (τ) avec sd de trois répliques indépendantes : AncOCPall (d), AncOCP1&2 (e) et AncOCP1 (f). Des ensembles de données représentatifs sont présentés pour plus de clarté.

Pour retracer les origines évolutives de l'interaction allostérique d'OCP1 avec FRP, nous avons d'abord cherché à comprendre comment les paralogues OCP ont évolué et quand ils ont acquis la capacité d'être régulés par FRP. Il a récemment été montré que le premier OCP a probablement évolué via un événement de fusion génique de deux petites protéines et qu'un ajout de lieur a fourni une photo-commutabilité16. Des homologues de ces protéines à domaine unique peuvent encore être trouvés dans les cyanobactéries existantes et ont été appelés protéines caroténoïdes hélicoïdales (HCP) et homologues de type domaine C-terminal (CTDH) qui présentent un repli commun des protéines du facteur de transport nucléaire 2 (NTF2)17. Nous avons d'abord déduit une phylogénie du maximum de vraisemblance (ML) des protéines OCP, en utilisant des séquences CTDH cyanobactériennes comme groupe externe pour enraciner notre arbre (Fig. 1b et Extended Data Fig. 1). Nous décrivons plus en détail un enracinement alternatif utilisant des séquences HCP dans Extended Data Fig. 2. Notre arbre phylogénétique est pratiquement identique à un arbre récemment publié16, avec OCPx, OCP2 et OCP1 formant chacun des groupes monophylétiques bien soutenus. OCP1 et OCP2 sont des groupes frères, à l'exclusion de tous les autres OCP. Deux autres clades non caractérisés se ramifient entre le groupe OCPx et OCP1 et OCP2, qui pourraient être des OCPx supplémentaires ou représenter des paralogues séparés.

Nous avons utilisé la reconstruction de séquence ancestrale pour déduire les séquences d'acides aminés des OCP ancestrales aux nœuds internes de notre arbre et le long de la lignée vers l'OCP1 régulé par FRP. Nous nous sommes concentrés sur trois protéines allant du dernier ancêtre commun (LCA) de tous les OCP existants (AncOCPall) au LCA des paralogues OCP1 et OCP2 (AncOCP1 & 2) jusqu'au LCA de l'OCP1 existant (AncOCP1), qui ont été reconstruites avec des probabilités postérieures moyennes entre 0, 92 et 0, 96 (Fig. 1b et données étendues Fig. 3a – e). Nous avons ressuscité ces protéines OCP ancestrales de manière hétérologue dans Escherichia coli et les avons purifiées pour une caractérisation in vitro. Tous les OCP ancestraux sont des capteurs d'intensité lumineuse photo-commutables avec une échinenone liée comme caroténoïde préféré (Fig. 1c et Extended Data Fig. 4a – h). AncOCPall montre une constante de temps modérée pour la rétro-conversion OCPR en OCPO de 166 ± 10 s (similaire à l'OCP2 existant, réf. 16). La constante de récupération diminue à 20 ± 1 s dans AncOCP1 & 2 (plus rapide que les OCP existants), mais augmente considérablement dans AncOCP1 à 314 ± 8 s (comme dans OCP1 existant) (Fig. 1d – f et Extended Data Fig. 4i – l). Nos données montrent que la photo-récupération lente est une caractéristique qui a évolué le long de la branche vers OCP1, conformément à la théorie selon laquelle seuls les paralogues OCP1 nécessitent des FRP pour une récupération allostérique accélérée.

Nous avons ensuite testé l'effet d'un FRP existant de Synechocystis sp. PCC 6803 sur les temps de récupération de nos OCP ancestraux. Les deux ancêtres précédents ne sont pas affectés par le FRP, alors qu'AncOCP1 ne peut récupérer rapidement qu'en présence de FRP (dans des rapports molaires de cinq OCP pour un FRP), ce qui accélère la rétro-conversion de l'OCPR en OCPO d'environ 97% (similaire à l'OCP1 existant) (Fig. 1d – f et Données étendues Fig. 4m – t). Comme AncOCP1 & 2 n'est pas affecté par le FRP, l'accélération allostérique de la récupération de l'OCP a évolué après l'événement de duplication de gène qui a donné naissance aux paralogues OCP1 et OCP2, uniquement le long de la branche vers OCP1.

Nous avons testé la robustesse de nos conclusions aux incertitudes statistiques dans nos séquences ressuscitées en ressuscitant en outre une séquence alternative moins probable, mais toujours statistiquement plausible, par ancêtre (voir Méthodes pour plus de détails). Les caractérisations biophysiques de ces protéines OCP ancestrales alternatives confirment que la récupération lente et l'accélération par FRP ont évolué le long de la branche menant à OCP1 (Extended Data Fig. 5a – l).

Nous avons ensuite demandé quand le FRP est apparu pour la première fois dans les génomes cyanobactériens, par rapport à la duplication de gènes qui a produit l'OCP1 régulé par le FRP. Pour répondre à cette question, nous avons déduit une phylogénie d'espèces ML de souches de cyanobactéries contenant de l'OCP trouvées sur notre arbre OCP et cartographié la présence de paralogues FRP et OCP sur celle-ci (Extended Data Fig. 6). Pratiquement tous les génomes contenant OCP1 contiennent également du FRP, ce qui suggère que le FRP a été acquis peu de temps après la duplication qui a produit OCP1. Il est difficile de dire exactement où sur la phylogénie des espèces les duplications OCP successives se sont produites, car les paralogues OCP2 et OCPx ont des distributions très sporadiques et les relations au sein de chaque clade OCP ne sont que mal résolues. Les gloéobactéries, qui sur les phylogénies de nos espèces et des autres18,19,20,21 sont sœurs de toutes les autres cyanobactéries, ne possèdent que l'OCPx, alors que les groupes se ramifiant immédiatement après ont déjà OCP1 et FRP ou OCP2 ou les deux. Cela suggère que la duplication qui a produit OCP1 et OCP2 s'est produite relativement rapidement après que Gloeobacter spp. séparé de toutes les autres cyanobactéries, et que le FRP a été recruté dans le système à peu près au même moment.

Notre prochain objectif était de comprendre l'origine du FRP. Des homologues de FRP (appelés FRP-like, FRPL) peuvent également être trouvés dans des bactéries éloignées8,22, principalement des protéobactéries et des acidobactéries, suggérant une origine bien au-delà des cyanobactéries. Pour tester cette théorie, nous avons longuement recherché des homologues de FRP à l'intérieur et à l'extérieur des cyanobactéries et avons déduit une phylogénie ML. Notre arbre présente une répartition hautement prise en charge entre tous les FRP et tous les FRPL (Fig. 2a). Un petit groupe de branches FRPL delta-protéobactériennes les plus proches du groupe FRP cyanobactérien avec un support statistique élevé (test de rapport de vraisemblance approximatif (aLRT) = 60,9, attentes de transfert bootstrap (TBE) de 0,99). Cependant, dans certaines séries de bootstrap, les FRPL d'autres taxons bactériens à longues branches terminales sautent dans ce groupe, ce qui entraîne un faible support de bootstrap de Felsenstein (FBP = 0, 51), mais les FRPL delta-protéobactériennes restent sœurs des FRP dans toutes les séries. De plus, les FRPL sont sporadiquement distribuées dans les protéobactéries et les acidobactéries, et se trouvent principalement dans les espèces non cultivées (et entièrement absentes dans les organismes modèles). Au sein de différents groupes de protéobactéries, notre arbre devient mal résolu, probablement en raison de la courte longueur des protéines FRP et FRPL.

a, phylogénie ML réduite du FRP cyanobactérien (cyan) et des protéines FRPL homologues avec celles examinées dans cette étude indiquées par un cercle magenta et le nom de leur espèce hôte. Les nombres en gras comptent les taxons des groupes bactériens effondrés. Le nombre en italique indique un TBE de 100 répétitions. L'arbre était enraciné entre les protéobactéries et les acidobactéries, et indique un HGT entre les delta-protéobactéries et les cyanobactéries (ligne rouge). Les longueurs des branches représentent les substitutions moyennes par site. L'arborescence complète est illustrée dans la Fig. 1 supplémentaire. b, Structure cristalline de l'homo-dimère FRPL de P. borbori à 1, 8 Å avec les domaines de tête indiqués (PDB ID 8AG8) c, Superposition tournée avec FRP (PDB ID 4JDX de Synechocystis sp. PCC 6803, réf. 25). rmsd, écart quadratique moyen.

Nous avons enraciné l'arbre entre les acidobactéries et les protéobactéries au sein du groupe FRPL comme l'hypothèse racine la plus parcimonieuse. Cette racine indique un transfert de gène horizontal (HGT) d'une delta-protéobactérie ancestrale vers une cyanobactérie ancestrale, et indique en outre de nombreuses pertes sporadiques de FRPL dans les acidobactéries et les protéobactéries (Fig. 2a). Une racine au sein du groupe FRP nécessiterait en revanche des événements HGT plus et moins plausibles : au moins des cyanobactéries vers un petit ensemble de protéobactéries, puis vers des acidobactéries, puis des acidobactéries relativement modernes vers des protéobactéries précoces. Une racine entre les FRP et les FRPL nécessiterait une origine de la protéine dans le LCA de toutes les bactéries23, ce qui indiquerait des pertes dans de nombreux grands groupes bactériens ainsi que le même transfert temporairement invraisemblable des acidobactéries modernes vers le LCA des protéobactéries (voir Discussion supplémentaire pour plus de détails). En conséquence, nos résultats indiquent que le FRP a très probablement été acquis horizontalement par une cyanobactérie ancestrale au début de l'histoire des cyanobactéries.

Pour comprendre l'état ancestral des protéines FRPL avant leur transfert dans les cyanobactéries, nous avons exprimé, purifié et caractérisé de manière hétérologue la FRPL de l'une des rares bactéries mésophiles isolées qui présentent la FRPL (PbFRPL) : la gamma-protéobactérie Pseudomonas borbori, un proche parent de P. aeruginosa24. La spectroscopie de dichroïsme circulaire de PbFRPL a montré le pli typique en hélice alpha, précédemment trouvé dans le FRP en solution, et la spectrométrie de masse native a confirmé l'état dimérique distinctif8,14 (Extended Data Fig. 7a – c). Nous avons résolu la structure cristalline de PbFRPL à une résolution de 1,8 Å (tableau 1). Le domaine N-terminal est constitué de deux hélices alpha antiparallèles d'environ 50 Å de longueur et présente une interface d'homodimérisation similaire à celles des FRP avec une surface enterrée estimée à environ 675 Å2. Le domaine de tête C-terminal, qui dans FRP est censé interagir avec OCP1 (réf. 25, 26, 27), est également présent dans PbFRPL et constitue trois hélices alpha imbriquées. Dans l'ensemble, PbFRPL et FRP de Synechocystis sp. PCC 6803 (Protein Data Bank (PDB) ID 4JDX, réf. 25) se superpose avec un écart quadratique moyen de 2, 08 Å (Fig. 2b, c). Les propriétés structurelles du PbFRPL sont donc extrêmement similaires à celles du FRP cyanobactérien.

On ne sait pas quelle fonction remplissent les FRPL, mais cela ne peut pas réguler l'OCP car les génomes contenant des FRPL ne contiennent ni OCP ni homologues de leurs protéines de type domaine N-terminal ou CTD (HCP et CTDH, respectivement). Chez P. borbori, le gène frpl est codé sur son seul chromosome et nous n'avons trouvé aucun homologue OCP, HCP ou CTDH (Extended Data Fig. 7d). La microscopie à épi-fluorescence de PbFRPL fusionné à un fluorophore mVenus et exprimé à partir d'un plasmide sous son promoteur natif chez P. borbori a montré une distribution homogène dans toute la cellule pendant la croissance exponentielle et une concentration supplémentaire aux pôles cellulaires lors de la famine avec une augmentation de la fluorescence intégrée de la cellule entière d'environ 2, 5 à 3, 4 fois au-dessus de l'augmentation de type sauvage (données étendues Fig. 7e – g). En gardant à l'esprit que nous ne pouvons pas contrôler le nombre de copies de protéines ici, il est à noter que la localisation et la quantité de PbFRPL changent en réponse à la famine. Nos données indiquent que malgré leurs structures extrêmement similaires, les FRPL exercent une fonction potentiellement liée au stress qui doit être totalement indépendante des OCP et de la régulation de la photoprotection.

Le pli partagé de FRPL et FRP suggère que les FRPL peuvent être capables d'interagir de manière productive avec l'OCP, ce qui signifie qu'ils n'ont peut-être pas eu besoin de modifications supplémentaires après avoir été transférés dans des cyanobactéries pour fonctionner immédiatement dans leur système de photoprotection. Pour tester cela, nous avons purifié plusieurs FRPL d'espèces existantes et examiné leur effet sur la photo-récupération d'OCP1 existante. Nous avons choisi des FRPL parmi quatre organismes qui couvrent la diversité des groupes bactériens contenant des FRPL sur notre arbre phylogénétique : P. borbori, Methylocaldum sp. (une autre gamma-protéobactérie), Chlorobi sp. (une espèce du groupe FCB) et une delta-protéobactérie de la famille des Desulfobacteraceae, qui représente l'une des séquences existantes les plus proches de l'événement HGT dans les cyanobactéries de notre arbre (Fig. 2a). FRPL de P. borbori, Methylocaldum sp. et Chlorobi sp. n'a eu pratiquement aucun effet sur la photo-récupération d'OCP1. Cependant, la Desulfobacteraceae FRPL a montré l'accélération typique de la récupération d'OCP1 à partir de la photoconversion d'environ 93% (lorsqu'elle est incubée dans un rapport équimolaire d'OCP1 à FRPL), par rapport à OCP1 seul (Fig. 3a, b et Données étendues Fig. 7h – k). Cela indique que la capacité de réguler OCP1 existait déjà au moment de l'événement HGT qui a d'abord transféré le FRP dans les cyanobactéries. Pour tester davantage cette théorie, nous avons en outre ressuscité deux protéines ancestrales : FRPLpreHGT qui est la dernière FRPL que nous pouvons reconstruire avant l'événement HGT et FRPpostHGT qui représente l'ACV de tous les FRP dans les cyanobactéries après la HGT (Fig. 3c). Les deux protéines ancestrales montrent également l'effet d'accélération typique du FRP sur la photo-récupération d'OCP1, fonctionnant presque aussi bien que le FRP existant (Fig. 3d, e et Extended Data Fig. 8a – d). Cette inférence est encore plus robuste pour les protéines ancestrales FRP et FRPL ancestrales alternatives avec des séquences légèrement différentes que, sur la base d'une phylogénie FRP (L) initiale, nous avions déduites plus tôt avec moins de séquences au total (Extended Data Fig. 8e – j).

a, b, récupération à partir de la photoconversion de l'OCP1 existant de Synechocystis sp. PCC 6803 (SYNY3) avec FRPL existant de P. borbori (a) ou d'une espèce Desulfobacteriaceae (Desulfo.) (b) à différents rapports molaires comme indiqué à 20 ° C avec des constantes de temps de récupération moyennes respectives (τ) et sd de trois répliques indépendantes. Des ensembles de données représentatifs sont présentés pour plus de clarté. ND, non déterminable. c, phylogénie schématique de la FRP(L) avec des protéines ancestrales reconstruites et des FRPL existantes testées. L'arbre complet est illustré à la Fig. 1 supplémentaire. d, e, Récupération après photoconversion de SYNY3 OCP1 existant avec FRPL ancestral (FRPLpreHGT) qui existait avant (d) et FRP ancestral (FRPpostHGT) qui existait après le HGT (e) à différents rapports molaires comme indiqué à 20 ° C avec des constantes de temps de récupération moyennes respectives (τ) et sd de trois répliques indépendantes. Des ensembles de données représentatifs sont présentés pour plus de clarté.

Pris ensemble, nos résultats montrent que la plupart des FRPL ne peuvent pas fonctionner comme des régulateurs allostériques d'OCP1, mais qu'un petit sous-groupe d'entre eux a acquis cette capacité par hasard. Parce que cela s'est produit dans un génome qui ne contenait pas d'OCP, cette capacité est entièrement accidentelle et ne peut pas avoir été le résultat d'une sélection naturelle directe. En principe, cela aurait permis à la protéine de fonctionner dans le système de photoprotection totalement indépendant des cyanobactéries au moment où elle a été transférée pour la première fois dans leurs génomes.

Étant donné que certaines FRPL semblent préparées pour l'interaction avec l'OCP avant même qu'elles n'entrent dans les cyanobactéries, nous avons pensé que l'interface pour leur interaction pouvait également déjà être présente dans AncOCPall, même si la connexion allostérique pour accélérer la photo-récupération n'avait pas encore complètement évolué. La chromatographie analytique d'exclusion de taille (SEC) de formes rouges photoactivées d'AncOCPall (AncOCPallR) incubées avec du FRP existant a montré une taille accrue par rapport à AncOCPallR seul (Fig. 4a), indiquant que le FRP se lie déjà à AncOCPallR. Nous avons demandé si nous pouvions déclencher la réponse allostérique en ajoutant du FRP en excès à la réaction de récupération OCPRtoOCPO, et avons répété nos expériences initiales (Fig. 1d), mais cette fois en utilisant un rapport molaire beaucoup plus grand de FRP par rapport à OCP. À notre grande surprise, au lieu d'une accélération, le temps de récupération a considérablement augmenté de 166 ± 10 à 288 ± 10 s et 609 ± 5 s, en utilisant une quantité équimolaire (d'OCP à FRP) et un excès molaire quintuple de FRP, respectivement (Fig. 4b). Cette décélération est également apparue dans AncOCP1 & 2, et si l'on ajoute l'un des FRP ancestraux ou des FRPL ancestraux (Fig. 4c et Extended Data Fig. 4u – x). Pour exclure que ce ralentissement ne soit causé que par des effets stériques ou un encombrement moléculaire, nous avons répété les expériences avec PbFRPL (qui n'a pratiquement aucun effet sur le temps de récupération d'OCP1, même s'il est ajouté en excès molaire : Fig. 3a), et nous n'avons également trouvé pratiquement aucun effet sur la récupération d'AncOCPall (Extended Data Fig. 4y).

a, SEC analytique des complexes AncOCPall et AncOCPall – FRP avec (OCPR) ou sans éclairage constant en lumière bleue (OCPO) pendant la chromatographie. b, c, récupération à partir de la photoconversion d'AncOCPall avec différents rapports molaires de FRP existant de Synechocystis sp. PCC 6803 (SYNY3) (b) ou FRPpostHGT (c) à 20 ° C avec les constantes de temps de récupération moyennes respectives (τ) et sd de trois répétitions indépendantes. Des ensembles de données représentatifs sont présentés pour plus de clarté. Les données pour « pas de FRP » et « 5: 1 FRP » en b sont extraites de la figure 1d à des fins de comparaison. d, modèle AlphaFold2 de l'interaction entre FRP (cyan) et le CTD de SYNY3 OCP1 (vert). e, zoom pivoté (de la zone encadrée en noir en d) dans l'interface de liaison, avec AncOCPall (dans le blé) superposé sur OCP1. Les acides aminés impliqués dans la liaison sont marqués. Les sites conservés dans les deux OCP sont en noir. Azote en bleu et oxygène en rouge. Les nombres de résidus suivent SYNY3 OCP1. L'insert montre le PP pour les acides aminés indiqués dans l'interface de liaison de la protéine AncOCPall reconstruite. f, le PAGE natif de l'OCPO ancestral sans éclairage (à gauche) et l'OCPR pendant un éclairage constant à la lumière bleue (à droite) montrent leurs états oligomères. La comparaison avec OCP1 (réf. 29, 58) indique des interfaces de dimérisation conservées qui diffèrent entre OCPO et OCPR. Un mutant OCP (70 kDa) et le CTD de OCP1 (29 kDa) qui forment tous deux des dimères indépendants de l'illumination ont été utilisés comme marqueurs moléculaires. Les expériences ont été répétées trois fois avec des résultats similaires.

La liaison du FRP seul n'est donc pas suffisante pour que l'effet allostérique d'accélération se produise. Au lieu de cela, il empêche la photo-récupération d'AncOCPall à un excès molaire élevé de FRP. Une liaison faible répétitive ou un FRP qui ne se dissocie pas sur la bonne échelle de temps pourrait interrompre ou retarder le processus de récupération d'AncOCPall. En outre, les caractéristiques structurelles du côté OCP telles que la boucle de liaison flexible entre le domaine N-terminal et CTD ou la courte extension N-terminale peuvent devoir être affinées pour que la réponse allostérique complexe et hautement efficace de l'OCP1 existant ait lieu.

Nos expériences montrent que le LCA de tous les OCP avait déjà une capacité latente à interagir avec le FRP, bien que cette interaction n'était pas encore capable d'accélérer la récupération. Cela implique qu'au moins ce potentiel d'interaction entre l'OCP et le FRP a évolué purement par hasard, avant même que ces protéines ne se rencontrent pour la première fois dans une cyanobactérie ancestrale.

Pour comprendre la base structurelle de cette affinité latente, nous avons déduit un modèle AlphaFold2 (réf. 28) du complexe OCP1-FRP. Il a prédit avec confiance une interaction entre le CTD d'OCP1 et le FRP (Fig. 4d et données étendues Fig. 9a, f) qui est cohérente avec les données précédentes de diffusion des rayons X aux petits angles27. L'interaction exploite la même surface hydrophobe que celle utilisée par OCP1 pour se dimériser dans son état rouge sur le phycobilisome29. Le FRP a été théorisé pour favoriser le détachement d'OCP1R du phycobilisome en abaissant la constante d'association de la liaison et en accélérant la récupération en entrant en compétition avec cette interface dimère dans OCP1 (réf. 27). Les résidus et les charges qui se sont avérés importants pour cette interface dimère sont également présents dans nos OCP ancestraux (Extended Data Fig. 3a), expliquant potentiellement pourquoi le FRP peut déjà interagir avec AncOCPall. Nous avons testé cette hypothèse de deux manières : premièrement, nous avons déduit un modèle AlphaFold2 du CTD d'AncOCPall et comparé ses surfaces au CTD d'OCP1. AncOCPall possède la même surface hydrophobe que OCP1 avec pratiquement tous les sites ou charges d'interface identiques entre les deux protéines. AlphaFold2 prédit en outre une interaction entre cette surface dans AncOCPall et FRP (Fig. 4e et Extended Data Fig. 9b – e, g). Deuxièmement, ce modèle indique en outre que la dimérisation à l'état rouge devrait être une caractéristique ancestrale de tous les OCP. Pour tester cela, nous avons utilisé Native PAGE pour comprendre si nos OCP ancestraux se dimérisent également sous leur forme rouge activée. Conformément à notre prédiction, l'activation conduit à la formation de complexes de taille cohérente avec les homo-dimères dans AncOCPallR et AncOCP1R. Nous n'avons pas détecté de dimères rouges dans AncOCP1 & 2, probablement en raison de son temps de récupération extrêmement rapide qui empêche techniquement de maintenir la forme rouge dans le gel (Fig. 4f).

Ensemble, cela indique que la surface de liaison exploitée par le FRP est une ancienne interface dimère de la forme rouge de l'OCP qui était déjà présente dans l'ACV de tous les OCP, avant même que le FRP ne soit recruté dans le système cyanobactérien.

Les paralogues OCPx ne sont plus affectés par FRP16,30. Pour identifier les changements structurels sous-jacents entre AncOCPall et OCPx, nous avons répété les prédictions d'interaction avec le CTD d'un OCPx existant de Gloeobacter kilaueensis JS1. AlphaFold2 n'a pas prédit l'interface d'interaction entre le FRP et cet OCPx à moins que nous ne rechangions une sérine conservée dans l'interface potentielle en la tyrosine ancestrale d'AncOCPall (Extended Data Fig. 9h, i). Cela suggère que les protéines OCP ont dérivé dans et hors de l'état structurel qui permet l'interaction avec le FRP.

Pour comprendre les causes structurelles de la raison pour laquelle seuls certains FRPL accélèrent la récupération d'OCP1 après la photoconversion, nous avons finalement comparé les séquences de différents FRPL. Dans notre modèle AlphaFold2, la phénylalanine 76, la lysine 102 et la leucine 106 dans le FRP de Synechocystis sp. PCC 6803 sont en contact avec OCP1. La plupart des FRPL n'ont pas les trois états ensemble, mais ont parfois un ou deux de ces états. P. borbori FRPL, par exemple, a la phénylalanine, mais comporte une tyrosine en position 102 et une sérine en position 106 (Extended Data Fig. 8a). D'autres FRPL ont la lysine, mais manquent de phénylalanine ou de leucine. Cela montre que les états importants pour l'interaction avec OCP1 vont et viennent individuellement à travers la phylogénie FRPL. Les trois états n'apparaissent ensemble que dans les FRPL le long de la lignée vers les delta-protéobactéries et les cyanobactéries. Il est remarquable que le HGT dans les cyanobactéries se soit produit exactement dans cette fenêtre étroite de compatibilité totale.

Ici, nous avons reconstitué l'évolution d'une interaction allostérique dans le système de photoprotection des cyanobactéries. Avec des travaux antérieurs sur l'évolution initiale d'OCP13,16, l'image qui émerge est un exemple remarquable de bricolage évolutif :31 les OCP ont très probablement été créés par un événement de fusion de gènes qui ne nécessitait rien d'autre qu'un lieur flexible pour créer une protéine photo-commutable à partir de deux composants non commutables16. L'acquisition horizontale de FRP a ensuite introduit un nouveau composant qui pourrait accélérer allostériquement la récupération de l'état fondamental dans OCP1 sans autre modification. La création du système OCP1 – FRP entièrement fonctionnel ne nécessitait alors que des substitutions dans OCP qui convertissaient une interaction initialement improductive avec le CTD en une interaction qui se traduisait par une accélération de la photo-récupération (Fig. 5). Parce que nous ne pouvons pas chronométrer précisément l'acquisition de FRP par rapport à nos ancêtres OCP, nous ne savons pas si ces substitutions se sont produites avant ou après l'acquisition de FRP. S'ils s'étaient produits auparavant, l'interaction réglementaire entre OCP1 et FRP aurait été complètement fonctionnelle au moment où le FRP a été acquis horizontalement. Une autre fonction connue du FRP est la facilitation du détachement de l'OCP1 du phycobilisome en déplaçant la constante d'équilibre de liaison OCPR-phycobilisome15. Bien que cet aspect n'ait pas été étudié dans notre étude, nous imaginons que la liaison compétitive du FRP à un dimère OCPR ancestral pourrait également faciliter le détachement du phycobilisome ou au moins empêcher la liaison à celui-ci, générant en fait un mode de régulation ancestral potentiel qui aurait également pu être fonctionnel au moment où le FRP est apparu pour la première fois dans les cyanobactéries.

Le premier OCP photo-commutable qui subit un changement conformationnel d'un orange fermé à un état rouge ouvert lors d'une irradiation lumineuse élevée a été formé lors d'un événement de fusion d'un HCP ancestral (AncHCP) et d'un homologue de type CTD ancestral (AncCTDH) via un ajout de lieur16. Une protéine de type FRP (FRPL) a été transférée horizontalement (HGT) dans le système cyanobactérien indépendant après qu'une interface de liaison latente pour les OCP ancestraux ait déjà évolué par hasard. FRP exploite désormais l'interface de dimérisation CTD conservée d'OCPR pour accélérer fortement la récupération d'OCP1 à partir de la photoconversion. La structure OCP utilisée ici à titre d'illustration uniquement est PDB ID 3MG1 (réf. 58).

Une question qui demeure est pourquoi le FRP a-t-il été recruté dans le système de photoprotection cyanobactérienne ? Les OCP qui existaient avant le recrutement du FRP pouvaient se rétablir rapidement par eux-mêmes. Pourquoi compliquer ce système fonctionnel ? Nous sommes conscients de deux avantages adaptatifs postulés : premièrement, l'interaction OCP1-FRP peut offrir un contrôle plus sophistiqué de la consommation d'énergie dans les régimes lumineux à changement rapide dans la cellule cyanobactérienne13. Les systèmes de photoprotection médiés par l'OCP sans FRP ne peuvent être régulés qu'au niveau des transcrits d'ARN messager, qui n'agissent que lentement lors du retour de conditions de lumière stressantes à normales, alors que le contrôle par FRP permet une régulation post-traductionnelle potentiellement plus rapide32. Deuxièmement, il peut offrir une photoprotection supérieure dans des conditions de forte luminosité : les paralogues OCP2 et OCPx récupèrent si rapidement qu'ils ont du mal à accumuler de manière stable la forme rouge à température ambiante13. L'état rouge plus stable d'OCP1 peut alors être utile lorsque de grandes quantités d'OCPR actif sont nécessaires, mais cette stabilité élevée peut se faire au détriment de l'incapacité de récupérer seul. Dans ce scénario, le recrutement de FRP aurait permis l'évolution d'un mécanisme de photoprotection finalement plus efficace. Cependant, l'interaction pourrait aussi être un exemple de complexité non adaptative qui est tout simplement devenue difficile à perdre33 : l'acquisition de FRP a peut-être permis à OCP1 d'« oublier » comment récupérer efficacement par lui-même. Une fois qu'il aurait perdu cette capacité, le FRP serait devenu essentiel pour le fonctionnement complet d'OCP1.

La compatibilité spécifique de la FRPL de l'espèce Desulfobacteraceae avec les OCP des cyanobactéries est entièrement accidentelle, car cette protéine a évolué dans un génome qui ne contient pas d'OCP. Cela prouve que des surfaces protéiques hautement complémentaires peuvent évoluer complètement par hasard, et que de telles interactions initialement accidentelles peuvent s'intégrer à la biologie des organismes. Nos travaux soulèvent ainsi la possibilité que certaines ou même de nombreuses interactions protéine-protéine soient initialement créées sans l'action de la sélection naturelle directe. Les organismes peuvent en effet être bombardés d'interactions quasiment entièrement formées qui se créent lors de transferts horizontaux, de changements de localisation cellulaire ou de schémas d'expression spatio-temporels réunissant des protéines aux surfaces fortuitement compatibles. De ce pool, la sélection naturelle éliminerait alors ceux qui sont nuisibles, réparerait ceux qui sont utiles et ignorerait ceux qui sont inoffensifs.

Pour déduire l'arbre phylogénétique des protéines OCP cyanobactériennes, nous avons utilisé l'ensemble de données OCP de Muzzopappa et al.16, et aligné le profil des séquences d'acides aminés correspondantes des trois types OCP décrits (OCP1, OCP2, OCPx), en utilisant MUSCLE (v.3.8.31)34. Nous avons ajouté des séquences de protéines homologues de type CTD cyanobactériennes (CTDH) ou de HCP cyanobactériennes en tant que groupe externe respectif. Les alignements ont été corrigés manuellement, les sites correspondant aux insertions spécifiques à la lignée et les séquences dupliquées ont été supprimés. Les alignements complets se trouvent dans les données supplémentaires 1. Nous avons utilisé RaxmlHPC-AVX (v.8.2.10)35 en mode PROTGAMMAAUTO pour identifier le modèle le mieux adapté de l'évolution des acides aminés, qui était la matrice de substitution Jones-Taylor-Thornton révisée (JTTDCMut)36 avec des fréquences de base empiriques et une distribution gamma de la variation du taux parmi les sites. Nous avons utilisé PhyML (v.3.1)37 avec des mouvements SPR pour déduire deux phylogénies ML avec des séquences CTDH ou HCP incluses, et avons enraciné les arbres entre l'une ou l'autre de ces séquences et toutes les séquences OCP sur nos arbres. Les deux phylogénies présentent fondamentalement la même topologie, mais le grade A non attribué se ramifie d'abord sur l'arborescence de l'exogroupe HCP (Extended Data Fig. 2). Étant donné que les gloéobactéries, qui sont connues pour être des cyanobactéries à ramification précoce18,19,20,21, ne présentent que l'OCPx, mais aucun homologue OCP des grades non attribués, nous avons utilisé l'arbre du groupe extérieur CTDH pour des analyses plus approfondies (données étendues, Fig. 1). La robustesse de chaque topologie a été testée en exécutant 100 bootstraps non paramétriques et en calculant en outre les statistiques aLRT avec PhyML. Les séquences OCP ancestrales ont été reconstruites au niveau du nœud interne de l'arborescence de l'exogroupe CTDH, comme indiqué à la Fig. 1b et à la Fig. Les séquences ancestrales ont été recadrées selon les règles de parcimonie et contiennent les états avec les probabilités a posteriori (PP) les plus élevées sur tous les sites sélectionnés. Les valeurs moyennes de PP pour toutes les protéines reconstruites figurent dans les données étendues Fig. 3b – e. Les séquences alternatives 'altAll' pour chaque ancêtre reconstruit comprennent l'état avec le deuxième PP le plus élevé si cet état a PP > 0,20, et l'état ML sinon.

Pour l'arbre phylogénétique FRP (L) (Fig. 2a), nous avons rassemblé des séquences d'acides aminés à l'aide de BLASTP39 en ligne le 23 février 2022, et la séquence d'acides aminés FRP de Synechocystis sp. PCC 6803 (SYNY3) en tant que requête. Pour trouver spécifiquement les séquences FRPL, nous avons exclu les cyanobactéries (taxide : 1117) et répété la recherche contre SYNY3 FRP et ensuite contre P. borbori FRPL ou explicitement recherché dans des groupes taxonomiques autres que les cyanobactéries. De plus, nous avons ajouté des séquences métagénomiques du Global Microbial Gene Catalog (GMGC, v.1.0)40. Les séquences ont été alignées avec MUSCLE (v.3.8.31). L'alignement a été corrigé manuellement, les sites correspondant aux insertions spécifiques à la lignée et les séquences dupliquées ont été supprimés. L'alignement complet se trouve dans les données supplémentaires 1. Nous avons utilisé RaxmlHPC-AVX (v.8.2.10) en mode PROTGAMMAAUTO en utilisant le critère d'information d'Akaike pour identifier le modèle le mieux adapté de l'évolution des acides aminés, qui était la matrice de substitution Le-Gascuel41 avec des fréquences de base fixes et une distribution gamma de la variation du taux parmi les sites. Nous avons déduit la phylogénie ML et testé la robustesse de la topologie en exécutant 100 bootstraps non paramétriques. Les TBE ont été calculés avec l'outil web BOOSTER42. De plus, les statistiques aLRT ont été calculées avec PhyML (v.3.1). L'arbre était enraciné entre les acidobactéries et les protéobactéries du groupe FRPL et suggère un HGT d'une delta-protéobactérie ancestrale dans une cyanobactérie ancestrale. L'arbre complet se trouve dans la Fig. 1 supplémentaire. Les séquences ancestrales FRPL et FRP ancestrales (FRPLpreHGT et FRPpostHGT, respectivement) ont été reconstruites aux nœuds internes de l'arbre en utilisant la reconstruction marginale dans le module CodeML de PAML (v.4.9) avec le modèle de matrice de substitution Le-Gascuel (LG) et 16 catégories gamma. Les écarts ont été attribués avec parcimonie. Pour les ancêtres que nous avons ressuscités, nous avons choisi l'état des acides aminés avec le PP le plus élevé à chaque site. Les PP moyens pour les protéines reconstruites sont dans les données étendues Fig. 8b, c.

Pour la réconciliation de l'arbre génétique et de l'arbre des espèces, nous avons identifié toutes les séquences de notre arbre FRP (L) qui pourraient certainement être attribuées à une souche bactérienne distincte qui est également déposée dans la Genome Taxonomy Database (GTDB)43 avec son ensemble de 120 séquences de protéines marqueurs à copie unique, en utilisant BLASTP39. Avec ces séquences d'acides aminés alignées et concaténées, nous avons déduit un arbre phylogénétique ML en utilisant IQ-Tree 2 (v.2.2)44 (-m LG, -b 100, -alrt 1 000) et enraciné avec des acidobactéries comme décrit ci-dessus. Nous avons donc déduit un arbre génétique avec les séquences FRP et FRPL des espèces correspondantes, et exécuté 100 bootstraps non paramétriques pour ce sous-ensemble. La réconciliation a été effectuée à l'aide de l'estimation ML avec ALEml_undated dans ALE45 et la phylogénie des espèces enracinées ainsi que les arbres bootstrap FRP (L) comme entrée. Les arbres réconciliés et la sortie ALE sont déposés dans les données source.

Pour reconstruire les séquences FRPL ancestrales alternatives et FRP ancestrales alternatives (altFRPLpreHGT et altFRPpostHGT, respectivement), nous avons utilisé un alignement initial avec moins de séquences au total. L'alignement complet se trouve dans les données supplémentaires 1. Un arbre phylogénétique ML avec 100 bootstraps non paramétriques a été déduit, et les séquences FRPL ancestrales alternatives et FRP ancestrales alternatives ont été reconstruites en conséquence au nœud interne de cet arbre, illustrées dans les données étendues Fig. 8e et Fig. Les TBE ont été calculés avec l'outil web BOOSTER. Des séquences ancestrales alternatives ont été recadrées selon les règles de parcimonie et contiennent les états avec le PP le plus élevé de tous les côtés sélectionnés. Les PP moyens pour les protéines reconstruites sont dans les données étendues Fig. 8f, g.

Pour l'arbre des espèces phylogénétiques des cyanobactéries contenant de l'OCP, nous avons identifié toutes les séquences de notre arbre OCP qui pourraient certainement être attribuées à une souche cyanobactérienne distincte qui est également déposée au GTDB avec son ensemble de 120 séquences de protéines marqueurs à copie unique. En tant que groupe externe, nous avons ajouté des ensembles de séquences de malainabactéries étroitement apparentées ainsi que des ensembles d'espèces de Chloroflexota plus éloignées. Nous avons utilisé ces séquences d'acides aminés concaténées, les avons alignées et avons déduit un arbre phylogénétique à l'aide de RaxmlHPC-AVX (v.8.2.10) en mode PROTGAMMAAUTO, en utilisant le critère d'information d'Akaike pour identifier le modèle d'évolution des acides aminés le mieux adapté, qui était la matrice de substitution Le-Gascuel41 avec des fréquences de base empiriques et une distribution gamma de la variation du taux parmi les sites. Nous avons déduit la phylogénie ML et testé la robustesse de la topologie en exécutant 100 bootstraps non paramétriques. Nous avons enraciné l'arbre entre les cyanobactéries et l'exogroupe et cartographié l'apparition des gènes frp et ocp dans les génomes correspondants, sur la base des occurrences BLASTP et tBLASTn39, à côté de l'arbre (Extended Data Fig. 6). L'attribution de séquences OCP particulières à un groupe paralogue OCP est basée sur la position de leurs séquences d'acides aminés traduites sur notre arbre OCP (Extended Data Fig. 1).

Séquences d'ADN d'OCP ancestraux, OCP1 existant de Synechocystis sp. PCC 6803 (SYNY3) et FRP (SYNY3) ont été optimisés en codons pour l'expression dans E. coli et synthétisés par Genscript Biotech ou Life Technologies (GeneArt). Les constructions synthétisées étaient flanquées de sites de clivage BamHI et NotI pour le clonage dans un vecteur pRSFDuet-1 modifié (Merck Millipore), qui code pour un site de clivage spécifique de la protéase 3 C du rhinovirus humain (HRV) (LEVLFQ/GP) et une étiquette 6xHis à l'extrémité N (plasmide résultant appelé pRSFDuetM). Après clivage, toutes les constructions ont commencé avec GPDPATM. Pour l'expression de FRP existant (gène Syny3 SLR1964), le vecteur PRSFDUETM-FRP a été transformé en E. coli BL21 (DE3) (Nouvelle-Angleterre Biolabs), qui ont été cultivés pendant une nuit à 37 ° C dans le milieu Luria - Bertani (LB), PH.0), complémentaire de NaCl, 50% de la yeast, Extract, PH 7.0), Kan (Kan supplémentaire (Kan (Kan supplémentaire (Kan (Kan supplémentaire (Kan (Kan supplémentaire (Kan Extract, Kan (Kan (Kan supplémentaire (50% de lerée µg ml - 1). Le lendemain, 1 l de LB + Kan a été inoculé avec 10 ml de culture d'une nuit et incubé à 37 ° C jusqu'à une densité optique (OD600nm) de 0, 6 à 0, 8, puis induit par 0, 5 mM d'isopropyl-β-d-thiogalactopyranoside (IPTG) et cultivé dans un incubateur à agitation pendant 24 h à 30 ° C. Les cellules ont été recueillies à 10 000 g pendant 10 min et stockées à -20 ° C jusqu'à utilisation. Pour l'expression des OCP (OCP1 existant, gène SYNY3 slr1963 et OCP ancestraux), les constructions pRSFDuetM-OCPxx correspondantes ont été transformées en E. coli BL21 (DE3) produisant de l'échinenone, hébergeant un plasmide p25crtO. Les expressions ont été réalisées dans 1 l de LB, additionné de chloramphénicol (34 µg ml-1) et de Kan (50 µg ml-1), qui a été inoculé par 10 ml de culture d'une nuit, et cultivé dans un incubateur à agitation à 37 ° C jusqu'à OD600nm = 0,6–0,8. Après induction avec de l'IPTG 0, 5 mM, les cellules ont été incubées à 25 ° C pendant 72 h, puis collectées à 10 000 g pendant 10 min et stockées à -20 ° C jusqu'à utilisation. Pour la purification, les culots cellulaires congelés ont été remis en suspension dans une solution saline tamponnée au phosphate (PBS) (NaCl 137 mM, KCl 2,7 mM, phosphate 12 mM, pH 7,4), additionnée de 100 mg de lysozyme (Ovobest) et d'un inhibiteur de protéase (benzamidine 1 mM, acide ε-amino-caproïque 1 mM). La lyse cellulaire a été réalisée en utilisant une FrenchPress (G. Heinemann) en trois cycles à 18 000 psi. Ensuite, les débris cellulaires ont été culottés à 18 000 g pendant 15 min à 4 ° C. Le surnageant a été chargé sur une colonne brute Co2+-HiTrap Talon de 5 ml (Cytiva) à l'aide d'une pompe péristaltique. L'élution a été réalisée avec un tampon contenant de l'imidazole (1 × PBS + imidazole 350 mM, pH 7, 4), additionné de protéase HRV 3C dans un rapport de masse total de 500: 1 (protéine sur protéase) et dialysé à 4 ° C dans un tampon de protéase 3C (Tris 20 mM, NaCl 100 mM, dithiothréitol 2 mM, pH 8, 5) pendant 18 h. La solution protéique a été rechargée sur une colonne brute Co2+-HiTrap Talon tandis que cette fois, l'écoulement a été collecté. Dans le cas du FRP, la purification a été effectuée par SEC pour le polissage, tandis que la purification de l'OCP a été poursuivie avec une chromatographie d'interaction hydrophobe (HIC) pour éliminer l'apo-protéine. Les flux OCP collectés ont été dialysés pendant une nuit dans un tampon HIC (500 mM (NH4) 2SO4, 100 mM d'urée, 5 mM de phosphate, pH 7,5) à 4 ° C. Le HIC a été réalisé sur une colonne HiPrepTM 16/10 Phenyl HP (Cytiva) dans un système automatisé Azura FPLC (Knauer). Les protéines ont été éluées avec un tampon hydrophile (urée 100 mM, phosphate 5 mM, pH 7,5). Les fractions de protéines riches en caroténoïdes ont été concentrées à l'aide d'unités de filtre centrifuge à seuil de poids moléculaire de 10 kDa (MWCO) (Pall Corporation) pour la SEC. Le FRP a été concentré avec des unités de filtre centrifuge MWCO de 3 kDa. Ensuite, 500 µl de chacune des solutions de protéines concentrées ont été chargés sur une colonne SuperdexTM 200 Augmentation 10/300 (Cytiva) et élués avec du PBS 1X. Les protéines ont été stockées à -80 ° C jusqu'à leur utilisation.

Les séquences optimisées en codons codant pour les protéines FRPL existantes, FRP ancestrales et FRPL ancestrales ont été obtenues auprès d'Integrated DNA Technologies (IDT) ou de Twist Biosciences. Ils ont été clonés dans des vecteurs pET-LIC contenant une étiquette 6xHis N- ou C-terminale à l'aide de Gibson Assembly Master Mix (New England Biolabs). Les oligonucléotides utilisés sont présentés dans le tableau supplémentaire 1. L'assemblage correct a été vérifié par Sanger Sequencing (Microsynth). Les plasmides ont été transformés dans E. coli BL21 (DE3) (Invitrogen). Pour la surproduction de protéines, 50 ml de LB, additionnés de carbénicilline (Carb) (100 μg ml-1), ont été inoculés avec une seule colonie provenant d'une plaque LB + Carb fraîche et cultivés pendant une nuit à 37 ° C dans un incubateur à agitation. Six lots de 500 ml de LB + Carb ont été inoculés avec des cultures d'une nuit à OD600nm = 0,01 et cultivés à OD600nm = 0,6–0,8 pendant environ 2,5 h. La surproduction de protéines a été induite avec 1 mM d'IPTG. Après 4 h, les cellules ont été recueillies à 4 392 g pendant 20 min à 4 ° C et les culots cellulaires ont été stockés à -20 ° C jusqu'à utilisation. Pour la purification, les cellules ont été remises en suspension dans 35 ml de tampon A (NaCl 300 mM, Tris 20 mM, imidazole 20 mM, β-mercaptoéthanol 5 mM, pH 8, 0) et un comprimé de cOmplete Protease Inhibitor Cocktail (Roche) a été ajouté. Les cellules ont été rompues deux fois dans un microfluidiseur LM10 (Microfluidics) à 13 000 psi. Le lysat a été clarifié par centrifugation à 29 930 g pendant 30 min et passé à travers un filtre à seringue de 0, 45 µm, puis chargé sur une cartouche IMAC Mini Nuvia chargée de Ni Bio-Scale de 5 ml (BioRad). Après lavage avec 25 ml de tampon A, la protéine a été éluée avec un gradient linéaire sur 20 ml de 0 à 100% de tampon B (NaCl 300 mM, Tris 20 mM, imidazole 500 mM, β-mercaptoéthanol 5 mM, pH 8,0) dans un système NGC (BioRad). Les fractions contenant la protéine ont été vérifiées sur des gels SDS à 15 % coulés en interne et ont été regroupées pour la SEC avec une colonne HiLoad 26/600 Superdex (Cytiva) dans un tampon SEC (NaCl 200 mM, KCl 20 mM, HEPES 20 mM, pH 7,5) dans un système NGC. La pureté des fractions contenant la protéine a été vérifiée sur des gels SDS à 15 % coulés en interne et a été regroupée pour concentration à 2 000 g avec des unités de filtre centrifuge Amicon Ultra (Millipore) avec un MWCO de 3 kDa. Les protéines ont été stockées à -20 ° C jusqu'à leur utilisation.

Pour analyser la teneur en caroténoïdes des holo-protéines OCP, 50 µl de solution de protéine concentrée ont été mélangés avec 1 ml d'acétone et centrifugés à vitesse maximale à 4 ° C pour centrifuger la protéine précipitée. Le surnageant jaunâtre a été évaporé dans un concentrateur sous vide centrifuge (Eppendorf) à 30°C jusqu'à ce que l'acétone se soit complètement évaporée et que les caroténoïdes aient précipité sous forme de cristaux rouges. La solution d'eau restante a été éliminée et les cristaux de caroténoïde rouge ont été redissous dans 50 ul d'acétone. La solution riche en caroténoïdes a été transférée dans un flacon d'échantillon qui a été placé dans un système UFLC NexeraX2 (Shimadzu), équipé d'une colonne Accucore C30 (Thermo Fisher Scientific, 250 × 2,1 mm, granulométrie 2,6 µm, taille des pores 150 Å). Comme éluants de la phase mobile, le tampon A (méthanol sur eau, 95:5) et le tampon B (méthanol sur THF, 7:3) ont été utilisés avec le protocole suivant : 0–4,3 min 0 % de tampon B, 4,3–8,6 min gradient linéaire de 0 à 100 % de tampon B, 8,6–15,6 min 100 % de tampon B, 15,6–20,1 min 0 % de tampon B avec une constante débit de 0,4 ml min-1. Les caroténoïdes élués ont été vérifiés par spectrométrie de masse pour corréler les temps d'élution avec des espèces de caroténoïdes spécifiques ainsi que par chromatographie en couche mince et comparaison avec des échantillons de référence.

Les spectres d'absorption ont été enregistrés avec un spectromètre Maya2000Pro (Ocean Optics), couplé via une fibre à une source lumineuse deutérium tungstène (Sarspec) et un porte-cuve (CVH100, Thorlabs). Pour les analyses cinétiques OCP/FRP, un porte-cuve à température contrôlée avec un dispositif d'agitation constante qpod2e (Quantum Northwest) a été couplé par fibre à un spectromètre CCS100/M (Thorlabs) et à une source de lumière au tungstène SLS201L/M (Thorlabs). Pour l'éclairage avec de la lumière actinique, une diode électroluminescente de 3 W (Avonec) avec une émission maximale à 455 nm a été utilisée. Différents OCPO (mélangés avec différents FRP existants ou ancestraux ou FRPL existants ou ancestraux dans divers rapports molaires, ou seuls) ont été photo-commutés à l'état rouge (OCPR) en appliquant de la lumière bleue pendant au moins 3 min et 30 s ou jusqu'à ce qu'un plateau soit atteint, et la photo-récupération a été constamment suivie à 550 nm après avoir éteint la source de lumière bleue. Les constantes de temps de récupération (τ) ont été déterminées en ajustant les courbes de relaxation de l'OCPR aux rétroconversions de l'OCPO avec une fonction de décroissance mono-exponentielle et les écarts-types (sd) de trois répétitions indépendantes ont été calculés.

La spectroscopie de dichroïsme circulaire dans l'ultraviolet lointain a été utilisée pour évaluer la structure secondaire de P. borbori FRPL (PbFRPL) produit de manière hétérologue en solution. La protéine a été diluée à une concentration d'environ 50 µg ml-1 dans un tampon de dichroïsme circulaire (NaF 100 mM, Na2HPO4/NaH2PO4 10 mM, pH 7,5) et a été mesurée dans une cuvette de 0,1 cm à température ambiante à l'aide d'un spectropolarimètre JASCO J-810 (Jacso) dans la plage de 190 à 240 nm par étapes de balayage de 0,2 nm. Trois spectres successifs ont été enregistrés, la ligne de base corrigée et moyennée.

L'échantillon de protéine FRPL de P. borbori (PbFRPL) a été stocké à -20 ° C avant d'être échangé avec du tampon dans de l'acétate d'ammonium 200 mM (pH 6, 8) par plusieurs cycles de concentration et de dilution à l'aide de concentrateurs de protéines Pierce (Thermo Fisher). L'échantillon a ensuite été dilué à 4 µM (monomère) immédiatement avant les mesures. Les données ont été recueillies à l'aide de capillaires plaqués or internes sur un spectromètre de masse Q Exactive (ThermoFisher Scientific), fonctionnant en mode ion positif avec une température de source de 100 ° C et une tension capillaire de 1, 2 kV. Le piégeage dans la source a été réglé sur -100 V pour aider à la dissociation des petits adduits d'ions. L'optique de transfert d'ions et les gradients de tension dans tous les instruments ont été optimisés pour une transmission idéale. Les spectres ont été acquis avec dix micro-balayages pour augmenter le rapport signal sur bruit avec des temps transitoires de 64 ms, correspondant à la résolution de 17 500 à m/z = 200, et la cible AGC de 1,0 × 106. Le paramètre de seuil de bruit a été réglé sur trois et la plage de balayage utilisée était de 350 à 8 000 m/z.

La cristallisation de P. borbori FRPL (PbFRPL) a été réalisée par la méthode de la goutte suspendue à 20 ° C dans des gouttes de 2 µl, constituées de quantités égales de protéines et de solutions de précipitation. Le PbFRPL a cristallisé à 119 µM en 20 jours dans Li2SO4 0,2 M, CHES 0,1 M, pH 9,5 et tartrate de sodium:potassium 1,4 M. Avant la collecte des données, les cristaux ont été congelés rapidement dans de l'azote liquide sans l'utilisation de cryo-protecteurs. Les données du synchrotron ont été recueillies dans des conditions cryogéniques sur la ligne de lumière P13, exploitée par le Laboratoire européen de biologie moléculaire (EMBL) de Hambourg sur l'anneau de stockage PETRA III (Deutsches Elektronen Synchrotron)46. Les données ont été intégrées et mises à l'échelle avec XDS, et fusionnées avec XSCALE47. Les structures ont été déterminées par remplacement moléculaire avec PHASER48, construites manuellement en COOT49 et raffinées avec PHENIX50. Pour la détermination de la structure par remplacement moléculaire, la structure cristalline du FRP de Synechocystis sp. PCC 6803 (PDB ID 4JDX, réf. 25) a été utilisé comme modèle de recherche. La structure finale de PbFRPL a été téléchargée sur le RCSB PDB sous le numéro d'accession 8AG8. Les données ont été rendues et visualisées avec PyMol (v.2.4.0)51.

Après plusieurs cycles de culture, nous avons re-séquencé l'ensemble du génome de P. borbori pour exclure la perte du gène frpl lors de la culture (une explication possible de l'absence de FRPL dans tous les organismes modèles), la localisation du plasmide (qui pourrait faciliter l'HGT) ou la contamination de l'échantillon, mais nous avons découvert que le génome était un chromosome circulaire unique de 5,34 Mo, impliquant une copie du gène frpl, mais aucun homologue OCP, HCP ou CTDH (Extended Data Fig. 7d ). L'ADN génomique de P. borbori en phase stationnaire a été obtenu à l'aide du kit NucleoBond HMW DNA (Macherey-Nagel) conformément aux directives du fabricant, et en utilisant du lysozyme pour la lyse cellulaire (concentration finale 1 mg ml-1) pendant 1 h à 37 ° C dans 2 ml de Tris-HCl 10 mM, pH 8,0. La qualité et la concentration de l'ADN ont été évaluées à l'aide d'un spectrophotomètre NanoDrop 8000 et d'un fluoromètre Qubit 3 à l'aide de réactifs BR ADN double brin. La préparation de la bibliothèque a été réalisée à l'aide du kit de séquençage de ligature SQK-LSK109 (Oxford Nanopore Technologies), conformément aux directives du fabricant, sauf que l'ADN d'entrée a été multiplié par cinq pour correspondre à la molarité attendue dans le protocole car aucun cisaillement d'ADN n'a été appliqué. Le séquençage a été effectué sur un appareil MinION Mk1B pendant 24 h à l'aide d'une «Flongle Flow Cell» (FLO-FLG001, chimie cellulaire R9.4.1). Les données Nanopore ont été appelées par base avec le logiciel d'appel de base ONT Guppy. De longues lectures ont été assemblées à l'aide de canu52, ce qui a donné un seul chromosome circulaire. Les lectures brutes sont déposées au National Center for Biotechnology Information (NCBI) Sequence Read Archive et sont accessibles sous BioProject no. PRJNA865569 et n° d'accès BioSample. SAMN30120905.

La tache de type DSM17834 de la delta-protéobactérie P. borbori a été achetée auprès de la Collection allemande de micro-organismes et de cultures cellulaires (Braunschweig, Allemagne). Il a été cultivé en aérobiose dans un milieu PME (0,5 % de peptone, 0,3 % d'extrait de viande, pH 7,0) à 28 °C, et une courbe de croissance des triples biologiques a été enregistrée. Le temps de génération (G) pendant la croissance exponentielle a été estimé à l'aide de la formule \(G = \frac{{{{\Delta }}t}}{{3.3\log \left( {\frac{{{\mathrm{OD}}_2}}{{{\mathrm{OD}}_1}}} \right)}}\).

Des fusions de protéines pour la localisation in vivo avec microscopie à épifluorescence ont été générées par amplification par PCR du gène frpl de P. borbori comprenant 200 pb de la région 5 'non traduite et insertion dans des vecteurs pSG1164 avec une séquence codante mVenus N- ou C-terminale et une séquence de liaison 'GGGGGSL' dans le cadre à l'aide de Gibson Assembly Master Mix (NEB). L'assemblage correct a été vérifié par Sanger Sequencing (Microsynth). Des P. borbori chimiquement compétents ont été préparés par modification d'un protocole par Irani et John53, initialement développé pour P. aeruginosa, comme suit : le milieu a été remplacé par du PME et les températures ont été abaissées à 28 °C. Les plasmides ont été transformés en P. borbori en suivant le protocole de transformation d'Irani et John53, mais en changeant la température du choc thermique à 30 °C, le milieu en PME, la température de croissance à 28 °C et la concentration de carbénicilline à 100 µg ml-1. Les plaques ont été incubées à 28 °C pendant 48 h jusqu'à ce que les colonies soient visibles.

Pour la microscopie à épi-fluorescence, les cellules de P. borbori ont été cultivées à 28 oC et 200 tr/min à OD600 = 0,6 pour une « croissance exponentielle » et pendant 2 jours à OD600 d'environ 1,0 pour des conditions de « famine » dans les milieux PME. Les cellules ont été fixées sur des tampons d'agarose à 1 % en prenant en sandwich 100 ul d'agarose fondu entre deux lamelles (12 mm, Menzel). Ensuite, 3 µl de la culture ont été ajoutés sur une lamelle ronde (25 mm; Marienfeld) et fixés avec un tampon d'agarose. Pour l'acquisition d'images à champ large, un microscope Zeiss Observer A1 (Carl Zeiss) avec un objectif à immersion dans l'huile (grossissement ×100, ouverture numérique 1,45, alpha Plan-FLUAR ; Carl Zeiss) a été utilisé avec une caméra à dispositif à couplage de charge (CoolSNAP EZ ; Photometrics) et un éclairage de fluorescence aux halogénures métalliques HXP 120 avec contrôle d'intensité. Pour la microscopie à épifluorescence, un ensemble de filtres à protéines fluorescentes vertes a été utilisé (BrightLine 470/40, Beamsplitter 495 et Brightline 525/50). Les échantillons ont été éclairés pendant 0,5 à 2 s au plan médian de la cellule. La fluorescence intégrée des cellules entières a été déterminée par cellule et corrigée pour la fluorescence de fond. Le montage final des images a été effectué dans ImageJ2/ FIJI (v.1.52)54,55.

La SEC analytique a été réalisée avec une colonne Superdex 75 Augmentation 3,2/300 (Cytiva), équilibrée avec du PBS 1× à un débit de 0,1 ml min-1 et un volume total d'injection d'échantillon de 20 µl. Pour mesurer à un éclairage en lumière bleue, quatre LED de 3 W (Avonec) avec un maximum d'émission à 455 nm ont été montées sur un dissipateur thermique de 20 cm à des distances constantes devant la colonne SEC pour éclairer en continu l'échantillon sur la colonne. L'absorption a été enregistrée à 280, 496 et 550 nm pour suivre les profils d'élution.

Des modèles de complexes protéiques AlphaFold2 ont été générés à l'aide du serveur ColabFold56 le 20 mai 2022, en utilisant comme séquences d'entrée le CTD de l'un ou l'autre des OCP1 de Synechocystis sp. PCC 6803 (SYNY3) ou AncOCPall et FRP (SYNY3) avec les paramètres par défaut. De plus, la structure d'AncOCPall pleine longueur a été prédite séparément. Le 3 novembre 2022, nous avons répété l'analyse avec le CTD d'OCPx de G. kilaueensis JS1 ou un mutant S264Y (la sérine en position 264 (numération SYNY3) a été changée en tyrosine) de cet OCPx avec FRP (SYNY3). Les structures modélisées sont déposées dans les données source. Les données ont été rendues et visualisées avec PyMol (v.2.4.0)51.

La PAGE native a été réalisée dans une mini-protéine Tetra Cell (Biorad) en utilisant des gels de gradient coulés en interne avec une concentration d'acrylamide de 3 à 14% dans un système tampon Tris-glycine sans SDS pour obtenir des conditions de protéines natives. Aucun gel d'empilement n'a été utilisé. La chambre d'électrophorèse était constamment refroidie dans un réfrigérateur et éclairée par quatre LED de 3 W (Avonec) avec un maximum d'émission à 455 nm pour photo-commuter les protéines OCP dans le gel. La tension a été réglée à 80 V en permanence pendant 240 min, puis à 120 V pendant encore 100 min.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les données sources sont disponibles dans l'Open Research Data Repository de la Max Planck Society (Edmond) sous https://doi.org/10.17617/3.44RHFZ. Les données de cristallographie sont disponibles au RCSB PDB sous le numéro d'accession 8AG8. Les données de séquençage sont disponibles sur NCBI Sequence Read Archive sous BioProject PRJNA865569.

Peracchi, A. & Mozzarelli, A. Exploration et exploitation de l'allosterie : modèles, évolution et ciblage des médicaments. Biochim. Biophys. Acta 1814, 922–933 (2011).

Article CAS PubMed Google Scholar

Dawkins, R. Climbing Mount Improbable (Norton, 1996).

Pillai, AS et al. Origine de la complexité dans l'évolution de l'hémoglobine. Nature 581, 480–485 (2020).

Article CAS PubMed PubMed Central Google Scholar

Coyle, SM, Flores, J. & Lim, WA L'exploitation de l'allostérie latente permet l'évolution de nouveaux modes de régulation de la MAP kinase. Cellule 154, 875–887 (2013).

Article CAS PubMed PubMed Central Google Scholar

Bridgham, JT, Carroll, SM & Thornton, JW Evolution de la complexité des récepteurs hormonaux par exploitation moléculaire. Sciences 312, 97-101 (2006).

Article CAS PubMed Google Scholar

Pillai, AS, Hochberg, GKA & Thornton, JW Mécanismes simples pour l'évolution de la complexité des protéines. Protéine Sci. 31, e4449 (2022).

Article CAS PubMed PubMed Central Google Scholar

Muzzopappa, F. & Kirilovsky, D. Changement de couleur pour la photoprotection : la protéine caroténoïde orange. Tendances Plant Sci. 25, 92-104 (2020).

Article CAS PubMed Google Scholar

Slonimskiy, YB, Maksimov, EG & Sluchanko, NN Protéine de récupération de fluorescence : un régulateur puissant mais sous-exploré de la photoprotection chez les cyanobactéries. Photochem. Photobiol. Sci. 19, 763–775 (2020).

Article CAS PubMed Google Scholar

Kay Holt, T. & Krogmann, DW Une protéine caroténoïde de cyanobactéries. Biochim. Biophys. Acta 637, 408–414 (1981).

Article Google Scholar

Wilson, A. et al. Une protéine caroténoïde soluble impliquée dans la dissipation d'énergie liée au phycobilisome chez les cyanobactéries. Cellule végétale 18, 992–1007 (2006).

Article CAS PubMed PubMed Central Google Scholar

Wilson, A. et al. Une protéine caroténoïde photoactive agissant comme capteur d'intensité lumineuse. Proc. Natl Acad. Sci. États-Unis 105, 12075–12080 (2008).

Article CAS PubMed PubMed Central Google Scholar

Gwizdala, M., Wilson, A. & Kirilovsky, D. Reconstitution in vitro du mécanisme photoprotecteur cyanobactérien médié par la protéine caroténoïde orange dans Synechocystis PCC 6803. Plant Cell 23, 2631–2643 (2011).

Article CAS PubMed PubMed Central Google Scholar

Bao, H. et al. Familles supplémentaires de protéines caroténoïdes orange dans le système photoprotecteur des cyanobactéries. Nat. Plantes 3, 17089 (2017).

Article CAS PubMed Google Scholar

Boulay, C., Wilson, A., D'Haene, S. & Kirilovsky, D. Identification d'une protéine nécessaire à la récupération de la pleine capacité d'antenne dans le mécanisme photoprotecteur lié à l'OCP chez les cyanobactéries. Proc. Natl Acad. Sci. États-Unis 107, 11620–11625 (2010).

Article CAS PubMed PubMed Central Google Scholar

Thurotte, A. et al. La protéine de récupération de fluorescence cyanobactérienne a deux activités distinctes : les acides aminés de la protéine caroténoïde orange impliqués dans l'interaction FRP. Biochim. Biophys. Acta, Bioénerg. 1858, 308-317 (2017).

Article CAS PubMed Google Scholar

Muzzopappa, F., Wilson, A. & Kirilovsky, D. Les interactions interdomaines révèlent l'évolution moléculaire de la protéine caroténoïde orange. Nat. Plantes 5, 1076–1086 (2019).

Article CAS PubMed Google Scholar

Melnicki, MR et al. Structure, diversité et évolution d'une nouvelle famille de protéines solubles de liaison aux caroténoïdes chez les cyanobactéries. Mol. Usine 9, 1379–1394 (2016).

Article CAS PubMed Google Scholar

Schirrmeister, BE, Gugger, M. & Donoghue, PCJ Les cyanobactéries et le grand événement d'oxydation : preuves à partir de gènes et de fossiles. Paléontologie 58, 769–785 (2015).

Article PubMed PubMed Central Google Scholar

Moya, A. et al. Évolution progressive de la complexité des séquences génomiques chez les cyanobactéries. Sci. Rép. 10, 19073 (2020).

Article CAS PubMed PubMed Central Google Scholar

Moore, KR et al. Une phylogénie ribosomale élargie de cyanobactéries prend en charge un placement profond des plastes. Devant. Microbiol. 10, 1612 (2019).

Article PubMed PubMed Central Google Scholar

Rahmatpour, N. et al. Un nouvel isolat sans thylakoïdes comble un vide d'un milliard d'années dans l'évolution des cyanobactéries. Courant. Biol. 31, 2857–2867.e4 (2021).

Article CAS PubMed Google Scholar

Kirilovsky, D. & Kerfeld, CA La protéine caroténoïde orange : une protéine photoactive de lumière bleu-vert. Photochem. Photobiol. Sci. 12, 1135-1143 (2013).

Article CAS PubMed Google Scholar

Coleman, GA et al. Une phylogénie enracinée résout l'évolution bactérienne précoce. Sciences 372, eabe0511 (2021).

Article CAS PubMed Google Scholar

Vanparys, B., Heylen, K., Lebbe, L. & de Vos, P. Pseudomonas peli sp. nov. et Pseudomonas borbori sp. nov., isolée d'un inoculum nitrifiant. Int. J. Syst. 56, 1875–1881 (2006).

CAS Google Scholar

Sutter, M. et al. Structure cristalline du FRP et identification du site actif pour la modulation de la photoprotection médiée par l'OCP chez les cyanobactéries. Proc. Natl Acad. Sci. États-Unis 110, 10022–10027 (2013).

Article CAS PubMed PubMed Central Google Scholar

Sluchanko, NN, Slonimskiy, YB, Moldenhauer, M., Friedrich, T. et Maksimov, EG La suppression de la courte extension N-terminale dans l'OCP révèle le site principal de liaison au FRP. FEBS Lett. 591, 1667-1676 (2017).

Article CAS PubMed Google Scholar

Sluchanko, NN et al. Les topologies complexes de protéines OCP-FRP suggèrent un mécanisme de contrôle de la tolérance à la lumière élevée chez les cyanobactéries. Nat. Commun. 9, 3869 (2018).

Article PubMed PubMed Central Google Scholar

Jumper, J. et al. Prédiction très précise de la structure des protéines avec AlphaFold. Nature 596, 583–589 (2021).

Article CAS PubMed PubMed Central Google Scholar

Domínguez-Martín, MA et al. Structures d'un phycobilisome dans les états de collecte de lumière et de photoprotection. Nature 609, 835–845 (2022).

Slonimskiy, YB et al. Une protéine caroténoïde orange primordiale : structure, activité photoswitching et aspects évolutifs. Int. J. Biol. Macromol. 222, 167–180 (2022).

Article CAS PubMed Google Scholar

Jacob, F. Évolution et bricolage. Sciences 196, 1161-1166 (1977).

Article CAS PubMed Google Scholar

Petrescu, DI, Dilbeck, PL & Montgomery, BL Réglage environnemental des homologues du gène codant pour la protéine caroténoïde orange dans la cyanobactérie Fremyella diplosiphon. Devant. Microbiol. 12, 819604 (2021).

Article PubMed PubMed Central Google Scholar

Schulz, L., Sendker, FL & Hochberg, GKA Complexité non adaptative et fonction biochimique. Courant. Avis. Structure. Biol. 73, 102339 (2022).

Article CAS PubMed Google Scholar

Edgar, RC MUSCLE : alignement de séquences multiples avec une grande précision et un haut débit. Nucleic Acids Res. 32, 1792–1797 (2004).

Article CAS PubMed PubMed Central Google Scholar

Stamatakis, A. RAxML version 8 : un outil pour l'analyse phylogénétique et la post-analyse des grandes phylogénies. Bioinformatique 30, 1312-1313 (2014).

Article CAS PubMed PubMed Central Google Scholar

Kosiol, C. & Goldman, N. Différentes versions de la matrice de taux de Dayhoff. Mol. Biol. Évol. 22, 193–199 (2005).

Article CAS PubMed Google Scholar

Guindon, S. et al. Nouveaux algorithmes et méthodes pour estimer les phylogénies à vraisemblance maximale : évaluer les performances de PhyML 3.0. Syst. Biol. 59, 307–321 (2010).

Article CAS PubMed Google Scholar

Yang, Z. PAML 4 : analyse phylogénétique par maximum de vraisemblance. Mol. Biol. Évol. 24, 1586-1591 (2007).

Article CAS PubMed Google Scholar

Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ Outil de recherche d'alignement local de base. J. Mol. Biol. 215, 403–410 (1990).

Article CAS PubMed Google Scholar

Mende, DR et al. proGenomes2 : une base de données améliorée pour des annotations précises et cohérentes de l'habitat, taxonomiques et fonctionnelles des génomes procaryotes. Nucleic Acids Res. 48, D621–D625 (2020).

CAS PubMed Google Scholar

Le, SQ & Gascuel, O. Une matrice générale améliorée de remplacement des acides aminés. Mol. Biol. Évol. 25, 1307-1320 (2008).

Article CAS PubMed Google Scholar

Lemoine, F. et al. Renouveler le bootstrap phylogénétique de Felsenstein à l'ère du big data. Nature 556, 452–456 (2018).

Article CAS PubMed PubMed Central Google Scholar

Parcs, DH et al. GTDB : un recensement continu de la diversité bactérienne et archéenne grâce à une taxonomie phylogénétiquement cohérente, normalisée et complète basée sur le génome. Nucleic Acids Res. 50, D785–D794 (2022).

Article CAS PubMed Google Scholar

Minh, BQ et al. IQ-TREE 2 : nouveaux modèles et méthodes efficaces d'inférence phylogénétique à l'ère génomique. Mol. Biol. Évol. 37, 1530-1534 (2020).

Article CAS PubMed PubMed Central Google Scholar

Szöllősi, GJ, Rosikiewicz, W., Boussau, B., Tannier, E. & Daubin, V. Exploration efficace de l'espace des arbres génétiques réconciliés. Syst. Biol. 62, 901–912 (2013).

Article PubMed PubMed Central Google Scholar

Cianci, M. et al. P13, la ligne de lumière de cristallographie macromoléculaire de l'EMBL au niveau de l'anneau à faible émittance PETRA III pour le phasage à haute et basse énergie avec focalisation variable du faisceau. J. Synchrotron Rad. 24, 323–332 (2017).

Article CAS Google Scholar

Kabsch, W. XDS. Acta Crystallogr. D. 66, 125-132 (2010).

Article CAS PubMed PubMed Central Google Scholar

McCoy, AJ et al. Logiciel de cristallographie Phaser. J. Appl. Cristallologue. 40, 658–674 (2007).

Article CAS PubMed PubMed Central Google Scholar

Emsley, P. & Cowtan, K. Coot : outils de création de modèles pour les graphiques moléculaires. Acta Crystallogr. D. 60, 2126-2132 (2004).

Article PubMed Google Scholar

Adams, PD et al. PHENIX : un système complet basé sur Python pour la solution de structure macromoléculaire. Acta Crystallogr. D. 66, 213–221 (2010).

Article CAS PubMed PubMed Central Google Scholar

Le système graphique moléculaire PyMOL v.2.4.0 (Schrödinger, LLC).

Koren, S. et al. Canu : assemblage à lecture longue évolutif et précis via une pondération k-mer adaptative et une séparation répétée. Génome Res. 27, 722–736 (2017).

Article CAS PubMed PubMed Central Google Scholar

Irani, VR & Rowe, JJ Amélioration de la transformation de Pseudomonas aeruginosa PAO1 par Mg2+ et chaleur. BioTechniques 22, 54-56 (1997).

Article CAS PubMed Google Scholar

Rueden, CT et al. ImageJ2 : ImageJ pour la prochaine génération de données d'images scientifiques. BMC Bioinform. 18, 529 (2017).

Article Google Scholar

Schindelin, J. et al. Fidji : une plate-forme open source pour l'analyse d'images biologiques. Nat. Méthodes 9, 676–682 (2012).

Article CAS PubMed Google Scholar

Mirdita, M. et al. ColabFold : rendre le repliement des protéines accessible à tous. Nat. Méthodes 19, 679–682 (2022).

Article CAS PubMed PubMed Central Google Scholar

Zheng, L. et al. Aperçu structurel du mécanisme de transfert d'énergie dans les phycobilisomes cyanobactériens. Nat. Commun. 12, 5497 (2021).

Article CAS PubMed PubMed Central Google Scholar

Wilson, A. et al. Déterminants structurels sous-jacents à la photoprotection dans la protéine caroténoïde orange photoactive des cyanobactéries. J. Biol. Chim. 285, 18364–18375 (2010).

Article CAS PubMed PubMed Central Google Scholar

Télécharger les références

NS, SGG et GKAH sont soutenus par la société Max Planck. AARR et D.Schindler sont financés par la Max Planck Society dans le cadre du projet MaxGENESYS. TF reconnaît avec gratitude le financement de la Deutsche Forschungsgemeinschaft (subventions n° FR 1276/5-1 et FR 1276/6-1) et l'octroi de la Fondation Einstein pour la machine Azura FPLC. Cofinancé par l'Union Européenne (ERC, EVOCATION, 101040472). Les vues et opinions exprimées sont, cependant, celles de l'auteur ou des auteurs uniquement et ne reflètent pas nécessairement celles de l'Union européenne ou du Conseil européen de la recherche. Ni l'Union européenne ni l'autorité concédante ne peuvent en être tenues responsables. PLG remercie chaleureusement le soutien de la Deutsche Forschungsgemeinschaft (subvention n° GR1670/27-1). JLPB et D.Saman. remercier chaleureusement le soutien de la fiducie Leverhulme (subvention n° RPG-2021-246). Aux fins du libre accès, JLPB a appliqué une licence de droit d'auteur public CC BY à la version du manuscrit accepté par l'auteur résultant de cette soumission. Nous remercions NN Tavraz (TU Berlin) et C.-N. Mais (Université de Marburg) pour le soutien du laboratoire.

Financement en libre accès fourni par Max Planck Society.

Ces auteurs ont contribué à parts égales : Niklas Steube, Marcus Moldenhauer.

Institut Max Planck de microbiologie terrestre, Marburg, Allemagne

Niklas Steube, Adán A. Ramírez Rojas, Sriram G. Garg, Daniel Schindler & Georg KA Hochberg

Institut de chimie PC14, Université technique de Berlin, Berlin, Allemagne

Marcus Moldenhauer et Thomas Friedrich

Département de chimie, Université de Marburg, Marburg, Allemagne

Paul Weiland, Alexandra Kilb, Peter L. Graumann, Gert Bange & Georg KA Hochberg

Centre de microbiologie synthétique (SYNMIKRO), Marburg, Allemagne

Paul Weiland, Alexandra Kilb, Daniel Schindler, Peter L. Graumann, Gert Bange & Georg KA Hochberg

Département de chimie, Université d'Oxford, Oxford, Royaume-Uni

Dominic Saman et Justin LP Benesch

Institut Kavli pour la découverte des nanosciences, Université d'Oxford, Oxford, Royaume-Uni

Dominic Saman et Justin LP Benesch

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

NS, MM, TF et GKAH ont conçu le projet et supervisé la rédaction du manuscrit. NS a effectué la phylogénétique, la reconstruction de séquences ancestrales, la purification des protéines, la spectroscopie de dichroïsme circulaire et la manipulation génétique de P. borbori. MM a effectué des expériences de purification de protéines, biophysiques et biochimiques. PW et GB ont effectué une cristallographie des protéines et interprété les données. AK et PLG ont effectué une microscopie à épifluorescence et interprété les données. D.Saman et JLPB ont effectué une spectrométrie de masse native et interprété les données. AARR et D.Schindler ont séquencé P. borbori et analysé les données. SGG a déduit les arbres d'espèces phylogénétiques et effectué la réconciliation arbre de gènes-arbre d'espèces. NS, MM, TF et GKAH ont interprété toutes les données. Tous les auteurs ont contribué à la rédaction du manuscrit et à la discussion.

Correspondance à Thomas Friedrich ou Georg KA Hochberg.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Ecology & Evolution remercie Per Jemth et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Phylogénie ML des protéines OCP avec des protéines ancestrales reconstruites (Anc) au niveau des nœuds marqués et des protéines de type domaine C-terminal cyanobactériennes (CTDH) comme groupe externe (insert avec des contours noirs). Les paralogues et ancêtres OCP sont codés par couleur comme dans la figure 1b. Nous avons également testé une séquence plus conservatrice pour le dernier ancêtre commun d'OCP1 (conAncOCP1, en gris) (Extended Data Fig. 3a + e, 4d, h, l, p, t) ainsi que des ancêtres alternatifs 'altAll' pour chaque nœud de cet arbre (Extended Data Figs. 3a, 5a-l). Les nombres en italique sont les probabilités bootstrap de Felsenstein (FBP) de 100 répétitions. Les nombres gris sont des valeurs approximatives du test du rapport de vraisemblance (aLRT). Les longueurs de branche représentent les substitutions moyennes par site. Insérer avec des contours gris est un zoom avant triple pour afficher correctement la topologie de branche dans cette zone. Alignement de séquences multiples sous-jacent dans les données supplémentaires 1.

Phylogénie ML des protéines OCP comme dans Extended Data Fig. 1, mais avec des protéines caroténoïdes hélicoïdales cyanobactériennes (HCP, insert) comme groupe externe. Alignement de séquences multiples sous-jacent dans les données supplémentaires 1. Aucun ancêtre n'a été reconstruit ici.

a, Alignement de séquences multiples d'OCP1 de Synechocystis sp. PCC 6803 (SYNY3) avec des séquences OCP ancestrales reconstruites et des séquences alternatives respectives (alt). Les états importants pour la dimérisation de OCP1O16, OCP1R29, la décélération de OCP1 et l'interaction avec FRP7 sont indiqués, et rouge si conservé ou bleu sinon. La numérotation des résidus suit SYNY3 OCP1. Les régions du domaine C-terminal (CTD), du lieur et du domaine N-terminal (NTD) sont étiquetées en conséquence. L'OCP1 ancestral plus conservateur (conAncOCP1) et sa séquence alternative qui n'apparaissent pas dans le texte principal sont grisés. be, Distribution des probabilités a posteriori (pp) par site avec 20 catégories bin par séquence reconstruite avec la moyenne et le nombre de sites ambigus indiqués. Les sites ont été considérés comme ambigus si pp> 0,2 pour l'état avec le deuxième pp le plus élevé et ont été remplacés par ces états dans les ancêtres alt.

ad, 12 % SDS gels de polyacrylamide de purifications de protéines ancestrales. l, lysat. pi, traverser. w, laver. e, élution. -his, après le clivage de son étiquette. se, après chromatographie d'exclusion stérique. Les purifications ont été répétées trois fois avec des résultats similaires. eh, spectres d'absorption UV-Vis de l'état orange inactif et rouge actif des OCP ancestraux. ip, Récupération de la photoconversion des OCP ancestraux avec (dans des rapports molaires de 5 OCP pour 1 FRP) ou sans FRP existant de Synechocystis sp. PCC 6803 (SYNY3) comme indiqué à différentes températures. qt, tracés d'Arrhenius de la récupération après photoconversion avec (rouge) ou sans SYNY3 FRP (noir). uy, Récupération de la photoconversion des OCP ancestraux seuls ou avec différents FRP ancestraux ou FRPL ancestraux ou FRPL existants de Pseudomonas borbori dans différents rapports molaires comme indiqué à 20 ° C avec des constantes de temps de récupération moyennes respectives (τ) et sd de trois répliques indépendantes. Des ensembles de données représentatifs sont présentés pour plus de clarté.

ad, 12 % SDS gels de polyacrylamide de purifications alternatives de protéines ancestrales. l, lysat. pi, traverser. w, laver. e, élution. -his, après le clivage de son étiquette. se, après chromatographie d'exclusion stérique. Les purifications ont été répétées trois fois avec des résultats similaires. eh, spectres d'absorption UV-Vis de l'état orange inactif et rouge actif d'OCP ancestraux alternatifs. il, Récupération de la photoconversion d'OCP ancestraux alternatifs avec (cyan) ou sans (noir) FRP existant de Synechocystis sp. PCC 6803 à 20 ° C avec des constantes de temps de récupération moyennes respectives (τ) et sd de trois répétitions indépendantes. Des ensembles de données représentatifs sont présentés pour plus de clarté ; altAncOCPall est à peine photo-commutable.

Phylogénie des espèces ML avec probabilités bootstrap de Felsenstein (FBP) de 100 répétitions en italique. L'apparition des paralogues FRP et OCP est cartographiée à côté de la phylogénie. Les astérisques indiquent les entrées multispécifiques dans la base de données BLAST39. Le point d'exclamation marque la seule souche dépourvue de FRP tout en ayant OCP1. Alignement sous-jacent des séquences d'acides aminés dans les données supplémentaires 1.

a, h + i, gels de polyacrylamide SDS à 15 % de P. borbori, Methylocaldum sp., Desulfobacteriaceae (D) et Chlorobi sp. (C) FRPL après chromatographie d'exclusion de taille. Les purifications ont été répétées trois fois avec des résultats similaires. b, spectres de dichroïsme circulaire (CD) de P. borbori FRPL (noir) dans un tampon CD (gris). c, données de spectrométrie de masse native de P. borbori FRPL. d, Statistiques de séquençage Nanopore. e, Courbe de croissance de P. borbori en triples biologiques avec moyenne et écart type (SD) indiqués, et détermination du temps de génération (G) pendant la croissance exponentielle. f, Microscopie à épi-fluorescence de souches de P. borbori exprimant aucune (WT), mVenus uniquement (mVenus) ou des protéines de fusion FRPL avec fusion mVenus N- ou C-terminale. La fluorescence intégrée de la cellule entière avec la moyenne et l'écart-type, l'image en fond clair (BF), le signal du canal GFP (mVenus) et une superposition des deux (fusion) est affichée. Les flèches rouges indiquent les foyers de signal aux pôles cellulaires. La barre d'échelle représente 2 μm et s'applique à toutes les images. g, des tests t de Welch bilatéraux ont été effectués pour comparer la fluorescence intégrée moyenne des cellules entières avec *** p < 0,001, ** p = 0,013, ns, non significatif (p = 0,580) ; n = 28 cellules par condition. Les boîtes s'étendent des valeurs interquartiles inférieures aux valeurs supérieures des données, avec une ligne à la médiane. Les moustaches affichent des données dans des intervalles interquartiles de ± 1,5. Les cercles sont des valeurs aberrantes. j + k, Récupération de la photoconversion d'OCP1 de Synechocystis sp. PCC 6803 avec FRPL existant comme indiqué à 20 ° C avec des constantes de temps de récupération moyennes respectives (τ) et SD de trois répétitions indépendantes. Des ensembles de données représentatifs sont présentés pour plus de clarté.

a, alignement de la séquence d'acides aminés du FRP de Synechocystis sp. PCC 6803 (SYNY3) avec des FRPL ancestraux existants et reconstruits et des FRP ancestraux. Les sites importants pour l'homo-dimérisation et l'interaction avec OCP1 dans le FRP sont indiqués7,8 et rouges s'ils sont conservés ou bleus sinon. La numérotation suit SYNY3 FRP. Arbres ML pour les reconstructions de la Fig. 1 + 2. b + c, f + g, distribution des probabilités postérieures (pp) par site avec 20 catégories de bacs par séquence reconstruite avec la moyenne et le nombre de sites ambigus avec pp > 0,2 pour l'état avec le deuxième pp le plus élevé indiqué. j + h, gels de polyacrylamide SDS 15 % de protéines ancestrales après chromatographie d'exclusion stérique. Les purifications ont été répétées trois fois avec des résultats similaires. concentré, concentré. e, arbre phylogénétique FRP(L) initial non enraciné utilisé pour la reconstruction d'ancêtres alternatifs (alt) aux nœuds indiqués. Les longueurs de branche représentent les substitutions moyennes par site. Arbre complet dans la Fig. 2 supplémentaire. HGT, transfert horizontal de gènes. TBE, Transfer Bootstrap Expectation. i + j, Récupération de la photoconversion de SYNY3 OCP1 avec un FRP ancestral alternatif (altFRPpostHGT) ou un FRPL ancestral alternatif (altFRPLpreHGT) comme indiqué à différents rapports molaires à 20 ° C avec des constantes de temps de récupération moyennes respectives (τ) et sd de trois répliques indépendantes. Des ensembles de données représentatifs sont présentés pour plus de clarté. nd, non déterminable.

a + b, estimation de la confiance par résidu (pLDDT) des modèles AlphaFold2 illustrés à la Fig. 4d + e. c, Confiance de l'AncOCPall pleine longueur prédite avec les résidus indiqués dans le domaine C-terminal (CTD) impliqué dans l'interaction prédite avec le FRP de Synechocystis sp. PCC 6803 (SYNY3) qui sont bloqués par l'extension N-terminale (NTE, en magenta) dans l'état orange compact d'AncOCPall prédit ici. NTD, domaine N-terminal. d, Confiance de l'interaction modélisée entre AncOCPall et SYNY3 FRP. par exemple, les erreurs d'alignement prévues (PAE). h + i, les modèles AlphaFold2 du CTD d'OCPx de Gloeobacter kilaueensis JS1 ne prédisent pas une interaction avec SYNY3 FRP à l'interface attendue (conformément aux données expérimentales30), à moins que la sérine (S) en position 264 (numération SYNY3) ne soit modifiée pour la tyrosine (Y), l'état ancestral dans AncOCPall qui est en outre montré en superposition ici. Les encarts montrent les PAE.

Fig. supplémentaires. 1–3, tableau 1 et discussion.

Les alignements de séquences multiples sous-jacents des données étendues Figs. 1, 2 et 6 et Figs supplémentaires. 1 et 2.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Steube, N., Moldenhauer, M., Weiland, P. et al. Des surfaces de protéines fortuitement compatibles ont amorcé le contrôle allostérique dans la photoprotection des cyanobactéries. Nat Ecol Evol 7, 756–767 (2023). https://doi.org/10.1038/s41559-023-02018-8

Télécharger la citation

Reçu : 05 septembre 2022

Accepté : 21 février 2023

Publié: 03 avril 2023

Date d'émission : Mai 2023

DOI : https://doi.org/10.1038/s41559-023-02018-8

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt