304 Зварна спіральна труба/трубка з нержавіючої сталі, хімічний компонент, біосинтетичний потенціал глобального морського мікробіому

Дякуємо, що відвідали Nature.com.Ви використовуєте версію браузера з обмеженою підтримкою CSS.Для найкращої роботи радимо використовувати оновлений браузер (або вимкнути режим сумісності в Internet Explorer).Крім того, щоб забезпечити постійну підтримку, ми показуємо сайт без стилів і JavaScript.
Повзунки, що показують три статті на слайді.Використовуйте кнопки «Назад» і «Далі» для переходу між слайдами або кнопки керування слайдами в кінці для переходу між слайдами.

Детальний опис товару

304 Зварні згорнуті труби з нержавіючої сталі
1. Специфікація: змійова труба / трубка з нержавіючої сталі
2. Тип: зварні або безшовні
3. Стандарт: ASTM A269, ASTM A249
4. Змійова труба з нержавіючої сталі OD: від 6 мм до 25,4 мм
5. Довжина: 600-3500 мм або відповідно до вимог замовника.
6. Товщина стінки: від 0,2 мм до 2,0 мм.

7. Допуск: OD: +/-0,01 мм;Товщина: +/-0,01%.

8. Розмір внутрішнього отвору котушки: 500-1500 мм (можна регулювати відповідно до вимог замовника)

9. Висота котушки: 200-400 мм (можна регулювати відповідно до вимог замовника)

10. Поверхня: яскрава або відпалена
11. Матеріал: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, сплав 625, 825, 2205, 2507 тощо.
12. Упаковка: ткані мішки в дерев'яному футлярі, дерев'яний піддон, дерев'яний вал або відповідно до вимог замовника
13. Випробування: хімічний компонент, межа текучості, міцність на розрив, вимірювання твердості
14. Гарантія: перевірка третьою стороною (наприклад, SGS TV) тощо.
15. Застосування: оздоблення, меблі, транспортування нафти, теплообмінник, виготовлення перил, виготовлення паперу, автомобільна, харчова, медична тощо.

Увесь хімічний склад і фізичні властивості нержавіючої сталі, як показано нижче:

матеріал ASTM A269 Хімічний склад % Макс
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0,08 2.00 0,045 0,030 1,00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1,00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1,00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1,00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 10C -1,10 ^

 

матеріал Термічна обробка Температура F (C) Мін. Твердість
Брінель Роквелл
TP304 Рішення 1900 (1040) 192HBW/200HV 90HRB
TP304L Рішення 1900 (1040) 192HBW/200HV 90HRB
TP316 Рішення 1900 (1040) 192HBW/200HV 90HRB
TP316L Рішення 1900 (1040) 192HBW/200HV 90HRB
TP321 Рішення 1900 (1040) Ф 192HBW/200HV 90HRB
TP347 Рішення 1900 (1040) 192HBW/200HV 90HRB

 

OD, дюйм OD Толерантність дюйм (мм) Допустима вага % Довжина Tolernace дюйм (мм)
+ -
≤ 1/2 ± 0,005 (0,13) ± 15 1/8 (3,2) 0
> 1/2 ~1 1/2 ± 0,005(0,13) ± 10 1 / 8 (3,2) 0
> 1 1/2 ~< 3 1/2 ± 0,010(0,25) ± 10 3 / 16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015(0,38) ± 10 3 / 16 (4,8) 0
> 5 1/2 ~< 8 ± 0,030(0,76) ± 10 3 / 16 (4,8) 0
8 ~ < 12 ± 0,040(1,01) ± 10 3 / 16 (4,8) 0
12 ~ < 14 ± 0,050 (1,26) ± 10 3 / 16 (4,8) 0

Природні мікробні спільноти філогенетично та метаболічно різноманітні.Окрім недостатньо вивчених груп організмів1, це різноманіття також містить багатий потенціал для відкриття екологічно та біотехнологічно значущих ферментів і біохімічних сполук2,3.Проте вивчення цього різноманіття для визначення геномних шляхів, які синтезують такі сполуки та зв’язують їх із відповідними господарями, залишається проблемою.Біосинтетичний потенціал мікроорганізмів у відкритому океані залишається в основному невідомим через обмеження в аналізі даних роздільної здатності цілого геному в глобальному масштабі.Тут ми досліджуємо розмаїття та різноманітність кластерів біосинтетичних генів в океані, об’єднуючи близько 10 000 мікробних геномів із культивованих клітин і окремих клітин із понад 25 000 нещодавно реконструйованих чорнових геномів із понад 1000 зразків морської води.Ці зусилля виявили близько 40 000 передбачуваних переважно нових кластерів біосинтетичних генів, деякі з яких були знайдені в раніше не підозрюваних філогенетичних групах.У цих популяціях ми ідентифікували лінію, збагачену кластерами біосинтетичних генів («Candidatus Eudormicrobiaceae»), які належали до некультивованого бактеріального типу та включали деякі з найбільш біосинтетично різноманітних мікроорганізмів у цьому середовищі.З них ми охарактеризували фосфатазно-пептидний і пітонамідний шляхи, виявивши випадки незвичайної структури біоактивних сполук і ензимології відповідно.На завершення це дослідження демонструє, як стратегії, засновані на мікробіомах, можуть дозволити досліджувати раніше неописані ферменти та природні продукти харчування в погано вивченій мікробіоті та навколишньому середовищі.
Мікроби керують глобальними біогеохімічними циклами, підтримують харчові мережі та підтримують здоров’я рослин і тварин5.Їх величезне філогенетичне, метаболічне та функціональне різноманіття представляє багатий потенціал для відкриття нових таксонів1, ферментів і біохімічних сполук, включаючи природні продукти6.В екологічних спільнотах ці молекули забезпечують мікроорганізмам різноманітні фізіологічні та екологічні функції, від спілкування до конкуренції 2, 7 .Окрім своїх оригінальних функцій, ці природні продукти та їхні генетично закодовані шляхи виробництва є прикладами для біотехнологічних і терапевтичних застосувань2,3.Ідентифікація таких шляхів і зв'язків була значно полегшена дослідженням культивованих мікробів.Проте таксономічні дослідження природних середовищ показали, що переважна більшість мікроорганізмів не культивувалася8.Це культурне упередження обмежує нашу здатність використовувати функціональне різноманіття, закодоване багатьма мікробами4,9.
Щоб подолати ці обмеження, технологічний прогрес за останнє десятиліття дозволив дослідникам безпосередньо (тобто без попереднього культивування) секвенувати фрагменти мікробної ДНК цілих спільнот (метагеноміка) або окремих клітин.Здатність збирати ці фрагменти у більші фрагменти геному та реконструювати численні метагеномно зібрані геноми (MAG) або окремі ампліфіковані геноми (SAG), відповідно, відкриває важливу можливість для таксоцентричних досліджень мікробіому (тобто мікробних спільнот і мікробіому).прокладати нові шляхи.власний генетичний матеріал у даному середовищі) 10,11,12.Дійсно, нещодавні дослідження значно розширили філогенетичне представлення мікробного різноманіття на Землі1, 13 і виявили велику частину функціонального різноманіття в окремих мікробних спільнотах, які раніше не охоплювали культивовані еталонні послідовності генома мікроорганізмів (REF)14.Здатність помістити невиявлене функціональне різноманіття в контекст геному хазяїна (тобто роздільна здатність генома) має вирішальне значення для прогнозування ще не охарактеризованих мікробних ліній, які, імовірно, кодують нові природні продукти15,16, або для відстеження таких сполук до їх початкового виробника17.Наприклад, комбінований підхід метагеномного та одноклітинного геномного аналізу призвів до ідентифікації Candidatus Entotheonella, групи метаболічно пов’язаних із губкою бактерій, як виробників різноманітних лікарських засобів18.Однак, незважаючи на нещодавні спроби геномного дослідження різноманітних мікробних спільнот16,19, понад дві третини глобальних метагеномних даних для найбільшого океану екосистем Землі16,20 все ще відсутні.Таким чином, загалом біосинтетичний потенціал морського мікробіому та його потенціал як сховища нових ферментативних і природних продуктів залишаються в основному недостатньо вивченими.
Щоб дослідити біосинтетичний потенціал морських мікробіомів у глобальному масштабі, ми спочатку об’єднали геноми морських мікробів, отримані за допомогою методів, що залежать від культури, і методів, що не залежать від культури, щоб створити обширну базу даних філогенетики та функції генів.Дослідження цієї бази даних виявило широкий спектр кластерів біосинтетичних генів (BGC), більшість з яких належать до ще неохарактеризованих сімейств кластерів генів (GCF).Крім того, ми ідентифікували невідоме сімейство бактерій, яке на сьогодні демонструє найвищу відому різноманітність BGC у відкритому океані.Ми вибрали два шляхи рибосомального синтезу та посттрансляційно модифікованого пептиду (RiPP) для експериментальної перевірки на основі їх генетичних відмінностей від відомих на даний момент шляхів.Функціональна характеристика цих шляхів виявила несподівані приклади ензимології, а також структурно незвичайні сполуки з інгібіторною активністю протеази.
Спочатку ми мали на меті створити глобальний ресурс даних для аналізу геному, зосереджуючись на його бактеріальних і архейних компонентах.З цією метою ми об’єднали метагеномні дані та 1038 зразків морської води з 215 розподілених по всьому світу місць відбору проб (діапазон широт = 141,6°) і кількох глибинних шарів (від 1 до 5600 м у глибину, що охоплюють пелагіальну, мезопелагіальну та абісальні зони).Фон 21, 22, 23 (рис. 1а, розширені дані, рис. 1а та додаткова таблиця 1).Окрім забезпечення широкого географічного охоплення, ці вибірково відфільтровані зразки дозволили нам порівняти різні компоненти морського мікробіому, включно з багатим на віруси (<0,2 мкм), багатим на прокаріоти (0,2–3 мкм), багатим на частки (0,8 мкм). ).–20 мкм) і збіднені вірусом (>0,2 мкм) колонії.
a, Загалом 1038 загальнодоступних геномів (метагеноміка) морських мікробних спільнот, зібраних у 215 глобально розподілених місцях (від 62°S до 79°N і від 179°W до 179°E.).Плитки карти © Esri.Джерела: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ та Esri.b, ці метагеноми були використані для реконструкції MAG (методи та додаткова інформація), які відрізняються за кількістю та якістю (методи) у наборах даних (позначено кольором).Реконструйовані MAG були доповнені загальнодоступними (зовнішніми) геномами, включаючи створені вручну MAG26, SAG27 і REF.27 Скомпілюйте OMD.c, порівняно з попередніми звітами, заснованими лише на SAG (GORG)20 або MAG (GEM)16, OMD покращує геномну характеристику морських мікробних спільнот (швидкість метагеномного зчитування; метод) у два-три рази з більш послідовним представленням у глибині та широта..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n=132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, групування OMD на рівень видових кластерів (95% середня ідентичність нуклеотидів) ідентифікує загальну кількість приблизно 8300 видів, більше половини з яких раніше не були охарактеризовані згідно з таксономічними анотаціями за допомогою GTDB (версія 89) e, класифікація видів за типом геному показала, що MAG, SAG і REF добре доповнюють один одного, відображаючи філогенетичне різноманіття морський мікробіом.Зокрема, 55%, 26% і 11% видів були специфічними для MAG, SAG і REF відповідно.BATS, Бермудські Атлантичні часові ряди;GEM, геноми мікробіома Землі;GORG, еталонний геном глобального океану;ГАРЯЧИЙ, часовий ряд Гавайського океану.
Використовуючи цей набір даних, ми реконструювали загалом 26 293 MAG, переважно бактеріальних і архейних (рис. 1b і розширені дані, рис. 1b).Ми створили ці MAG зі збірок із окремих, а не об’єднаних метагеномних зразків, щоб запобігти збою природної варіації послідовності між зразками з різних місць або часових точок (методів).Крім того, ми згрупували геномні фрагменти на основі кореляції їх поширеності у великій кількості зразків (від 58 до 610 зразків, залежно від опитування; метод).Ми виявили, що це трудомісткий, але важливий крок24, який був пропущений під час кількох масштабних робіт з реконструкції MAG16, 19, 25 і значно покращує кількість (в середньому в 2,7 рази) і якість (в середньому +20%) геном.реконструйовано з дослідженого тут морського метагеному (розширені дані, рис. 2а та додаткова інформація).Загалом ці зусилля призвели до 4,5-кратного збільшення морських мікробних MAG (у 6 разів, якщо розглядати лише високоякісні MAG) порівняно з найповнішим доступним на сьогодні ресурсом MAG16 (Методи).Потім цей щойно створений набір MAG об’єднали з 830 підібраними вручну MAG26, 5969 SAG27 і 1707 REF.Двадцять сім видів морських бактерій і архей склали комбінаторну колекцію з 34 799 геномів (рис. 1b).
Потім ми оцінили нещодавно створений ресурс, щоб покращити його здатність представляти морські мікробні спільноти та оцінити вплив інтеграції різних типів геному.У середньому ми виявили, що він охоплює приблизно 40-60% морських метагеномних даних (рис. 1c), що в два-три рази перевищує охоплення попередніх звітів лише MAG як щодо глибини, так і широти Більше серій 16 або SAG20.Крім того, для систематичного вимірювання таксономічного різноманіття у встановлених колекціях ми анотували всі геноми за допомогою набору (методів) Бази даних таксономії генома (GTDB) і використовували середню ідентичність нуклеотидів у всьому геному 95%.28 для визначення 8304 видових кластерів (видів).Дві третини цих видів (включаючи нові клади) раніше не з’являлися в GTDB, з яких 2790 були виявлені за допомогою MAG, реконструйованого в цьому дослідженні (рис. 1d).Крім того, ми виявили, що різні типи геномів є висококомплементарними: 55%, 26% і 11% видів повністю складаються з MAG, SAG і REF відповідно (рис. 1e).Крім того, MAG охоплює всі 49 типів, знайдених у товщі води, тоді як SAG і REF представляють лише 18 і 11 з них відповідно.Однак SAG краще представляє різноманіття найпоширеніших клад (розширені дані, рис. 3a), таких як Pelagic Bacteriales (SAR11), причому SAG охоплює майже 1300 видів, а MAG – лише 390 видів.Примітно, що REF рідко збігалися з MAG або SAG на видовому рівні та репрезентували >95% із приблизно 1000 геномів, яких не було знайдено в досліджуваних тут метагеномних наборах відкритого океану, головним чином через взаємодію з іншими типами ізольованих репрезентативних морських зразків (наприклад, опадів) .або хост-асоційований).Щоб зробити його широко доступним для наукового співтовариства, цей ресурс морського геному, який також включає некласифіковані фрагменти (наприклад, із передбачених фагів, геномних острівців і фрагментів геному, для яких недостатньо даних для реконструкції MAG), можна порівняти з таксономічними даними .Отримайте доступ до анотацій разом із функціями генів і контекстними параметрами в базі даних мікробіології океану (OMD; https://microbiomics.io/ocean/).
Потім ми вирішили дослідити багатство та новизну біосинтетичного потенціалу мікробіомів відкритого океану.З цією метою ми спочатку використали antiSMASH для всіх MAG, SAG і REF, знайдених у 1038 морських метагеномах (методах), щоб передбачити загалом 39 055 BGC.Потім ми згрупували їх у 6907 ненадлишкових GCF і 151 популяцію кластерів генів (GCC; додаткова таблиця 2 і методи), щоб врахувати природну надлишковість (тобто той самий BGC може бути закодований у кількох геномах) і метагеномні дані. Фрагментація концентрованих BGC.Неповні BGC суттєво не збільшили, якщо такі були (додаткова інформація), кількість GCF і GCC, відповідно, що містять принаймні одного непошкодженого члена BGC у 44% і 86% випадків.
На рівні GCC ми виявили широкий спектр прогнозованих RiPP та інших природних продуктів (рис. 2a).Серед них, наприклад, арилполієни, каротиноїди, ектоїни та сидерофори належать до GCC з широким філогенетичним поширенням і високою кількістю в океанічних метагеномах, що може свідчити про широку адаптацію мікроорганізмів до морського середовища, включаючи стійкість до активних форм кисню, окислювальний і осмотичний стрес..або поглинання заліза (докладніше).Ця функціональна різноманітність контрастує з нещодавнім аналізом приблизно 1,2 мільйона BGC серед приблизно 190 000 геномів, що зберігаються в базі даних NCBI RefSeq (BiG-FAM/RefSeq, далі RefSeq)29, який показав, що нерибосомальні пептиди синтетази (NRPS) і полікетидсинтаза (PKS) BGC (додаткова інформація).Ми також знайшли 44 (29%) GCC лише віддалено пов’язані з будь-яким RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; рис. 2a та методи) та 53 (35%) GCC лише в MAG, підкреслюючи потенціал для виявлення раніше неописаних хімічних речовин в OMD.Враховуючи, що кожен із цих GCC, ймовірно, представляє дуже різноманітні біосинтетичні функції, ми додатково проаналізували дані на рівні GCF, намагаючись забезпечити більш детальне групування BGC, які, за прогнозами, кодуватимуть подібні природні продукти29.Загалом 3861 (56%) ідентифікованих GCF не збігалися з RefSeq, а >97% GCF не були присутні в MIBiG, одній з найбільших баз даних експериментально перевірених BGC (рис. 2b).Незважаючи на те, що не дивно виявити багато потенційних нових шляхів в умовах, які погано представлені еталонним геномом, наш метод дереплікації BGC у GCF перед порівняльним аналізом відрізняється від попередніх звітів 16 і дозволяє нам забезпечити неупереджену оцінку новизни.Більшість нового різноманіття (3012 GCF або 78%) відповідає прогнозованим терпенам, RiPP або іншим природним продуктам, і більша частина (1815 GCF або 47%) закодована в невідомих типах через їх біосинтетичний потенціал.На відміну від кластерів PKS і NRPS, ці компактні BGC мають меншу ймовірність бути фрагментованими під час метагеномної збірки 31 і дозволяють більше часу та ресурсів для функціональної характеристики своїх продуктів.
Загалом 39 055 BGC були згруповані в 6 907 GCF і 151 GCC.a, представлення даних (внутрішнє зовнішнє).Ієрархічна кластеризація відстаней BGC на основі GCC, 53 з яких фіксуються лише MAG.GCC містить BGC з різних таксонів (ln-перетворена частота воріт) і різних класів BGC (розмір кола відповідає його частоті).Для кожного GCC зовнішній рівень представляє кількість BGC, поширеність (відсоток зразків) і відстань (мінімальна косинусна відстань BGC (min(dMIBiG))) від BiG-FAM до BGC.GCC з BGC, тісно пов’язаними з експериментально перевіреними BGC (MIBiG), виділені стрілками.b Порівнюючи GCF із прогнозованими (BiG-FAM) та експериментально валідованими (MIBiG) BGC, було виявлено 3861 новий (d–>0,2) GCF.Більшість (78%) з них кодують RiPP, терпени та інші ймовірні природні продукти.c, усі геноми в OMD, знайдені в 1038 морських метагеномах, були розміщені в базовому дереві GTDB, щоб показати філогенетичне охоплення OMD.Клади без будь-яких геномів в OMD показані сірим кольором.Кількість BGC відповідає найбільшій кількості передбачених BGC на геном у даній кладі.Для ясності останні 15% вузлів згорнуті.Стрілки вказують на клади, багаті на BGC (>15 BGC), за винятком Mycobacterium, Gordonia (друге після Rhodococcus) і Crocosphaera (друге після Synechococcus).d, Невідомий c.Eremiobacterota продемонструвала найвищу біосинтетичну різноманітність (індекс Шеннона на основі типу природного продукту).Кожна смуга представляє геном із найбільшою кількістю BGC у виді.T1PKS, PKS типу I, T2/3PKS, PKS типу II та типу III.
Окрім багатства та новизни, ми досліджуємо біогеографічну структуру біосинтетичного потенціалу морського мікробіому.Групування зразків за середнім метагеномним розподілом кількості копій GCF (Методи) показало, що низькі широти, поверхневі, багаті прокаріотами та бідні вірусами спільноти, переважно з поверхневих або більш глибоких освітлених сонцем вод, були багаті терпенами RiPP та BGC.Навпаки, полярні, глибоководні, багаті на віруси та частинки спільноти були пов’язані з більшою кількістю NRPS та PKS BGC (розширені дані, рис. 4 та додаткова інформація).Нарешті, ми виявили, що добре вивчені тропічні та пелагічні спільноти є найбільш багатообіцяючими джерелами нових терпенів (Рисунок із доповненими даними).Найвищий потенціал для PKS, RiPP та інших натуральних продуктів (Рисунок 5a з розширеними даними).
Щоб доповнити наше дослідження біосинтетичного потенціалу морських мікробіомів, ми мали на меті скласти карту їх філогенетичного розподілу та ідентифікувати нові клади, збагачені BGC.З цією метою ми помістили геноми морських мікробів у нормалізоване філогенетичне дерево бактерій і архей GTDB13 і наклали передбачувані біосинтетичні шляхи, які вони кодують (рис. 2c).Ми легко виявили кілька кладів, збагачених BGC (представлених понад 15 BGC) у зразках морської води (методи), відомих своїм біосинтетичним потенціалом, таких як ціанобактерії (Synechococcus) і бактерії Proteus, такі як Tistrella32,33, або нещодавно привернули увагу своїми натуральні продукти.таких як Myxococcota (Sandaracinaceae), Rhodococcus і Planctomycetota34,35,36.Цікаво, що ми знайшли кілька раніше не досліджених ліній у цих кладах.Наприклад, ті види з найбагатшим біосинтетичним потенціалом у типах Planctomycetota та Myxococcota належали до неохарактеризованих кандидатських порядків та родів відповідно (Додаткова таблиця 3).У сукупності це свідчить про те, що OMD забезпечує доступ до раніше невідомої філогенетичної інформації, включаючи мікроорганізми, які можуть представляти нові мішені для відкриття ферментів і природних продуктів.
Далі ми охарактеризували клад, збагачений BGC, не лише підрахувавши максимальну кількість BGC, закодованих його членами, але й оцінивши різноманітність цих BGC, що пояснює частоту різних типів природних продуктів-кандидатів (рис. 2c та методи )..Ми виявили, що найбільш біосинтетично різноманітні види були представлені спеціально сконструйованими бактеріальними MAG у цьому дослідженні.Ці бактерії належать до некультивованого типу Candidatus Eremiobacterota, який залишається в основному невивченим, за винятком кількох геномних досліджень37,38.Примітно, що «бл.Рід Eremiobacterota був проаналізований лише в наземному середовищі39 і невідомо, щоб він включав будь-яких членів, збагачених BGC.Тут ми реконструювали вісім MAG одного виду (ідентичність нуклеотидів > 99%) 23. Тому ми пропонуємо назву виду «Candidatus Eudoremicrobium malaspinii», названу на честь нереїди (морської німфи), прекрасного подарунка в грецькій міфології та експедиціях.'Ка.Відповідно до філогенетичної анотації 13, E. malaspinii не має раніше відомих родичів нижче рівня послідовності, і тому належить до нової бактеріальної родини, яку ми пропонуємо «Ca.E. malaspinii» як типовий вид і «Ca.Eudormicrobiaceae» як офіційна назва (додаткова інформація).Коротка метагеномна реконструкція 'Ca.Проект геному E. malaspinii підтверджено метагеномним секвенуванням із дуже низьким вмістом, довго зчитуваним і цілеспрямованим складанням одного зразка (Методи) у вигляді єдиної лінійної хромосоми розміром 9,63 Мб із дублюванням 75 кб.як єдина двозначність, що залишилася.
Щоб встановити філогенетичний контекст цього виду, ми шукали 40 близькоспоріднених видів у додаткових метагеномних зразках, збагачених еукаріотами, з експедиції в океан Тара за допомогою цілеспрямованої реконструкції геному.Коротко кажучи, ми пов’язали метагеномні зчитування з геномними фрагментами, пов’язаними з “Ca.E. malaspinii» і висунули гіпотезу, що підвищений рівень набору в цій вибірці вказує на наявність інших родичів (методи).У результаті ми знайшли 10 MAG, комбінацію з 19 MAG, що представляють п’ять видів у трьох родах у межах нової визначеної родини (тобто «Ca. Eudormicrobiaceae»).Після ручної перевірки та контролю якості (розширені дані, рис. 6 та додаткова інформація) ми виявили, що «Ca.Види Eudormicrobiaceae мають більші геноми (8 Mb) і багатший біосинтетичний потенціал (від 14 до 22 BGC на вид), ніж інші члени «Ca».Clade Eremiobacterota (до 7 BGC) (рис. 3a–c).
a, Філогенетичні позиції п'яти 'Ca.Види Eudormicrobiaceae показали багатство BGC, специфічне для морських ліній, виявлених у цьому дослідженні.Філогенетичне дерево включає всі 'Ca.MAG Eremiobacterota та члени інших типів (номери геномів у дужках), надані в GTDB (версія 89), були використані для еволюційного фону (Методи).Зовнішні шари представляють класифікації на рівні родини («Ca. Eudormicrobiaceae» і «Ca. Xenobiaceae») і на рівні класу («Ca. Eremiobacteria»).П'ять видів, описаних у цьому дослідженні, представлені буквено-цифровими кодами та запропонованими біноміальними назвами (додаткова інформація).б, добре.Види Eudormicrobiaceae мають сім спільних ядер BGC.Відсутність BGC у кладі A2 була наслідком неповноти репрезентативного MAG (додаткова таблиця 3).BGC є специфічними для “Ca.Amphithomicrobium» і «Ca.Amphithomicrobium» (клади А і В) не показані.c, усі BGC кодуються як “Ca.Було виявлено, що Eudoremicrobium taraoceanii експресується в 623 метатранскриптомах, взятих з океанів Тари.Суцільні кола вказують на активну транскрипцію.Помаранчеві кружечки позначають log2-трансформовані складчасті зміни нижче та вище швидкості експресії гена господарювання (методи).d, криві відносної кількості (методи), що показують 'Ca.Види Eudormicrobiaceae широко поширені в більшості океанічних басейнів і у всій товщі води (від поверхні до глибини не менше 4000 м).На основі цих оцінок ми виявили, що «прибл.E. malaspinii» становить до 6% прокаріотичних клітин у глибоководних пелагічних зернових спільнотах.Ми вважали вид присутнім на ділянці, якщо він був знайдений у будь-якій частині розміру даного глибинного шару.IO – Індійський океан, NAO – Північна Атлантика, NPO – Північна частина Тихого океану, RS – Червоне море, SAO – Південна Атлантика, SO – Південний океан, SPO – Південна частина Тихого океану.
Вивчаючи чисельність і розподіл Са.Eudormicrobiaceae, яка, як ми виявили, переважає в більшості океанічних басейнів, а також у всій товщі води (рис. 3г).На місцевому рівні вони становлять 6% спільноти морських мікробів, що робить їх важливою частиною глобального морського мікробіому.Крім того, ми знайшли відносний вміст Са.Види Eudormicrobiaceae та їхні рівні експресії BGC були найвищими у збагаченій фракції еукаріотів (рис. 3c та розширені дані, рис. 7), що вказує на можливу взаємодію з твердими частинками, включаючи планктон.Це спостереження має деяку схожість з 'Ca.BGC Eudoremicrobium, які виробляють цитотоксичні природні продукти відомими шляхами, можуть проявляти хижацьку поведінку (додаткова інформація та розширені дані, малюнок 8), подібно до інших хижаків, які спеціально виробляють метаболіти, такі як Myxococcus41.Відкриття Ca.Eudormicrobiaceae у менш доступних (глибокоокеанських) або еукаріотичних, а не прокаріотичних зразках може пояснити, чому ці бактерії та їхнє несподіване різноманіття BGC залишаються незрозумілими в контексті досліджень природної їжі.
Зрештою, ми прагнули експериментально підтвердити перспективи нашої роботи, заснованої на мікробіомах, у відкритті нових шляхів, ферментів і натуральних продуктів.Серед різних класів BGC шлях RiPP, як відомо, кодує багату хімічну та функціональну різноманітність завдяки різноманітним посттрансляційним модифікаціям корового пептиду зрілими ферментами42.Тож ми вибрали два «Ка.BGC RiPP Eudoremicrobium (рис. 3b і 4a-e) базуються на тому ж, що й будь-який відомий BGC (\(\bar{d}\)MIBiG і \(\bar{d}\)RefSeq вище 0,2).
a–c, Гетерологічна експресія in vitro та ферментативні аналізи in vitro нового (\(\bar{d}\)RefSeq = 0,29) кластера біосинтезу RiPP, специфічного для глибоководних видів Са.E. malaspinii' призвело до виробництва дифосфорильованих продуктів.c, модифікації, ідентифіковані за допомогою MS/MS з високою роздільною здатністю (HR) (фрагментація вказана іонами b та y в хімічній структурі) та ЯМР (розширені дані, рис. 9).d, цей фосфорильований пептид демонструє низьке мікромолярне інгібування еластази нейтрофілів ссавців, яке не виявлено в контрольному пептиді та дегідратуючому пептиді (дегідратація, викликана хімічним видаленням).Експеримент повторювався тричі з однаковими результатами.Наприклад, гетерологічна експресія другого нового \(\bar{d}\)RefSeq = 0,33) кластера біосинтезу білка з'ясовує функцію чотирьох зрілих ферментів, які модифікують 46 амінокислотний коровий пептид.Залишки фарбуються відповідно до місця модифікації, передбаченого за допомогою HR-MS/MS, ізотопного мічення та аналізу ЯМР (додаткова інформація).Пунктирне забарвлення вказує на те, що модифікація відбувається в будь-якому з двох залишків.Малюнок є компіляцією численних гетерологічних конструкцій, щоб показати активність усіх зрілих ферментів на одному ядрі.h, Ілюстрація даних ЯМР для N-метилювання основного аміду.Повні результати показані на рис.10 з розширеними даними.i, Філогенетичне положення кластерного ферменту зрілого білка FkbM серед усіх доменів FkbM, знайдених у базі даних MIBiG 2.0, показує фермент цього сімейства з активністю N-метилтрансферази (додаткова інформація).Наведено схематичні діаграми BGCs (a, e), структур пептидів-попередників (b, f) та передбачуваних хімічних структур природних продуктів (c, g).
Перший шлях RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) був знайдений лише у глибоководних видів “Ca.E. malaspinii» та коди для пептиду-попередника (рис. 4а, б).У цьому зрілому ферменті ми ідентифікували єдиний функціональний домен, гомологічний домену дегідратації лантипептидсинтази, який зазвичай каталізує фосфорилювання та подальше видалення 43 (додаткова інформація).Таким чином, ми передбачаємо, що модифікація пептиду-попередника передбачає таку двоетапну дегідратацію.Однак, використовуючи тандемну мас-спектрометрію (MS/MS) і спектроскопію ядерного магнітного резонансу (ЯМР), ми ідентифікували поліфосфорильований лінійний пептид (рис. 4c).Незважаючи на те, що це було неочікувано, ми знайшли кілька доказів того, що він є кінцевим продуктом: два різних гетерологічних господаря та відсутність дегідратації в аналізах in vitro, ідентифікація ключових залишків, мутованих у каталітичному місці дегідратації зрілого ферменту.все реконструйовано “Ca”.Геном E. malaspinii (розширені дані, рис. 9 та додаткова інформація) і, нарешті, біологічна активність фосфорильованого продукту, але не хімічно синтезованої дегідратованої форми (рис. 4d).Насправді ми виявили, що він демонструє низьку мікромолярну інгібіторну активність протеази проти еластази нейтрофілів, порівнянну з іншими спорідненими природними продуктами в діапазоні концентрацій (IC50 = 14,3 мкМ) 44, незважаючи на те, що екологічну роль ще належить з’ясувати.На підставі цих результатів ми пропонуємо назвати шлях «фосфептин».
Другий випадок - це складний шлях RiPP, специфічний для 'Ca.Передбачалося, що рід Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) кодує природні білкові продукти (рис. 4e).Ці шляхи становлять особливий біотехнологічний інтерес через очікувану щільність і різноманітність незвичайних хімічних модифікацій, створених ферментами, кодованими відносно короткими BGCs45.Ми виявили, що цей білок відрізняється від раніше охарактеризованих білків тим, що йому не вистачає як основного мотиву NX5N поліцерамідів, так і лантіонінової петлі ландорнамідів 46 .Щоб подолати обмеження загальних гетерологічних моделей експресії, ми використали їх разом із спеціальною системою Microvirgula aerodenitrificans для характеристики чотирьох зрілих шляхів ферментів (методи).Використовуючи комбінацію MS/MS, ізотопного мічення та ЯМР, ми виявили ці зрілі ферменти в 46-амінокислотному ядрі пептиду (рис. 4f, g, розширені дані, рис. 10–12 і додаткова інформація).Серед зрілих ферментів ми охарактеризували першу появу члена сімейства FkbM O-метилтрансфераз 47 у шляху RiPP і несподівано виявили, що цей зрілий фермент вводить N-метилювання скелета (рис. 4h, i та додаткова інформація).Незважаючи на те, що ця модифікація відома в природних продуктах NRP48, ферментативне N-метилювання амідних зв’язків є складною, але біотехнологічно важливою реакцією49, яка досі представляла інтерес для сімейства борозинів RiPP.Специфічність 50,51.Ідентифікація цієї активності в інших сімействах ферментів і RiPP може відкрити нові застосування та розширити функціональне різноманіття білків 52 і їх хімічне різноманіття.На основі ідентифікованих модифікацій і незвичайної довжини запропонованої структури продукту ми пропонуємо назву шляху «пітонамід».
Відкриття несподіваної ензимології у функціонально охарактеризованому сімействі ферментів ілюструє перспективність геноміки навколишнього середовища для нових відкриттів, а також ілюструє обмежені можливості для функціонального висновку, заснованого лише на гомології послідовності.Таким чином, разом із повідомленнями про неканонічні біоактивні поліфосфорильовані RiPP, наші результати демонструють ресурсомістку, але критичну цінність для зусиль синтетичної біології, спрямованих на повне розкриття функціонального багатства, різноманітності та незвичайних структур біохімічних сполук.
Тут ми демонструємо діапазон біосинтетичного потенціалу, закодованого мікробами, та їх геномний контекст у глобальному морському мікробіомі, сприяючи майбутнім дослідженням, надаючи отримані ресурси доступним науковому співтовариству (https://microbiomics.io/ocean/).Ми виявили, що більшу частину його філогенетичної та функціональної новизни можна отримати лише шляхом реконструкції MAG та SAG, особливо в недостатньо використовуваних мікробних спільнотах, які могли б спрямовувати майбутні зусилля з біорозвідки.Хоча тут ми зосередимося на «Ca.Eudormicrobiaceae» як лінії, особливо біосинтетично «талановитої», багато з BGC, передбачених у невідкритій мікробіоті, ймовірно, кодують раніше неописані ензимології, які дають сполуки з екологічно та/або біотехнологічно значущими діями.
Метагеномні набори даних з основних океанографічних досліджень і досліджень часових рядів з достатньою глибиною секвенування були включені, щоб максимізувати охоплення глобальних морських мікробних спільнот в океанських басейнах, глибоких шарах і з часом.Ці набори даних (додаткова таблиця 1 і малюнок 1) включають метагеноміку зразків, зібраних в океанах Тари (збагачених вірусами, n=190; збагачених прокаріотами, n=180)12,22 та експедиції BioGEOTRACES (n=480).Гавайський океанічний часовий ряд (HOT, n = 68), Бермудсько-Атлантичний часовий ряд (BATS, n = 62)21 та експедиція Маласпіна (n = 58)23.Зчитування секвенування з усіх метагеномних фрагментів було відфільтровано на якість за допомогою BBMap (v.38.71) шляхом видалення адаптерів секвенування зі зчитувань, видалення зчитувань, зіставлених із послідовностями контролю якості (геноми PhiX), і використання trimq=14, maq=20 відкидає низьку якість зчитування, maxns = 0 і minlength = 45. Подальші аналізи було виконано або об’єднано з результатами QC, якщо вказано (bbmerge.sh minoverlap=16).Показники контролю якості були нормалізовані (bbnorm.sh target = 40, minddepth = 0) перед створенням за допомогою metaSPAdes (v.3.11.1 або v.3.12, якщо потрібно)53.Отримані контиги каркасу (надалі іменовані каркасами) були остаточно відфільтровані за довжиною (≥1 кб).
1038 метагеномних зразків було розділено на групи, і для кожної групи зразків результати метагеномного контролю якості всіх зразків були зіставлені з квадратними дужками кожного зразка окремо, що призвело до наступної кількості парних групових показників у дужках: Морські віруси Тара – збагачений (190×190 ), Prokariotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) і Malaspina (58×58).Картування виконано за допомогою Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, що дозволяє зіставляти показання з другорядними сайтами (використовуючи прапор -a).Вирівнювання було відфільтровано таким чином, щоб мати довжину принаймні 45 баз, мати ≥97% ідентичності та охоплювати ≥80% читань.Отримані BAM-файли були оброблені за допомогою сценарію jgi_summarize_bam_contig_depths для MetaBAT2 (v.2.12.1)55, щоб забезпечити внутрішньо- та міжвибіркове покриття для кожної групи.Нарешті, дужки були згруповані для підвищення чутливості шляхом індивідуального запуску MetaBAT2 на всіх зразках із –minContig 2000 і –maxEdges 500. Ми використовуємо MetaBAT2 замість ансамблевого боксера, оскільки незалежні тести показали, що він є найефективнішим одиночним боксером.і в 10-50 разів швидше, ніж інші широко використовувані боксери57.Щоб перевірити вплив кореляції чисельності, випадково відібрана підвибірка метагеноміки (10 для кожного з двох наборів даних океану Тари, 10 для BioGEOTRACES, 5 для кожного часового ряду та 5 для Malaspina) додатково використовувала лише зразки.Внутрішні зразки групуються для отримання інформації про покриття.(Додаткова інформація).
Додаткові (зовнішні) геноми були включені в подальший аналіз, а саме 830 MAG, відібраних вручну, з підмножини набору даних Tara Oceans26, 5287 SAG з набору даних GORG20 і дані з бази даних MAR (MarDB v. 4) з 1707 ізольованих REF і 682 SAG) 27. Для набору даних MarDB геноми вибираються на основі доступних метаданих, якщо тип вибірки відповідає такому регулярному виразу: '[S|s]single.?[C|c]ell|[C|c]ulture| [I|i] ізольований'.
Якість кожного метагеномного контейнера та зовнішніх геномів оцінювали за допомогою CheckM (v.1.0.13) і Anvi'o Lineage Workflow (v.5.5.0)58,59.Якщо CheckM або Anvi'o повідомляють про ≥50% повноту/повноту та ≤10% забруднення/надлишковість, збережіть метагеномні клітини та зовнішні геноми для подальшого аналізу.Потім ці показники були об’єднані в середню повноту (mcpl) і середнє забруднення (mctn), щоб класифікувати якість геному відповідно до критеріїв спільноти60 наступним чином: висока якість: mcpl ≥ 90% і mctn ≤ 5%;хороша якість: mcpl ≥ 70%, mctn ≤ 10%, середня якість: mcpl ≥ 50% і mctn ≤ 10%, задовільна якість: mcpl ≤ 90% або mctn ≥ 10%.Відфільтровані геноми потім корелювали з показниками якості (Q і Q') таким чином: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (варіабельність штаму)/100 + 0,5 x log[N50] .(реалізовано в dRep61).
Щоб уможливити порівняльний аналіз між різними джерелами даних і типами геномів (MAG, SAG і REF), 34 799 геномів було розіменовано на основі загальногеномної середньої нуклеотидної ідентичності (ANI) за допомогою dRep (v.2.5.4).Повтори)61 з пороговими значеннями 95% ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) і однокопійними маркерними генами з використанням SpecI63, що забезпечує кластеризацію геному на видовому рівні.Репрезентативний геном був обраний для кожного кластера dRep відповідно до максимального показника якості (Q'), визначеного вище, який вважався репрезентативним для виду.
Щоб оцінити швидкість відображення, BWA (v.0.7.17-r1188, -a) використовувався для відображення всіх 1038 наборів метагеномних зчитувань із 34 799 геномами, що містяться в OMD.Зчитування з контрольованою якістю були зіставлені в односторонньому режимі, а отримані вирівнювання були відфільтровані, щоб зберегти лише вирівнювання довжиною ≥45 bp.і ідентичність ≥95%.Коефіцієнт відображення для кожного зразка — це відсоток показань, що залишилися після фільтрації, поділений на загальну кількість показань контролю якості.Використовуючи той самий підхід, кожен із 1038 метагеномів було зменшено до 5 мільйонів вставок (розширені дані, рис. 1c) і зіставлено з GORG SAG в OMD та у всіх GEM16.Кількість MAG, вилучених з морської води в каталозі GEM16, визначалася за ключовими запитами метагеномних джерел, вибираючи зразки морської води (наприклад, на відміну від морських відкладень).Зокрема, ми вибираємо «aquatic» як «ecosystem_category», «marine» як «ecosystem_type» і фільтруємо «habitat» як «deep ocean», «marine», «maritime oceanic», «pelagic marine», «marine water» , «Океан», «Морська вода», «Поверхнева морська вода», «Поверхнева морська вода».Це призвело до 5903 MAG (734 високої якості), розподілених по 1823 OTU (перегляди тут).
Прокаріотичні геноми були таксономічно анотовані за допомогою GTDB-Tk (v.1.0.2)64 із параметрами за замовчуванням, орієнтованими на GTDB r89 версії 13. Anvi'o використовувався для ідентифікації еукаріотичних геномів на основі прогнозування домену та запам’ятовування ≥50% і надмірності ≤ 10%.Таксономічна анотація виду визначається як один із його репрезентативних геномів.За винятком еукаріотів (148 MAG), кожен геном спочатку був функціонально анотований за допомогою prokka (v.1.14.5)65, назвавши повні гени, визначивши параметри «архей» або «бактерії» за потреби, про що також повідомляється для не- кодування генів.і регіони CRISPR, серед інших геномних особливостей.Анотуйте передбачені гени, ідентифікуючи універсальні однокопійні маркерні гени (uscMG) за допомогою fetchMG (v.1.2)66, призначайте ортологічні групи та надсилайте запити за допомогою emapper (v.2.0.1)67 на основі eggNOG (v.5.0)68.База даних KEGG (опубліковано 10 лютого 2020 р.) 69. Останній крок було виконано шляхом зіставлення білків із базою даних KEGG за допомогою DIAMOND (v.0.9.30)70 з охопленням запиту та теми ≥70%.Результати були додатково відфільтровані згідно з NCBI Prokaryotic Genome Annotation Pipeline71 на основі бітрейту ≥ 50% від максимального очікуваного бітрейту (саме посилання).Генні послідовності також використовувалися як вхідні дані для ідентифікації BGC в геномі за допомогою antiSMASH (v.5.1.0)72 з параметрами за замовчуванням і різними кластерними вибухами.Усі геноми та анотації скомпільовано в OMD разом із контекстними метаданими, доступними в Інтернеті (https://microbiomics.io/ocean/).
Подібно до описаних раніше методів12,22 ми використовували CD-HIT (версія 4.8.1) для кластеризації >56,6 мільйонів генів, що кодують білки, з бактеріальних і архейних геномів з OMD у 95% ідентичність і коротші гени (90% охоплення)73 до >17,7 мільйонів генних кластерів.Найдовша послідовність була обрана як репрезентативний ген для кожного генного кластера.Потім 1038 метагеномів було зіставлено з >17,7 мільйонами членів кластера BWA (-a), а отримані BAM-файли були відфільтровані, щоб зберегти лише вирівнювання з ≥95% відсотковою ідентичністю та ≥45 базовими вирівнюваннями.Нормалізовану за довжиною кількість генів розраховували шляхом спочатку підрахунку вставок із найкращого унікального вирівнювання, а потім, для нечітко відображених вставок, додавання дробових підрахунків до відповідних цільових генів, пропорційних їхній кількості унікальних вставок.
Геноми з розширеного OMD (з додатковими MAG з “Ca. Eudormicrobiaceae”, див. нижче) були додані до бази даних інструменту метагеномного аналізу mOTUs74 (версія 2.5.1), щоб створити розширену довідкову базу даних mOTU.Лише шість однокопійних геномів (23 528 геномів) вижили з десяти uscMG.Розширення бази даних призвело до появи 4494 додаткових кластерів на видовому рівні.1038 метагеномів було проаналізовано з використанням параметрів mOTU за замовчуванням (версія 2).Загалом 989 геномів, що містяться в 644 кластерах mOTU (95% REF, 5% SAG і 99,9% належать до MarDB), не були виявлені профілем mOTU.Це відображає різні додаткові джерела морської ізоляції геномів MarDB (більшість невиявлених геномів пов’язані з організмами, виділеними з опадів, морськими господарями тощо).Щоб продовжувати зосереджуватися на середовищі відкритого океану в цьому дослідженні, ми виключили їх з аналізу нижньої течії, якщо вони не були виявлені або включені в розширену базу даних mOTU, створену в цьому дослідженні.
Усі BGC від MAG, SAG і REF в OMD (див. вище) були об’єднані з BGC, ідентифікованими у всіх метагеномних каркасах (antiSMASH v.5.0, параметри за замовчуванням) і охарактеризовані за допомогою BiG-SLICE (v.1.1) (домен PFAM)75.На основі цих характеристик ми обчислили всі косинусні відстані між BGC і згрупували їх (середні зв’язки) у GCF і GCC, використовуючи порогові значення відстані 0,2 і 0,8 відповідно.Ці порогові значення є адаптацією порогових значень, які раніше використовувалися з використанням евклідової відстані75 разом із косинусною відстанню, що зменшує деякі помилки в оригінальній стратегії кластеризації BiG-SLICE (додаткова інформація).
Потім BGC фільтрували, щоб зберегти лише ≥5 кб, закодованих на каркасах, щоб зменшити ризик фрагментації, як описано раніше16, і виключити MarDB REF і SAG, не знайдені в 1038 метагеномах (див. вище).Це призвело до того, що загалом 39 055 BGC були закодовані геномом OMD, з додатковими 14 106 ідентифікованими на метагеномних фрагментах (тобто не об’єднаних у MAG).Ці «метагеномні» BGC були використані для оцінки частки потенціалу біосинтезу морських мікробіомів, не зафіксованого в базі даних (додаткова інформація).Кожен BGC був функціонально охарактеризований відповідно до прогнозованих типів продукту, визначених анти-SMASH або більш грубими категоріями продуктів, визначеними в BiG-SCAPE76.Щоб запобігти зміщенням вибірки в кількісному визначенні (таксономічний і функціональний склад GCC/GCF, відстань GCF і GCC до довідкових баз даних і метагеномна чисельність GCF), шляхом збереження лише найдовшого BGC на GCF для кожного виду, 39 055 BGCs були додатково дедупліковані, що призвело до загальної кількості 17 689 BGC.
Новизна GCC та GCF була оцінена на основі відстані між розрахованою базою даних (база даних RefSeq у BiG-FAM)29 та експериментально підтвердженою (MIBIG 2.0)30 BGC.Для кожного з 17 689 репрезентативних BGC ми вибрали найменшу косинусну відстань до відповідної бази даних.Потім ці мінімальні відстані усереднюються (середнє) відповідно до GCF або GCC, залежно від обставин.GCF вважається новим, якщо відстань до бази даних перевищує 0,2, що відповідає ідеальному розриву між (середнім) GCF і еталонним.Для GCC ми вибираємо 0,4, що вдвічі перевищує порогове значення, визначене GCF, щоб зафіксувати довгострокові відносини з посиланнями.
Метагеномну поширеність BGC оцінювали як середню поширеність його біосинтетичних генів (як визначено анти-SMASH), доступних з профілів генного рівня.Метагеномну чисельність кожного GCF або GCC потім розраховували як суму репрезентативних BGC (з 17 689).Ці карти чисельності були згодом нормалізовані для клітинного складу з використанням підрахунку mOTU на зразок, який також враховував зусилля з секвенування (розширені дані, рис. 1d).Поширеність GCF або GCC розраховували як відсоток зразків із кількістю > 0.
Евклідова відстань між зразками була розрахована з нормалізованого профілю GCF.Ці відстані були зменшені в розмірі за допомогою UMAP77, а отримані вбудовування використовувалися для неконтрольованої кластеризації на основі щільності за допомогою HDBSCAN78.Оптимальна мінімальна кількість балів для кластера (і, отже, кількість кластерів), що використовується HDBSCAN, визначається максимізацією сукупної ймовірності членства в кластері.Ідентифіковані кластери (і випадкова збалансована підвибірка цих кластерів для врахування зсуву в перестановному багатофакторному дисперсійному аналізі (PERMANOVA)) перевірялися на значущість відносно нескорочених евклідових відстаней за допомогою PERMANOVA.Середній розмір геному зразків розраховували на основі відносної кількості mOTU та розрахункового розміру геному членів геномів.Зокрема, середній розмір геному кожного mOTU був оцінений як середнє значення розмірів геномів його членів, скоригованих на повноту (після фільтрації) (наприклад, 75% повного геному довжиною 3 Мб має скоригований розмір 4 Mb).для середніх геномів з цілісністю ≥70%.Потім середній розмір геному для кожного зразка був розрахований як сума розмірів геному mOTU, зважених за відносною кількістю.
Відфільтрований набір геномно-кодованих BGC в OMD показано в бактеріальних і архейних деревах GTDB (у рамках ≥5 кб, за винятком REF і SAG MarDB, які не знайдені в 1038 метагеномах, див. вище) і їх прогнозовані категорії продуктів на основі філогенетичних положення геному (див. вище).Спочатку ми зменшили дані за видами, використовуючи як репрезентативний геном із найбільшою кількістю BGC у цьому виді.Для візуалізації представники були далі розділені на групи дерев, і знову для кожної клітинної клади був обраний геном, що містить найбільшу кількість BGCs.Види, збагачені BGC (принаймні один геном із >15 BGC), були додатково проаналізовані шляхом розрахунку індексу різноманітності Шеннона для типів продуктів, закодованих у цих BGC.Якщо всі передбачені типи продукту однакові, хімічні гібриди та інші складні BGC (як передбачено анти-SMAH) вважаються такими, що належать до того самого типу продукту, незалежно від їх порядку в кластері (наприклад, злиття білок-бактеріоцин і бактеріоцин-протеопротеїн тіло).гібрид).
Залишок ДНК (за оцінками 6 нг) із зразка Malaspina MP1648, що відповідає біологічному зразку SAMN05421555 і відповідає набору для метагеномного зчитування Illumina SRR3962772 для короткого зчитування, обробленого відповідно до протоколу секвенування PacBio з наднизьким введенням для використання набору PacBio ампліфікації зразка gDNA SMRTbell набір (100-980-000) і набір для підготовки шаблону SMRTbell Express 2.0 (100-938-900).Коротко кажучи, решту ДНК розрізали, відремонтували та очистили (кульки ProNex) за допомогою Covaris (g-TUBE, 52104).Потім очищену ДНК піддають бібліотечній підготовці, ампліфікації, очищенню (кульки ProNex) і вибору розміру (>6 кб, Blue Pippin) перед остаточним етапом очищення (кульки ProNex) і секвенування на платформі Sequel II.
Реконструкція перших двох бл.Для MAG Eremiobacterota ми ідентифікували шість додаткових ANI >99% (вони включені на малюнок 3), які спочатку були відфільтровані на основі балів забруднення (пізніше визначені як дублікати генів, див. нижче).Ми також знайшли тацю з написом «Ca».Eremiobacterota» з різних досліджень23 і використовував їх разом із вісьмома MAG з нашого дослідження як еталон для метагеномних зчитувань із 633 еукаріотичних збагачених (>0,8 мкм) зразків з використанням BWA (v.0.7.17) Ref -r1188, – позначка) для пониженої дискретизації картографування (5 млн читань).На основі специфічних для збагачення карт (відфільтрованих за 95% ідентичністю вирівнювання та 80% охопленням читання) 10 метагеномів (очікуване охоплення ≥5×) було відібрано для складання та ще 49 метагеномів (очікуване охоплення ≥1×) для кореляції вмісту.Використовуючи ті самі параметри, що й вище, ці зразки були об’єднані та додано 10 додаткових «Ca».MAG Eremiobacterota відновлено.Ці 16 MAG (не рахуючи двох, які вже є в базі даних) доводять загальну кількість геномів у розширеній OMD до 34 815.MAG призначаються таксономічні ранги на основі їх геномної подібності та положення в GTDB.18 MAGs були дерепліковані за допомогою dRep на 5 видів (внутрішньовидовий ANI >99%) і 3 роди (внутрішньовидовий ANI від 85% до 94%) в межах однієї родини79.Представники видів були відібрані вручну на основі цілісності, забруднення та N50.Запропонована номенклатура наведена в Додатковій інформації.
Оцініть цілісність і забруднення 'Ca.MAG Eremiobacterota, ми оцінили наявність uscMG, а також однокопійних наборів генів-маркерів, специфічних для лінії та домену, які використовували CheckM та Anvi'o.Ідентифікація 2 дублікатів із 40 uscMG була підтверджена філогенетичною реконструкцією (див. нижче), щоб виключити будь-яке потенційне зараження (це відповідає 5% на основі цих 40 маркерних генів).Додаткове дослідження п'яти типових MAG 'Ca.Низький рівень забруднень у цих реконструйованих геномах було підтверджено для видів Eremiobacterota за допомогою інтерактивного інтерфейсу Anvi'o на основі кореляцій чисельності та складу послідовності (додаткова інформація)59.
Для філогеномічного аналізу ми вибрали п'ять репрезентативних MAG "Ca".Eudormicrobiaceae», всі види «Ca.Геном Eremiobacterota та представників інших типів (включаючи UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria та Planctomycetota) доступний у GTDB (r89)13.Усі ці геноми були анотовані, як описано раніше для екстракції гена маркера однієї копії та анотації BGC.Геноми GTDB були збережені відповідно до наведених вище критеріїв цілісності та забруднення.Філогенетичний аналіз проводився за допомогою робочого процесу Anvi'o Phylogenetics59.Дерево було створено за допомогою IQTREE (v.2.0.3) (параметри за замовчуванням і -bb 1000)80 на основі вирівнювання 39 тандемних рибосомальних білків, ідентифікованих Anvi'o (MUSCLE, v.3.8.1551)81.Його посади були скорочені.щоб охопити принаймні 50% геному82, і Planctomycecota використовувався як зовнішня група на основі топології дерева GTDB.Одне дерево з 40 uscMG було побудовано з використанням тих самих інструментів і параметрів.
Ми використали Traitar (v.1.1.2) із параметрами за замовчуванням (фенотип, з нуклеотидів)83 для прогнозування загальних мікробних ознак.Ми досліджували потенційний хижацький спосіб життя на основі раніше розробленого хижацького індексу84, який залежить від вмісту гена, що кодує білок, у геномі.Зокрема, ми використовуємо DIAMOND для порівняння білків у геномі з базою даних OrthoMCL (v.4)85, використовуючи параметри –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 ТА підрахувати гени, що відповідають гени-маркери для хижаків і нехижаків.Індекс — різниця між кількістю хижих і нехижих міток.Як додатковий контроль ми також проаналізували геном «Ca».Фактор Entotheonella TSY118 заснований на його асоціації з Ca.Eudoremicrobium (великий розмір геному та біосинтетичний потенціал).Далі ми перевірили потенційні зв’язки між маркерними генами хижаків і нехижаків і біосинтетичний потенціал Ca.Eudormicrobiaceae» і виявили, що не більше одного гена (з будь-якого типу маркерного гена, тобто гена хижака/нехижака) збігається з BGC, що свідчить про те, що BGC не плутає сигнали хижацтва.Додаткова геномна анотація зашифрованих репліконів була виконана за допомогою TXSSCAN (v.1.0.2) для спеціального дослідження системи секреції, пілі та джгутиків86.
П'ять репрезентативних 'Ca' були картографовані шляхом картографування 623 метатранскриптомів із прокаріотичних і еукаріотичних фракцій збагачення океанів Тари22,40,87 (з використанням BWA, v.0.7.17-r1188, -a прапор).Геном Eudormicrobiaceae.Файли BAM були оброблені за допомогою FeatureCounts (v.2.0.1)88 після 80% охоплення читання та 95% фільтрації ідентичності (з параметрами featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p) Підраховує кількість вставок на ген.Згенеровані карти були нормалізовані для довжини гена та кількості генів-маркерів mOTU (нормализована за довжиною середня кількість вставок для генів із кількістю вставок >0) і логарифмично перетворено до 22,74, щоб отримати відносну експресію на клітину кожного рівня гена, що також пояснює мінливість від зразка до зразка під час секвенування.Такі співвідношення дозволяють проводити порівняльний аналіз, пом’якшуючи проблеми складу при використанні даних відносної чисельності.Тільки зразки з >5 з 10 маркерних генів mOTU розглядалися для подальшого аналізу, щоб дозволити виявити достатньо велику частину геному.
Нормалізований профіль транскриптому 'Ca.E. taraoceanii піддавали зменшенню розмірності за допомогою UMAP, а отримане представлення використовували для неконтрольованої кластеризації за допомогою HDBSCAN (див. вище) для визначення статусу експресії.PERMANOVA перевіряє значущість відмінностей між ідентифікованими кластерами у вихідному (не скороченому) просторі відстані.Диференційну експресію між цими умовами перевіряли в геномі (див. вище) і ідентифікували 201 шлях KEGG у 6 функціональних групах, а саме: BGC, гени системи секреції та джгутикові гени з TXSSCAN, ферменти деградації (протеази та пептидази), а також хижі та не- хижі гени.хижі індексні маркери.Для кожного зразка ми розрахували медіану нормалізованої експресії для кожного класу (зауважте, що сама експресія BGC розраховується як медіана експресії біосинтетичних генів для цього BGC) і протестована на значущість у різних штатах (тест Краскела-Уолліса з поправкою на FDR).
Синтетичні гени були придбані в GenScript, а ПЛР-праймери були придбані в Microsynth.Для ампліфікації ДНК використовували полімеразу Phusion від Thermo Fisher Scientific.Для очищення ДНК використовували плазміди NucleoSpin, гель NucleoSpin та набір для очищення ПЛР від Macherey-Nagel.Ферменти рестрикції та ДНК-лігазу Т4 були придбані в New England Biolabs.Хімічні речовини, крім ізопропіл-β-d-1-тіогалактопіранозиду (IPTG) (Biosynth) і 1,4-дитіотреїтолу (DTT, AppliChem), були придбані у Sigma-Aldrich і використані без додаткового очищення.Антибіотики хлорамфенікол (Cm), спектиноміцину дигідрохлорид (Sm), ампіцилін (Amp), гентаміцин (Gt) і карбеніцилін (Cbn) були придбані в AppliChem.Компоненти середовищ Bacto Tryptone та Bacto Yeast Extract були придбані в BD Biosciences.Трипсин для секвенування був придбаний у Promega.
Генні послідовності були виділені з анти-SMASH передбаченого BGC 75.1.E. malaspinii (додаткова інформація).
Гени embA (локус, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (локус, MALA_SAMN05422137_METAG-framework_127-gene_4) і embAM (включаючи міжгенні області) секвенували як синтетичні конструкції в pUC57(AmpR) з оптимізацією кодонів і без них ed для вираження в E коли.Ген embA був субклонований у перший сайт множинного клонування (MCS1) pACYCDuet-1(CmR) і pCDFDuet-1(SmR) із сайтами розщеплення BamHI та HindIII.Гени embM і embMopt (оптимізовані за кодонами) були субклоновані в MCS1 pCDFDuet-1(SmR) за допомогою BamHI і HindIII і поміщені в другий сайт множинного клонування pCDFDuet-1(SmR) і pRSFDuet-1(KanR) (MCS2) за допомогою NdeI/ChoI.Касета embAM була субклонована в pCDFDuet1(SmR) із сайтами розщеплення BamHI та HindIII.Ген orf3/embI (локус, MALA_SAMN05422137_METAG-scaffold_127-gene_3) був сконструйований шляхом ПЛР з розширенням перекривання з використанням праймерів EmbI_OE_F_NdeI та EmbI_OE_R_XhoI, розщеплених NdeI/XhoI та лігованих у pCDFDuet-1-EmbM (MCS1) з використанням того самого ре стрикційні ферменти (додатково стіл).6).Розщеплення ферментом рестрикції та лігування проводили згідно з протоколом виробника (New England Biolabs).

 


Час публікації: 14 березня 2023 р