De Novo Transcriptome Samsetning og genauppgötvun á Cistanche Deserticola holdugum stöngli-Ⅰ

Sep 18, 2024

Bakgrunnur

Cistanche deserticola er algjörlega óljóstillífandi sníkjudýr planta með mikið lækningagildi og er aðallega dreift í eyðimörkinni í Norðvestur Kína. Þurrkaður holdugur stilkur hans er mikilvægt tonic íhefðbundin kínversk læknisfræðimeð það hlutverk aðallega að bæta kynlíf karla og styrkja ónæmi, en fáar vélrænar rannsóknir hafa verið gerðar að hluta til vegna skorts á erfðafræðilegum og umritafræðilegum auðlindum.

Natural cistanche tubulosa

NÁTTÚRLEGT CISTANCHE TUBULOSA KÍNSKA HEFÐBUNDIN LÆKNING PHGS75% ECH 30% ACT 12%

Niðurstöður

Í þessari rannsókn gerðum við djúpa umritaröðun í holdugum stilk C. deserticola og um 80 milljónir lestra voru búnar til með Illumina para-enda raðgreiningu á HiSeq2000 pallinum. Með því að nota trinity assembler fengum við 95.787 afritaraðir með lengd umrits á bilinu 200bp til 15.698bp, með meðallengd 950 basa og N50 lengd 1.519 basa. 63.957 umrit voru auðkennd sem virkan tjáð með FPKM Stærra en eða jafnt og 0,5, þar sem 30.098 afrit voru merkt með genalýsingum eða genaverufræðilegum hugtökum með raðlíkingargreiningum gegn nokkrum opinberum gagnagrunnum (Uniprot, NR og Nt hjá NCBI og KEGG) . Ennfremur greindum við lykilensímgen sem taka þátt í nýmyndun ligníns og fenýletanóíð glýkósíða (PhGs) sem vitað er að eru aðal virku innihaldsefnin. Fjögur phenylalanine ammonia-lyase (PAL) gen, fyrsta lykilensímið í lignín- og PhG-lífmyndun, voru auðkennd á grundvelli raðsamanburðar og fylkingargreiningar. Tvær lífmyndunarleiðir PhGs voru einnig lagðar til í fyrsta skipti.

Ályktanir

Alls kláruðum við alþjóðlega greiningu á C. deserticola holdugum stofnafriti með því að nota RNA-seq tækni. Safn af ensímgenum sem tengjast nýmyndun ligníns og fenýletanóíð glýkósíða voru auðkennd úr samsettum og merktum umritum og einnig var spáð fyrir um genafjölskyldu PAL. Röðugögnin úr þessari rannsókn munu veita dýrmæta auðlind til að framkvæma framtíðarrannsóknir á fenýletanóíð glýkósíð lífmyndun og hagnýtar erfðafræðilegar rannsóknir í þessari mikilvægu lyfjaplöntu.

Inngangur

C. deserticola er um allan heim ættkvísl fjölærra eyðimerkurplantna af Orobanchaceae fjölskyldunni og er algjörlega óljóstillífandi tegund og vex venjulega holoparasitic plöntu neðanjarðar. Það er sníkjudýr á rótum psammophyte Haloxylon ammodendron (Chenopodiaceae), sem býr aðallega í eyðimörkum og hálfgerðum eyðimörkum vegna mikils þols gegn þurrkum og seltu. C. deserticola sýnir mikla mótstöðu gegn erfiðum umhverfisaðstæðum og er aðallega dreift í Norðvestur Kína, sérstaklega í Innri Mongólíu, Gansu og Xinjiang. Hún er talin vera í útrýmingarhættu á undanförnum árum vegna aukinnar neyslu manna. C. deserticola sem oft er kallað eyðimerkurginseng er almennt þekkt sem eyðimerkur-sóp og þurrkaður holdugur stilkur hefur verið mikið notaður sem hefðbundinn mikilvægur tonic í Kína og Japan í mörg ár. Það var upphaflega skráð í Shen Nong Ben Cao Jing (Dictionary of Chinese Materia Medica, 1977) fyrir um það bil 1800 árum og var talin ein helsta heimildin umKínversk lækningajurt Cistanche.

Chinese cistanche tubulosa

NATURAL CISTANCHE TUBULOSA TIL AÐ BÆTTA KYNFERÐ PHGS75% ECH 30% ACT 12%

Útdrættirnir af C. deserticola hafa margvíslega lækningavirkni, sérstaklega til notkunar við að bæta kynlíf, styrkja nýru, vernda lifur, eyrnavirkni, auka minni, ónæmisbælandi, andoxunarvirkni, bólgueyðandi, veirueyðandi virkni o.s.frv. Helstu lífvirku þættir C. deserticola eru fenýletanóíð glýkósíð (PheGs, PhGs). Hingað til hafa meira en 20 fenýletanóíð glýkósíð verið einangruð úr safaríkum stofni C.deserticola. Meðal þeirra,acteoside og echinacosideeru tveir meginþættir með umtalsverða lyfjafræðilega virkni og eru skráðir sem gæðastaðlar C. deserticola í kínversku lyfjaskránni (2005 og 2010 útgáfur). Þrír efnafræðilegir þættir PhGs eru lífræn sýra, sakkaríð og fenýletanóíð, en smáatriðin varðandi fenýletanóíð lífmyndunarferla eru enn illa skilin í C.deserticola.

Þrátt fyrir viðskiptalegt og læknisfræðilegt mikilvægi C.deserticola eru erfðafræði- og umritaupplýsingar þessarar tegundar mjög takmarkaðar. Engin EST eru tiltæk í NCBI gagnagrunninum og heildarupplýsingar um erfðamengi fyrir þessa tegund eru enn ekki tiltækar nema hvað varðar blaðgrænu erfðamengisröðina. Takmörkuð umritunargögn koma í veg fyrir rannsókn á PhG lífmyndunaraðferðum. RNA-seq tækni getur búið til raðir af tjáðum hlutum markhóps erfðamengisins og auðkennt gen [18] með því að nota NGS tæknipalla (eins og Applied Biosystems SOLiD, Illumina HiSeq og Roche 454). Það er að verða sífellt vinsælli í samsetningu transcriptome de novo, þar sem það er hagkvæm og öflug nálgun með hárri upplausn og breitt kraftsvið, sérstaklega þar sem það hefur þann kost að kanna lítið magn afrita. Vegna hinna ýmsu kosta er RNA-seq sérstaklega aðlaðandi fyrir lífverur sem ekki eru fyrirmyndir með takmarkaðar erfðaauðlindir. Hins vegar eru engar nákvæmar rannsóknir á C. deserticola transcriptome með RNA-seq.

Í þessari rannsókn raðgreindum við stofnafritið fyrir C. deserticola á heimsvísu með því að nota Illumina Hiseq2000 pallinn og fengum 7,9G hrá gögn. Með samsetningu og athugasemdum námum við genin sem taka þátt í nýmyndun PhG og genunum sem bera ábyrgð á allri lífmyndun ligníns. RNA-seq greining okkar myndaði fyrsta C. deserticola samræmda umritið og veitti nýja innsýn í alhliða skilning á lækningagildi C. deserticola. Að auki er hægt að beita aðferðinni sem hér er lýst víða við umritamyndir til að auðvelda uppgötvun gena sem taka þátt í tilteknum lífmyndunarferlum lyfjaþátta í annarri lyfjaplöntu með mjög takmarkaða erfðafræðilega auðlind.

Efni og aðferðir

Söfnun plantnaefnis

Ferskur safaríkur stilkur fyrir C. deserticola á uppgröftsstigi var safnað frá plöntustöð í BayanHot City of Alxa League í Innri Mongólíu í norðvesturhluta Kína. Söfnunarleyfið var fengið frá eiganda (HongKui CongRong Group) stöðvarinnar. Skírteinissýnishornið var afhent í Core Genomic Facility hjá Beijing Institute of Genomics, kínversku vísindaakademíunni. Eftir hreinsun voru safaríku stofnvefirnir skornir í litla bita og frystir strax í fljótandi köfnunarefni og síðan geymdir við -80 gráðu þar til frekari vinnsla.

RNA útdráttur, smíði cDNA bókasafns og Illumina raðgreining

Heildar-RNA var dregið úr safaríka stofninum með TRIzol Reagent (Invitrogen Inc., Kaliforníu, Bandaríkjunum) samkvæmt leiðbeiningum framleiðanda. Sýnin sem fengust voru meðhöndluð með DNasa I til að fjarlægja allt erfðafræðilegt DNA. Útdregin RNA voru magngreind með því að nota Agilent 2100 lífgreiningartæki (Agilent Technologies) og athugað með tilliti til heilleika með því að nota denaturing agarose gel rafdrætti með ethidium bromide litun. RNA sýni með A260/A280 hlutföll á milli 1,9 og 2,1, RNA 28S:18S hlutföll hærri en 1,0 og RNA heilleikatölur (RINs) -8.5 voru notuð í síðari greiningum.

RNA-seq söfnin voru mynduð með Illumina Truseq RNA Sample Preparation Kits. Pólý(A)+ RNA var einangrað úr heildar-RNA með því að nota Dynal ligo(dT)25 perlur samkvæmt leiðbeiningum framleiðanda. Eftir hreinsun var sundurbrotsbuffi bætt við til að brjóta mRNA í stutta búta. Fyrsta strengs cDNA var búið til með því að nota þessi stuttu brot sem sniðmát, ásamt SuperScript III bakriti og N6 handahófskenndum hexamer grunni. Annar-strengs cDNA var síðan myndað með stuðpúða, dNTPs, RNaseH og DNA pólýmerasa I. Tvíþátta cDNA sem myndast var gert fyrir endaviðgerð með því að nota T4 DNA pólýmerasa, DNA pólýmerasa I Klenow brot og T4 fjölkjarna kínasa, og tengt við millistykki með T4 DNA lígasa. Aðlögunarbundin brot voru hreinsuð með QiaQuick PCR útdráttarbúnaði og skoluð með EB jafnalausn. Eftir greiningu með því að nota agarósa gel rafdrætti voru viðeigandi brot valin sem sniðmát fyrir PCR mögnun. Raðgreining cDNA safnsins sem myndast var framkvæmd með Illumina HiSeq 2000 kerfi.

Uppskrift de novo samsetningu og magn genatjáningar

Hreinsuð aflestrar sem mynduð voru úr raðgreiningu voru hreinsuð með því að fjarlægja millistykkisröð (ATCTCGTATGCCGTC) með aðferð innanhúss. Við framkvæmdum síðan strangt síunarferli af lágum gæðum. Í fyrsta lagi yrðu basar með phred gæðastig lægra en 20 klipptir frá 3'enda röðarinnar, þar til þeir lenda í einum basa með hærri gæðum (Stærri en eða jafnt og 20). Ef leslengdin væri styttri en 50bp, yrði henni hent. Í öðru lagi verður lesið síað frekar út frá þeirri viðmiðun að 70% grunna í einni lestri séu með hágæða stig (hærra en eða jafnt og 20). Í þriðja lagi voru aðeins pöruð enda les notuð til frekari samsetningar. De novo afritssamsetningin var framkvæmd með Trinity útgáfu_20130216 [30] sem samanstóð af þremur hugbúnaðareiningum í röð: Inchworm, Chrysalis og Butterfly. Samsetningarfæribreytur voru stilltar eins og hér að neðan:-seqType fq-JM 300G -mín_contig_lengd 200-CPU 20-tommuormur_örgjörvi {{21} }bflyCPU 20.

Til að mæla magn afrita, voru raðaðir pörendalestrar endurstilltir við samansett afrit með því að nota handrit í Trinity. Kortlagt lestur var notaður til magngreiningar með RSEM (RNA-Seq by Expectation Maximization) hugbúnaði. Gnægð gena eða ísóforma var táknuð með broti á hvert kílóbasa afrits á hverja milljón brotakortaðs (FPKM) gildi, þessi umrit með FPKM gildi jafnt eða stærra en 0.05 voru skilgreind eins og þau eru gefin upp.

Hagnýtur skýring á tjáðum afritum

Það eru engin genaskýringasett af C. deserticola nema blaðgrænu erfðamengi [1]. Við gerðum athugasemdir við tjáð afrit með því að bera þau saman við Genbank Nt, Genbank Nr og TAIR10_ pep_20101214_uppfærð gagnapakka sérstaklega með því að nota BLAST forritið (E< = 1e-20). Meanwhile, all expressed transcripts were translated into potential proteins according to ORF prediction by TransDecoder and predicated for the conserved domains based on the Pfam database.

Gene Ontology og KEGG-ferilskýringar Með því að raða líkt í Uniprot gagnagrunninum (Gene Ontology (GO) skýringin á öllum samsettum afritum var fengin með því að nota tengslaskrá sem hlaðið var niður af (ftp://ftp.ebi.ac.uk/pub/ databases/GO/goa/UNIPROT/gene_goa_uniprot.gz). CC, BP ​​og MF flokkar sérstaklega.

KEGG ferilupplýsingum var úthlutað fyrir allar spár próteinraðir með því að nota nettólið KAAS (KEGG Automatic Annotation Server) [34]. Raðir á fasta formi voru sendar til KAAS-beiðni og skrám sem fengust af öllum ferilupplýsingum sem tengjast C. deserticola stofnafriti var hlaðið niður. 13 genagagnasett plöntulífvera í KEGG voru notuð til að gera athugasemdir með því að nota BBH (bi-directional best hit) aðferðina.

cistanche tubulosa extract

NATURAL CISTANCHE TUBULOSA CISTANCHE EXTRACT PHGS75% ECH 30% ACT 12%

RT-qPCR greining

Eftir meltingu með DNasa I var um það bil 5g af heildar RNA breytt í fyrsta strengs cDNA með öfugum umritunarviðbrögðum með oligo(dT)15 frumurum og GoScript öfugumritunarkerfi (Promega). cDNA afurðirnar voru síðan þynntar 10-falt með nukleasafríu afjónuðu vatni áður en þær voru notaðar sem sniðmát í rauntíma PCR. Sértæk cDNA voru mögnuð upp með GoTaq 2-Step RT-qPCR kerfinu (Promega) í rúmmáli 20 ul. PCR mögnun var framkvæmd við hitastigið 60 gráður með 7500 rauntíma PCR uppgötvunarkerfi (Applied Biosystems) samkvæmt leiðbeiningum framleiðanda. Hlutfallslegt magn afrita var reiknað út með samanburðarlotuþröskuldsaðferðinni með geni "comp10579_c0" sem innri staðal, með því að nota 7500 Manager hugbúnaðinn.

Grunnpör fyrir RT-PCR voru hönnuð út frá nethugbúnaði (http://primer3.ut.ee/) og eru skráð í S1 gagnasettinu.

Niðurstöður

RNA raðgreining og de novo umskriftarsamsetning holdugs stofns C. deserticola

Stöngull af C. deserticola hefur verið mikið notaður sem hefðbundið mikilvæg tonic í Kína og Japan í mörg ár. Til að fá alþjóðlegt yfirlit yfir genatjáningu í holdugum stofni C. deserticola, söfnuðum við C. deserticola stofnsýnum af sama plöntugrunni árið 2013 og 2014, í sömu röð. Heildar RNA voru dregin út og polyA+ RNA voru hreinsuð til að búa til pöruð enda RNA-seq bókasöfn. 79.433.734 og 86,019.176 para-enda lestir sem samsvara næstum 8 milljörðum og 8,6 milljörðum basa af röðinni fengust með Illumina HiSeq 2000 raðgreiningu

image

vettvang í 2013-ári og 2014-árssýnum (tafla 1). Eftir að millistykkisraðir hafa verið fjarlægðar og lággæða lestur síaður (sjá nánari upplýsingar í Aðferðir), voru 64.831.040 hágæða pörendalestur í 2013-ársúrtakinu notaðar fyrir samsetningu de novo transcriptome. Með því að nota Trinity röð assembler [30] voru 51.719 gen og 95.787 umritaraðir búnar til með lengd umrits á bilinu 200 bp til 15.698 bp. Meðallengd samsettra afrita er 950 basar og N50 lengdin er 1.519 basar. Fjöldi afrita í mismunandi lengd leiddi í ljós að 57,32% af samsettum afritum voru um 500 bp eða lengri (mynd 1A). Hágæða pörendalestrar í 2014-árssýninu voru kortlögð á samsetta umritið. Að auki komumst við að því að umritsnúmerið fyrir hvert samsett gena var mismunandi og 69% gena með eitt tjáð ísóform á meðan 31% gena tjáðu tvö eða fleiri umrit (mynd 1B).

Tjáningarmagn og hagnýtur skýring á samsettum afritum

Gnægð gena eða umrita var magnmæld með því að nota RSEM pakkann, þar sem raðaðir lestir voru endurstilltar við samansett gen eða afritaröð með Bowtie, og þessi kortlögðu les voru notuð til magngreiningar. FPKM gildi fyrir hvert geni eða umrit var reiknað út og að lokum greindum við 63.957 og 52.857 virkt tjáð umrit (FPKM gildi Stærra en eða jafnt og 0.5) í holdugum stofnsýnum af C. deserticola í 2{{17} }13 og 2014, í sömu röð. 44.776 afrit (70,01% í 2013-ársúrtakinu, 84,71% í 2014-ársúrtakinu) voru almennt gefin upp í endurtekningunum tveimur og fylgni (Pearson fylgnistuðull: 0,91979) tjáningargagna þeirra var sýnd í S1 mynd. Röðunargögnunum hafði verið hlaðið upp í NCBI SRA gagnagrunninn (aðgangsnúmer: SRX857402 og SRX858938). Við notuðum tjáð gen sem auðkennd voru í 2013-árssýninu til frekari greiningar. Hagnýtar skýringarupplýsingar fyrir öll tjáð afrit voru fengnar með tveimur aðferðum. Í fyrsta lagi voru öll tjáð umrit stillt að þekktum núkleótíðum (GenBank nt) og peptíðröð gagnagrunnum (GenBank nr og Arabidopsis peptíð) sérstaklega með BLAST reikniritinu. Af 63.957 birtum afritum,

image

29.220 (45,7%) fengu athugasemdir og sýndu samsvörun við raðir í einhverjum af gagnagrunnunum þremur með E-gildi cutoff 1e-20. Á sama tíma var spáð fyrir um kóðunarsvæði umsækjenda fyrir allar tjáðar afritaraðir með TransDecoder hugbúnaði og lengstu ORF fyrir hvert afrit voru notuð fyrir Pfam lénsleitina. Fyrir vikið voru 21.358 (33,4%) afrit skráð á grundvelli Pfam gagnagrunnsins. Í heildina voru 30.098 (47,1%) afrit marktækt pöruð við þekkt gen í opinberum gagnagrunnum með því að sameina þessar tvær aðferðir hér að ofan. Heildar afritslisti með aðgerðaskýringum var sýndur í viðbótargögnum (S2 gagnasett).

Við könnuðum efstu 20 mest tjáða afritin (tafla 2) sem samsvara 18,99% allra raðgreiningarlestra, og komumst að því að flest þeirra eru gen sem bregðast við ólífrænum

image

streituáreiti. Dehýdrín (DHN), flokkur vatnssækinna og hitastöðugra streitupróteina með miklum fjölda hlaðinna amínósýra sem tilheyra hópi II Late Embryogenesis Abundant (LEA) fjölskyldunni, er mest tjáða genið. Þrjár mismunandi afrit af Dehyrin (comp28713_c0_seq1/2/4) greindust mjög tjáðar í holdugum stilkum sem gætu átt þátt í að vernda frumur gegn skemmdum af völdum þurrkaálags. Önnur streitutengd gen eins og hitasjokkprótein, sýklatengt prótein og metallothionein fundust einnig tjáð mjög, sem gæti tengst alvarlegu lifunarumhverfi þess. Að auki, sum samsett gen, þar á meðal 26S ríbósómal RNA gen (comp22329_c2_seq1), auxín-bælað/dvalartengd prótein (comp20999_c0_seq1), ADP-ríbósýleringarstuðull (comp20499_ c0_seq1) var einnig mjög umritaður.

Cistanche tubulosa extract

NATURAL CISTANCHE TUBULOSA TIL AÐ BÆTA ÓNÆMI PHGS75% ECH 30% ACT 12%

drk-green-rounded-corner-button-buy-now-web


Þér gæti einnig líkað