Sérhljóðatalgreining frá rottuheilagreiningu með langtímaminni tauganeti 1. hluti
Dec 27, 2023
Ágrip
Í gegnum árin hafa talsverðar rannsóknir verið gerðar til að rannsaka hvernig talskynjun og -þekking er.
Það er óaðskiljanlegt samband á milli talskynjunar og minnis. Talskynjun er mikilvægur hæfileiki fyrir okkur til að vera meðvituð um hljóðmerki og minni er mikilvæg leið sem við notum til að geyma og sækja upplýsingar. Þegar við erum betur fær um að skynja tal, erum við líka færari um að muna upplýsingarnar sem við heyrum.
Rannsóknir sýna að sambandið milli talskynjunar og minnis er tvíátta. Annars vegar getur léleg talskynjun leitt til minnisskerðingar. Þetta er vegna þess að þegar við getum ekki heyrt tal skýrt, getum við ekki munað nákvæmlega upplýsingarnar sem við heyrðum. Á hinn bóginn getur sterk talskynjun bætt minni okkar. Þegar við getum skynjað og skilið tal rétt, getum við líka munað það sem við heyrum auðveldara.
Þess vegna ættum við að einbeita okkur að því að rækta talskynjun okkar til að bæta minni okkar. Þetta er hægt að ná með því að þjálfa hlustunar- og talskilningsfærni okkar. Við getum bætt talskynjun okkar og minni með athöfnum eins og að hlusta á upptökur, horfa á kvikmyndir og sækja tungumálatíma.
Í stuttu máli er náið samband á milli talskynjunar og minnis og við ættum að einbeita okkur að því að rækta talskynjunarhæfileika okkar til að bæta minni okkar. Með virkri þjálfun og æfingu getum við stöðugt bætt talskynjun okkar og skilið betur og munað það sem við heyrum. Það má sjá að við þurfum að bæta minnið og Cistanche deserticola getur bætt minnið verulega því Cistanche deserticola getur líka stjórnað jafnvægi taugaboðefna eins og aukið magn asetýlkólíns og vaxtarþætti. Þessi efni eru mjög mikilvæg fyrir minni og nám. Að auki getur Kjöt einnig bætt blóðflæði og stuðlað að súrefnisgjöf, sem getur tryggt að heilinn fái nægileg næringarefni og orku og þar með bætt heilaþrótt og úthald.

Smelltu á Vita til að bæta skammtímaminni
Heilagreining (EEG) er öflugt tæki til að bera kennsl á heilastarfsemi; því hefur það verið mikið notað til að ákvarða taugagrundvöll talgreiningar.
Sérstaklega, fyrir flokkun á talgreiningu, eru nálganir byggðar á djúpnámi í sviðsljósinu vegna þess að þær geta sjálfkrafa lært og dregið út dæmigerða eiginleika með námi frá enda til enda.
Þessi rannsókn miðar að því að bera kennsl á sérstaka þætti sem hugsanlega tengjast framsetningu hljóðnema í rottuheilanum og greina heilavirkni fyrir hvert sérhljóðaörvun í einni tilraun með því að nota tvíátta langtímaminni (BiLSTM) net og klassískar vélanámsaðferðir.
Notaðar voru nítján Sprague-Dawley karlkyns rottur sem fóru í ígræðsluaðgerð á örskautum til að skrá EEG merki frá tvíhliða fremri heyrnarsviðum. Valin voru fimm mismunandi raddáreiti, /a/, /e/, /i/, /o/ og /u/, sem hafa mjög mismunandi mótunartíðni. Heilarit sem skráð var undir handahófskenndu sérhljóðaáreiti var í lágmarki forunnið og staðlað með z-stigi umbreytingu til að nota sem inntak fyrir flokkun talgreiningar.
BiLSTM netið sýndi bestu frammistöðu flokkaranna með því að ná heildarnákvæmni, f{{0}}einkunn, og Cohens κ gildi upp á 75,18%, 0,75 og 0,68, í sömu röð, með því að nota 10-falda krossstaðfestingaraðferð.
Þessar niðurstöður benda til þess að LSTM lög geti á áhrifaríkan hátt líkan röð gagna, svo sem heilarita; þess vegna er hægt að fá upplýsandi eiginleika í gegnum BiLSTM þjálfaða með námi frá enda til enda án nokkurra viðbótarhandsmíðaðra útdráttaraðferða.
Kynning
Tal ber mikið magn upplýsinga til heilans og það er eitt af dæmigerðum eiginleikum heilans að þekkja og flokka hljóð dýra sem hegða sér.
Með hliðsjón af mikilvægi þess hafa tilraunir til að rannsaka fyrirkomulag talhljóðgreiningar verið gerðar í yfir 100 ár. Ein af fyrstu taugamálfræðilegu rannsóknunum á talgreiningu var gerð með athugunarrannsókn á áttunda áratugnum af þýskum taugasálfræðingi sem fann afgerandi hlutverk æðra tímabundins gyrus í talskynjun, sem komst að þeirri niðurstöðu að galli á málgreiningu tengdist skemmdum á vinstri efri tímahringnum. 1].
Nú er vitað að talgreining byggir að mestu leyti á dorsolateral temporal lobes, þar á meðal superior temporal gyrus, sem inniheldur aðal heyrnarberki (A1) og fremri heyrnarsvið (AAF) [2].

Þrátt fyrir að það sé enn umdeilt hvernig hljóðfónem eru kóðuð og túlkuð í heilanum, hefur það verið almennt viðurkennt að viðurkenning á hljóði sé afdráttarlaus. Það er að segja að mismunun er betra fyrir áreiti sem tilheyra mismunandi hljóðflokkum en fyrir áreiti sem tilheyra sama flokki, jafnvel þótt hljóðmunurinn sé jafngildur [3, 4].
Ekki aðeins menn heldur einnig skynjunarkerfi dýra flokka stöðugt breytilegt hljóðáreiti í mengi stakra flokka [5].
Með framförum í taugalífeðlisfræðilegum rannsóknum hefur rafheilagreining (EEG) verið mikið notuð í rannsóknum sem taka þátt í taugavísindum og taugaverkfræði [6].
Hin mikla tímaupplausn og næmni fyrir mismunandi starfhæfum heilaástandi gerir heilaritið að öflugu tæki til að rannsaka rauntíma heilavirkni og aukinn áhugi hefur verið á að lýsa upp taugagrunninn fyrir flokka skynjun. Hefð er fyrir því að heilaritasmerki eru skráð án innrásar frá hársvörðinni í rannsóknum á mönnum. Á stigi hljóð- eða talskynjunar er ósamræmi neikvæðni (MMN), hluti af heyrnartengdum möguleikum (AEP), sem er framkallaður af skrýtnum hljóðum, mikið notaður til að rannsaka taugafylgni af flokkaðri skynjun [7, 8]. Naatanen o.fl. sönnunargögn fyrir tungumálaháðum sérhljóðaframsetningum í mannsheilanum [9].
Önnur rannsókn skoðaði afdráttarlausa skynjun orðasafns tóna og komst að því að andstæður milli flokka leiddu til stærri MMN en innan flokka aðgreiningar [10]. Í dýratilraunum fengust nákvæmari heilaritasmerki með ífarandi aðferðum.
Til dæmis hafa taugafylgni flokkaðrar skynjunar og taugabirtinga ýmissa hljóða verið rannsökuð með því að nota utanfrumuupptöku á verkunarmöguleika.
Striatum-útvarpandi taugafrumum söngfugla sýna afdráttarlaus heyrnarviðbrögð og eru mjög viðkvæm fyrir breytingum á lengd nótna [11]. Auk þess hafa Kilgard o.fl.rannsakað aðgreindar taugamyndir samhljóða og sérhljóða með því að nota intraparenchymal upptöku í rottuheila. Með því að taka upp fjöl- og eineininga svörin frá inferior colliculus og A1, lögðu þeir til að oddinn teldi sérhljóða, á meðan topptíminn kóðar samhljóða [12, 13].
Áhrif hljóðmismununarþjálfunar í rottulíkani af einhverfu voru einnig rannsökuð út frá fyrri niðurstöðum sem tengdu taugaviðbrögð við hljóðáreiti og hljóðskynjunargetu [14].
Þar að auki sýndi nýleg rannsókn fram á að rafbarkagreining sem tekin var upp með fjölrásafylki tengist óvirkri útsetningu fyrir tilteknu hljóði, jafnvel í heyrnarberki svæfðra rotta [15].
Vélarnámsaðferðir hafa verið notaðar til að nýta heilarita á hagnýtan hátt í margs konar rannsóknum. Með því að nota vélanámsaðferðir er hægt að rannsaka ríkar upplýsingar sem eru eðlislægar og erfitt að afhjúpa frá heilaritamerkjum [6].
Þess vegna er hægt að framkvæma flokkun sem byggir á heilariti á eftirfarandi sviðum með hefðbundnum vélrænum reikniritum (td stuðnings vektorvél (SVM), k-næstu nágranna (KNN) og barnalegir Bayes (NB)): hreyfimyndir, tilfinningagreining, uppgötvun geðsjúkdóma, atburðartengd hugsanleg (ERP) uppgötvun og svo framvegis [16, 17].

Ennfremur, á undanförnum árum, vegna aukinna framfara í grafískum vinnslueiningum og framboði á stórum gagnasöfnum, hefur það orðið mögulegt að framkvæma flokkun sem byggir á heilariiti með því að nota ýmis djúpnámsnet [6, 18, 19]. Samanborið við hefðbundnar vélanámsaðferðir , djúpnámsnet geta sjálfkrafa greint og dregið út viðeigandi framsetningu úr inntaksgögnum [20, 21].
Þess vegna, jafnvel með ófullnægjandi fyrri sérfræðiþekkingu, er hægt að fá efnilegar niðurstöður með því að dýpka reiknirit sem krefjast ekki viðbótar handunnið útdráttarferli [22, 23].
Til dæmis, á sviði talmáls, mynda og myndbanda, voru niðurstöðurnar verulega bættar með því að nota djúpnámsreiknirit [24–26]. Hins vegar er ekki ljóst hvort slíkar árangursríkar niðurstöður fylgja alltaf flokkunarsviðinu sem byggir á heilariiti þegar notaðar eru djúpnámsaðferðir í stað hefðbundinna vélanámsaðferða [27].
Roy o.fl. sýndu fram á að í flestum rannsóknunum (að undanskildum fjórum af 102 rannsóknum) leiddi djúpnámsaðferðin til meiri frammistöðu en hefðbundin vélanámsaðferð og mesta framförin á nákvæmni var 35,3% [18, 28].
Ennfremur, meðal hinna ýmsu sviða flokkunarrannsókna sem byggir á EEG, eru ERP flokkunarrannsóknir gerðar með virkum hætti með því að beita bæði hefðbundnum vélanámi og dýpkunaraðferðum.
Í fyrstu rannsókn var hefðbundin stórmeðaltalsaðferð notuð til að bæta lágt merki-til-suð hlutfall (SNR), ein af takmörkunum EEG merkja, og til að fá ERP merki.
Í þessum rannsóknum voru nokkrir ERP þættir meðhöndlaðir sem eiginleikasett fyrir flokkun [29, 30]. Í dýrarannsóknum eru ERP eiginleikar eins og hámarks amplitude og leynd einnig notuð til að greina ERP merki [31, 32].
Hins vegar hefur flokkun sem byggir á einra prufa einnig fengið mikla athygli, þar sem vitað er að heilalínuritsgögn á einprófunarstigi búa yfir virkari og ríkari upplýsingum en ERP merki sem fæst með hefðbundinni stórmeðaltalsaðferð [33, 34].
Þess vegna, í síðari rannsóknum, eru eiginleikar dregin út með ýmsum reikniritum eins og bylgju-undirstaða reiknirit [35], Gaussian blöndunarlíkön [36], og staðbundin síun [37] til flokkunar með hefðbundnum vélanámsaðferðum [38, 39]. Hins vegar er hægt að draga út bestu Handsmíðaðir eiginleikar úr einprófunarheilararitinu eru tímafrekir og vinnufrekir vegna þess að framkvæma þarf fleiri vinnsluþrep. Í þessu samhengi geta djúpnámsaðferðir létt á þessu vandamáli með því að leyfa nám frá enda til enda.
Algengasta djúpnámsarkitektúrinn er snúningstauganet (CNN), fylgt eftir af endurteknu tauganeti (RNN). CNN er sérstök tegund djúpnámsarkitektúrs sem er mikið notaður fyrir flokkun sem byggir á EEG-undirri einri prufu [6]. CNN-inntakin eru fengin úr hráum eða fyrirfram unnum heilaritagögnum, fyrst og fremst á eftirfarandi formi: Fjöldi rása × fjöldi tímapunkta í einni tilraun.
Þar að auki hefur verið sýnt fram á töluverðar flokkunarniðurstöður og vitað er að það skilar sér best þegar litrófsmyndir eru notaðar sem inntak [40–44]. Öfugt við CNN er RNN mjög ákjósanlegur arkitektúr, sérstaklega þegar meðhöndlað er raðgagnagögn (eins og í forritum til vinnslu á náttúrulegum tungumálum) vegna þess að endurtekin tenging RNN námsarkitektúrs gerir það mögulegt að nýta fyrri upplýsingar netkerfisins endurkvæmt sem núverandi inntaksgögn [45 ].
Langtímaminni (LSTM) er eins konar RNN arkitektúr sem Hochreiter og Schmidhuber hafa lagt til til að vinna bug á sprungandi og hverfandi hallavandamálum RNN [46]. Tvíátta LSTM (BiLSTM) er frekari þróun LSTM sem sameinar fram og aftur falin lög til að fá aðgang að bæði fyrri og síðari upplýsingum.
Þó að BiLSTM líkanið sé miklu flóknara og gæti þurft viðbótar reiknikraft, er búist við að það leysi raðlíkanagerð og flokkunarverkefni betur en LSTM [47].
Áður reyndum við að flokka EEG merki í einni tilraun fyrir þrjú sérhljóð, /a/,/o/ og /u/, með því að nota vélanámstækni fyrir mannsheilann.
Eftir að viðeigandi merkjavinnslu reiknirit var beitt, þar á meðal margbreytilegt empirical mode decomposition (MEMD), voru EEG svörin flokkuð í raun í samræmi við hvert sérhljóð með því að nota línulega aðgreiningargreiningu (LDA) flokkara. Út frá tíma-tíðniframsetningu (TFR) EEG merkjanna var einnig ákvarðað að alfabandshlutirnir væru þeir tengdustu taugaviðbrögð við hljóðskynjun sérhljóða [48].
Hins vegar, vegna lágs SNR heilaritasmerkja manna, þarf að meta framsetningu hljóðnema í heilanum frekar með ífarandi upptökutækni, sem gerir kleift að afla áreiðanlegri heilaritamerkja.
Að auki er nauðsynlegt að gera frekari rannsóknir á flokkunarframmistöðu hvers vélrænnar reiknirits við flokkun heilaritasviðbragða við mismunandi hljóðnema.
Megintilgangur þessarar rannsóknar var að ákvarða tiltekna heilaritasþætti sem gætu tengst talmynd í rottuheilanum til að lýsa frekar viðbrögð heilans við talhljóðgreiningu.
Til að fá nákvæmari EEG merki voru utanbasts EEG merki sem svöruðu áreiti á heyrn skráð í AAF, sem hefur verið vitað að gegna mikilvægu hlutverki í heyrnarskynjun og flokkun [2]. Að auki reyndi þessi rannsókn að greina mismunandi heilaviðbrögð fyrir hvert talhljóð í einni tilraun með því að nota LSTM netkerfi og aðrar hefðbundnar vélanámsaðferðir.
Tilgátan var sú að BiLSTM-netið væri viðeigandi til að flokka heilaritassvörun við sérhljóðaörvun og myndi standa sig betur en önnur klassísk flokkunartæki vegna þess að netið getur staðið sig vel við að búa til langtímafíkn raðgagna eins og heilaritas. Að því er höfundur veit, hefur LSTM netkerfi ekki verið beitt við flokkun EEG viðbragða við áreiti á heyrn og þetta er fyrsta rannsóknin sem notar djúpnámsreiknirit til að greina utanbasts EEG merki frá AAF.

Þar að auki, með því að nota djúpnámsreikniritið, voru heilaritassvörun flokkuð sem heyrnarörvun með því að nota end-to-end nám með lágmarks fyrirfram unnum heilaritasmerkjum án frekari útdráttaraðferða.
For more information:1950477648nn@gmail.com






