Dadansoddi Teimlad Tymor Byr Effeithlon ar Sail Cof O Adolygiadau E-Fasnach Rhan 2
Jan 18, 2024
Roedd Muhammad et al. [20] cyflwynodd fodel ar gyfer dadansoddi sentiment trwy ddefnyddio word2vec a LSTM ar gyfer adolygiadau gwesty.
Muhammad yw proffwyd a sylfaenydd Islam. Gelwir ef yn ddyn doeth, doeth, a doeth. Mae ei gof yn bwerus iawn, sy'n ei wneud yn effeithiol iawn wrth brosesu gwybodaeth a mynegi ei feddyliau.
Mae gan gof Muhammad lawer i'w wneud â'i addysg a'i brofiad. Yn ôl cofnodion, roedd yn aml yn cael ei drochi mewn meddwl a myfyrio yn ei ieuenctid. Bu'r chwilfrydedd hwn a'r syched am wybodaeth yn gymorth iddo adeiladu sylfaen wybodaeth gref a gallu cof.
Yn ogystal, roedd cudd-wybodaeth Muhammad hefyd yn chwarae rhan fawr yn ei alluoedd cof. Mae'n glyfar, yn ffraeth, yn graff, ac mae ganddo allu meddwl rhesymegol, sy'n fanteisiol iawn wrth ddelio â gwybodaeth gymhleth. Fe wnaeth y fantais hon ei helpu i reoli a rheoli'r broses cof yn well, a thrwy hynny wella ei gof.
Fodd bynnag, nid oedd cof Muhammad yn gynhenid ond wedi gwella trwy waith caled ac ymarfer. Mae'n aml yn cynnal hyfforddiant cof, megis darllen dro ar ôl tro, arddywediad, a lleferydd, i'w helpu i ddeall a meistroli gwybodaeth yn ddyfnach.
Nid dawn naturiol yn unig oedd cof Muhammad, cafodd ei wella trwy waith caled ac ymarfer. Mae hyn yn dangos y gall pob un ohonom wella ein cof a gwella ein heffeithlonrwydd dysgu a gwaith trwy ddysgu ac ymarfer. Gadewch inni, fel Muhammad, weithio'n galed i wella ein sgiliau cof yn barhaus, i gyflawni mwy o lwyddiant mewn bywyd a gwaith! Gellir gweld bod angen i ni wella cof, a gall Cistanche deserticola wella cof yn sylweddol, oherwydd gall Cistanche deserticola hefyd reoleiddio cydbwysedd niwrodrosglwyddyddion, megis cynyddu lefelau acetylcholine a ffactorau twf. Mae'r sylweddau hyn yn bwysig iawn ar gyfer cof a dysgu. Yn ogystal, gall Cig hefyd wella llif y gwaed a hyrwyddo darpariaeth ocsigen, a all sicrhau bod yr ymennydd yn derbyn digon o faetholion ac egni, a thrwy hynny wella bywiogrwydd a dygnwch yr ymennydd.

Cliciwch Gwybod i wella cof tymor byr
Ar gyfer yr astudiaeth hon, casglwyd y data trwy gropian y wefan deithio gan ddefnyddio seleniwm a sgrap. +e Prif bwrpas yr arbrawf hwn oedd dadansoddi cywirdeb trwy newid paramedrau word2vec a LSTM. +e dangosodd canlyniadau y gellid cyflawni cywirdeb cymedrig o 85.96 gan ddefnyddio'r paramedrau, a ddangosodd ganlyniadau addawol.
Mae Zhao et al. [21] cyflwyno techneg newydd i ddadansoddi teimladau cwsmeriaid o adolygiadau ar wefannau e-fasnach. +e techneg wedi'i optimeiddio arfaethedig "Mae'r Algorithm Ystlumod Byrfyfyr yn seiliedig ar Elman NeuralNetwork (LSIBA-ENN)" yn cynnwys pedwar cam ac yn canfod y pegynedd ac yn dosbarthu teimladau'r adolygiadau. +e casglwyd data ar gyfer yr ymchwil hwn trwy ddefnyddio'r offeryn sgrapio gwe ar wefannau e-fasnach i dynnu adolygiadau cwsmeriaid.
Yn ogystal â rhagbrosesu’r data, mae’r astudiaeth hon yn defnyddio “Amlder Dosbarth Gwrthdro Addasedig ar sail Amlder LogTerm (LTF-MICF) ac Algorithm Cynnes Daear sy’n seiliedig ar Dreiglad Hybrid (HMEWA)” ar gyfer pwysoli termau a dewis nodweddion. +e roedd y fethodoleg arfaethedig yn drech na thechnegau llinell sylfaen eraill o ran cywirdeb rhagfynegi.
Cynigiodd Jiang [22] fodel i ddosbarthu teimladau adolygiadau a gafwyd o lwyfan e-fasnach Taobao.+ Mae astudiaeth yn defnyddio'r algorithm dysgu peiriant yn ogystal â chymorth peiriant fector ar gyfer dosbarthu ac optimeiddio heidiau gronynnau gwell (IPSO) i optimeiddio'r paramedrau. +e casglwyd data ar gyfer yr astudiaeth trwy gropian y sylwadau oddi ar y wefan. +e dangosodd canlyniadau arbrofol fod gan ddull cyfun SVM ac IPSO gywirdeb uwch. Fodd bynnag, mae'r mwyafrif o'r modelau presennol yn dioddef o orffitio [23-25], cyflymder cydgyfeirio gwael [26-28], a phroblemau graddiant diflannu[29-31].
3. Astudiaeth Arbrofol
+mae'r adran yn rhoi trosolwg clir o'r fethodoleg a ddefnyddiwyd yn y prosiect ar gyfer dosbarthu teimlad. Techneg +e a ddefnyddiwyd yw rhwydwaith Cof Tymor Byr Hir, a ddefnyddir i ddosbarthu nifer fawr o adolygiadau cronfa ddata Amazon. +e mewnosod a ddefnyddir yw word2vec, sydd wedi'i hyfforddi'n arbennig yn unol â'r gronfa ddata.
Mae tiwnio'r gair2vec yn ôl y set ddata yn gwella perfformiad cyffredinol y model. +e mantais defnyddio LSTM yw ei fod yn rhoi canlyniadau gwell hyd yn oed ar gyfer y data adolygu anstrwythuredig. Mae'n gallu cael swyddogaethau defnyddiol ar gyfer adnoddau sy'n cynnwys dibyniaethau hirdymor.
Cesglir data +e o set ddata adolygu Amazon, sydd wedyn yn cael ei phrosesu ymlaen llaw. Mae mewnosodiadau Word2vec yn gam pwysig yn y broses o ragbrosesu'r data. Crëwyd data trenau a phrofion. +e data hyfforddi wedi'i rannu'n setiau data trenau a dilysu. +e model word2vec wedi'i deilwra yn gronfa ddata trainingper. +e fector nodwedd yn cael ei sicrhau, a ddefnyddir wedyn fel yr haen ymgorffori ar gyfer y model LSTM.
Defnyddir Keras ar gyfer adeiladu'r model dilyniannol LSTM gyda nodweddion mwyaf cyfartal i 50,000 a maint mewnosod sy'n hafal i 16. +emodel wedyn yn cael ei hyfforddi am 10 cyfnod. +e model yn cael ei brofi yn seiliedig ar fetrigau perfformiad sklearn. Dangosir y broses o gael nodweddion +e yn Ffigur 2.
3.1. Set ddata. I gynhyrchu canlyniadau cywir, dylai'r set ddata a ddefnyddir fod yn fawr ac wedi'i gyfoethogi. Mae set ddata +e wedi'i chasglu o'r adran ffonau symudol ac ategolion ar-lein o set ddata Amazon Reviews (2018). Mae set ddata +e yn cynnwys cyfanswm o 938,261 o adolygiadau, ac yn eu plith mae 47901 o gynhyrchion unigryw a 153124 yn adolygiadau defnyddwyr unigryw. Mae +e set ddata i ddechrau yn cynnwys 7 colofn, sef, sgôr sy'n amrywio o 1 i 5, amser adolygu, ID yr adolygydd, ID y cynnyrch, a chrynodeb o destun adolygu.
Ar ôl gollwng y copïau dyblyg, mae'r set ddata yn cynnwys 938254 o gofnodion, ac mae Tabl 2 yn dangos pyt o gofnodion gwreiddiol y set ddata.
3.2. Methodoleg. Rydym wedi hyfforddi ein model word2vec yn arbennig i'w ddefnyddio gyda'r model LSTM ar gyfer dosbarthu. Mae Word2vec yn ymgorfforiad geiriau a ddefnyddir i gynrychioli gair gan gasgliad o sawl term fector. Mae i ffwrdd o fapio gair i mewn i ofod fector. +e set ddata yn cael ei llwytho i ffrâm data pandas. Ar gyfer datblygu model customword2vec, y cam cyntaf yw rhagbrosesu data.
Dim ond edrych ar y sgôr ac adolygu testun a gollwng popeth arall. +e mae'r testun yn cael ei lanhau trwy ddileu'r atalnod. Mae is-sampl o'r testun yn cael ei greu o bron i 200,000 o adolygiadau a defnyddir y dull testun glân i drosi pob adolygiad yn rhestr o eiriau. +yw rhestr o eiriau bellach yn gweithredu fel mewnbwn i'r model genism word2vec.
Rydym wedi adeiladu model word2vec-gram sgip-gram wedi'i hyfforddi'n arbennig ac wedi cyflymu'r model gyda dimensiynau: maint fectorau geiriau fel 100, maint ffenestr yn hafal i 15, min_cyfrif 2 ar gyfer geiriau sy'n ymddangos llai na 2 waith yn ein corpws, negatif hafal i 5, a chyfradd samplu hafal i 1e−5. Rydym wedi defnyddio'r holl ddimensiynau hyn i adeiladu geirfa o'n brawddegau adolygu.

Rydym yn hyfforddi ein model word2vec ar gyfer 1000 epocs. +cy rydym yn cyfrifo'r golled ym mhob cyfnod. +e mae colled yn uchel ar y dechrau ac mae'n lleihau tua'r cyfnod olaf. +e colled ar y pryd 0 yw 2239394.0 a'r golled yn yr epoc 1000 yw 11504.0.+e mae'r model a arbedwyd wedyn yn cael ei ail-lwytho a bydd gweithrediadau'n cael eu perfformio arno.
Er enghraifft, os ydym am ddod o hyd i eiriau tebyg i sŵn yn ein set ddata, rydym yn cael canslo a chlustffonau.
Yn yr un modd, gallwn hefyd ddod o hyd i'r tebygrwydd rhwng geiriau penodol megis clustffonau a chlustffonau sef {{0}}.48756, a'r tebygrwydd rhwng y geiriau charge a charger yw 0.89264.
Er mwyn lleihau dimensiynau ein data, rydym wedi defnyddio delwedduTSNE i blotio'r data yn ddau ddimensiwn. Nawr, gellir defnyddio'r fectorau geiriau hyn ar gyfer dosbarthiad pellach. +mae'r mewnosodiadau hyn wedyn yn cael eu defnyddio fel nodweddion ar gyfer ffrydio pellach.
3.2.1. Paratoi Data ar gyfer LSTM. Mae ein set ddata yn cynnwys 938254 o gofnodion gyda'r rhan fwyaf o'r adolygiadau â dosbarthiad sgôr o fwy na 3. Rydym wedi cyfrifo nifer y geiriau ar gyfer pob adolygiad yn gyntaf. +e defnyddir cymedr cyfartalog fel ystadegau i ganfod hyd cyfartalog adolygiadau. +e cymedr yr adolygiad yw 44.59 a'r hyd mwyaf yw 4303.
Rydym wedi creu set ddata sy'n cynnwys adolygiadau sydd â 100 gair neu lai. Mae adolygiadau y mae eu hyd yn fwy nag 20 ond yn llai na 100 yn cael eu categoreiddio o dan adolygiadau byr ac mae'r gweddill yn cael eu categoreiddio o dan adolygiadau hir. +e nifer yr adolygiadau byr yw 411313 ac adolygiadau hir yw 100239. Disgrifir hyperparameters a ddefnyddir yn y model yn Nhabl 3.
Nesaf, rydym wedi diffinio'r sgôr teimlad yn bositif os yw'r sgôr yn fwy na neu'n hafal i 3; fel arall, mae'r sgôr yn negyddol. Rydym wedi ystyried testun yr adolygiad a'r teimlad ar gyfer creu'r set ddata trenau. +e mae data prawf yn cynnwys cynhyrchion sy'n cael o leiaf mwy na 10 adolygiad.
Ar ôl ei ddosbarthu, roedd y set ddata hyfforddi yn cynnwys cyfanswm o 203891 o gofnodion, ac yn eu plith roedd 175910 yn perthyn i'r dosbarth cadarnhaol a 27981 i'r dosbarth negyddol. Roedd set ddata prawf +e yn cynnwys cyfanswm o 686345 o gofnodion, ac yn eu plith roedd 592118 yn perthyn i'r positif a 94227 i'r dosbarth negyddol.
Yn yr astudiaeth hon, rydym wedi defnyddio Keras i adeiladu ein model LSTM, sy'n cymryd uchafswm o 50,000 o nodweddion fel mewnbwn i'r haen mewnosod. Mae cof tymor byr hir (LSTM) yn fath o rwydwaith niwral cylchol sy'n defnyddio mecanwaith mewnol sy'n rheoli llif gwybodaeth.+ yw mecanwaith mewnol yn cynnwys giatiau y mae angen eu hyfforddi fel y gallant hidlo gwybodaeth amherthnasol yn gywir a chadw gwybodaeth ddefnyddiol.

Mae Ffigur 3 yn dangos pensaernïaeth sylfaenol y model LSTM yn ein methodoleg arfaethedig.
Ht−1 ac Xt yw'r mewnbynnau i'r uned LSTM; Mae Ht−1, y cyfeirir ato'n gyffredin fel cof tymor byr, yn cymryd yr allbwn o'r cyflyrau blaenorol fel y mewnbwn. +e cofgell neu'r cof hirdymor, Ct −1, yn helpu i gario gwybodaeth berthnasol drwy gydol y broses o ddilyniant. + Mae pensaernïaeth eLSTM yn cyfuno tair giât: giât anghofio, porth mewnbwn a giât allbwn. Yn yr uned LSTM, defnyddir ffwythiannau tanh a sigmoid i gael y gatiau hyn.
Yna rhannwyd data trenau +e yn ddata trenau a dilysu o hyd cyfartal. +e cyfrifwyd hyd y data fel 101945 a dosbarthiad y dosbarth oedd {1: 87955, 0:13990}. Er mwyn creu setiau data prawf a dilysu trên TensorFlow, mae angen i ni drosi ein data trenau yn ddilyniannau. Rydyn ni wedi eu padio i uchafswm hyd o 100 fel bod pob dilyniant o'r un hyd. +e hyfforddi a phrofi labeli

For more information:1950477648nn@gmail.com






