Dadansoddi Teimlad Tymor Byr Effeithlon ar Sail Cof O Adolygiadau E-Fasnach Rhan 2

Jan 18, 2024

Roedd Muhammad et al. [20] cyflwynodd fodel ar gyfer dadansoddi sentiment trwy ddefnyddio word2vec a LSTM ar gyfer adolygiadau gwesty.

Muhammad yw proffwyd a sylfaenydd Islam. Gelwir ef yn ddyn doeth, doeth, a doeth. Mae ei gof yn bwerus iawn, sy'n ei wneud yn effeithiol iawn wrth brosesu gwybodaeth a mynegi ei feddyliau.

Mae gan gof Muhammad lawer i'w wneud â'i addysg a'i brofiad. Yn ôl cofnodion, roedd yn aml yn cael ei drochi mewn meddwl a myfyrio yn ei ieuenctid. Bu'r chwilfrydedd hwn a'r syched am wybodaeth yn gymorth iddo adeiladu sylfaen wybodaeth gref a gallu cof.

Yn ogystal, roedd cudd-wybodaeth Muhammad hefyd yn chwarae rhan fawr yn ei alluoedd cof. Mae'n glyfar, yn ffraeth, yn graff, ac mae ganddo allu meddwl rhesymegol, sy'n fanteisiol iawn wrth ddelio â gwybodaeth gymhleth. Fe wnaeth y fantais hon ei helpu i reoli a rheoli'r broses cof yn well, a thrwy hynny wella ei gof.

Fodd bynnag, nid oedd cof Muhammad yn gynhenid ​​​​ond wedi gwella trwy waith caled ac ymarfer. Mae'n aml yn cynnal hyfforddiant cof, megis darllen dro ar ôl tro, arddywediad, a lleferydd, i'w helpu i ddeall a meistroli gwybodaeth yn ddyfnach.

Nid dawn naturiol yn unig oedd cof Muhammad, cafodd ei wella trwy waith caled ac ymarfer. Mae hyn yn dangos y gall pob un ohonom wella ein cof a gwella ein heffeithlonrwydd dysgu a gwaith trwy ddysgu ac ymarfer. Gadewch inni, fel Muhammad, weithio'n galed i wella ein sgiliau cof yn barhaus, i gyflawni mwy o lwyddiant mewn bywyd a gwaith! Gellir gweld bod angen i ni wella cof, a gall Cistanche deserticola wella cof yn sylweddol, oherwydd gall Cistanche deserticola hefyd reoleiddio cydbwysedd niwrodrosglwyddyddion, megis cynyddu lefelau acetylcholine a ffactorau twf. Mae'r sylweddau hyn yn bwysig iawn ar gyfer cof a dysgu. Yn ogystal, gall Cig hefyd wella llif y gwaed a hyrwyddo darpariaeth ocsigen, a all sicrhau bod yr ymennydd yn derbyn digon o faetholion ac egni, a thrwy hynny wella bywiogrwydd a dygnwch yr ymennydd.

increase brain power

Cliciwch Gwybod i wella cof tymor byr

Ar gyfer yr astudiaeth hon, casglwyd y data trwy gropian y wefan deithio gan ddefnyddio seleniwm a sgrap. +e Prif bwrpas yr arbrawf hwn oedd dadansoddi cywirdeb trwy newid paramedrau word2vec a LSTM. +e dangosodd canlyniadau y gellid cyflawni cywirdeb cymedrig o 85.96 gan ddefnyddio'r paramedrau, a ddangosodd ganlyniadau addawol.

Mae Zhao et al. [21] cyflwyno techneg newydd i ddadansoddi teimladau cwsmeriaid o adolygiadau ar wefannau e-fasnach. +e techneg wedi'i optimeiddio arfaethedig "Mae'r Algorithm Ystlumod Byrfyfyr yn seiliedig ar Elman NeuralNetwork (LSIBA-ENN)" yn cynnwys pedwar cam ac yn canfod y pegynedd ac yn dosbarthu teimladau'r adolygiadau. +e casglwyd data ar gyfer yr ymchwil hwn trwy ddefnyddio'r offeryn sgrapio gwe ar wefannau e-fasnach i dynnu adolygiadau cwsmeriaid.

Yn ogystal â rhagbrosesu’r data, mae’r astudiaeth hon yn defnyddio “Amlder Dosbarth Gwrthdro Addasedig ar sail Amlder LogTerm (LTF-MICF) ac Algorithm Cynnes Daear sy’n seiliedig ar Dreiglad Hybrid (HMEWA)” ar gyfer pwysoli termau a dewis nodweddion. +e roedd y fethodoleg arfaethedig yn drech na thechnegau llinell sylfaen eraill o ran cywirdeb rhagfynegi.

Cynigiodd Jiang [22] fodel i ddosbarthu teimladau adolygiadau a gafwyd o lwyfan e-fasnach Taobao.+ Mae astudiaeth yn defnyddio'r algorithm dysgu peiriant yn ogystal â chymorth peiriant fector ar gyfer dosbarthu ac optimeiddio heidiau gronynnau gwell (IPSO) i optimeiddio'r paramedrau. +e casglwyd data ar gyfer yr astudiaeth trwy gropian y sylwadau oddi ar y wefan. +e dangosodd canlyniadau arbrofol fod gan ddull cyfun SVM ac IPSO gywirdeb uwch. Fodd bynnag, mae'r mwyafrif o'r modelau presennol yn dioddef o orffitio [23-25], cyflymder cydgyfeirio gwael [26-28], a phroblemau graddiant diflannu[29-31].

3. Astudiaeth Arbrofol

+mae'r adran yn rhoi trosolwg clir o'r fethodoleg a ddefnyddiwyd yn y prosiect ar gyfer dosbarthu teimlad. Techneg +e a ddefnyddiwyd yw rhwydwaith Cof Tymor Byr Hir, a ddefnyddir i ddosbarthu nifer fawr o adolygiadau cronfa ddata Amazon. +e mewnosod a ddefnyddir yw word2vec, sydd wedi'i hyfforddi'n arbennig yn unol â'r gronfa ddata.

Mae tiwnio'r gair2vec yn ôl y set ddata yn gwella perfformiad cyffredinol y model. +e mantais defnyddio LSTM yw ei fod yn rhoi canlyniadau gwell hyd yn oed ar gyfer y data adolygu anstrwythuredig. Mae'n gallu cael swyddogaethau defnyddiol ar gyfer adnoddau sy'n cynnwys dibyniaethau hirdymor.

Cesglir data +e o set ddata adolygu Amazon, sydd wedyn yn cael ei phrosesu ymlaen llaw. Mae mewnosodiadau Word2vec yn gam pwysig yn y broses o ragbrosesu'r data. Crëwyd data trenau a phrofion. +e data hyfforddi wedi'i rannu'n setiau data trenau a dilysu. +e model word2vec wedi'i deilwra yn gronfa ddata trainingper. +e fector nodwedd yn cael ei sicrhau, a ddefnyddir wedyn fel yr haen ymgorffori ar gyfer y model LSTM.

Defnyddir Keras ar gyfer adeiladu'r model dilyniannol LSTM gyda nodweddion mwyaf cyfartal i 50,000 a maint mewnosod sy'n hafal i 16. +emodel wedyn yn cael ei hyfforddi am 10 cyfnod. +e model yn cael ei brofi yn seiliedig ar fetrigau perfformiad sklearn. Dangosir y broses o gael nodweddion +e yn Ffigur 2.

3.1. Set ddata. I gynhyrchu canlyniadau cywir, dylai'r set ddata a ddefnyddir fod yn fawr ac wedi'i gyfoethogi. Mae set ddata +e wedi'i chasglu o'r adran ffonau symudol ac ategolion ar-lein o set ddata Amazon Reviews (2018). Mae set ddata +e yn cynnwys cyfanswm o 938,261 o adolygiadau, ac yn eu plith mae 47901 o gynhyrchion unigryw a 153124 yn adolygiadau defnyddwyr unigryw. Mae +e set ddata i ddechrau yn cynnwys 7 colofn, sef, sgôr sy'n amrywio o 1 i 5, amser adolygu, ID yr adolygydd, ID y cynnyrch, a chrynodeb o destun adolygu.

Ar ôl gollwng y copïau dyblyg, mae'r set ddata yn cynnwys 938254 o gofnodion, ac mae Tabl 2 yn dangos pyt o gofnodion gwreiddiol y set ddata.

3.2. Methodoleg. Rydym wedi hyfforddi ein model word2vec yn arbennig i'w ddefnyddio gyda'r model LSTM ar gyfer dosbarthu. Mae Word2vec yn ymgorfforiad geiriau a ddefnyddir i gynrychioli gair gan gasgliad o sawl term fector. Mae i ffwrdd o fapio gair i mewn i ofod fector. +e set ddata yn cael ei llwytho i ffrâm data pandas. Ar gyfer datblygu model customword2vec, y cam cyntaf yw rhagbrosesu data.

Dim ond edrych ar y sgôr ac adolygu testun a gollwng popeth arall. +e mae'r testun yn cael ei lanhau trwy ddileu'r atalnod. Mae is-sampl o'r testun yn cael ei greu o bron i 200,000 o adolygiadau a defnyddir y dull testun glân i drosi pob adolygiad yn rhestr o eiriau. +yw rhestr o eiriau bellach yn gweithredu fel mewnbwn i'r model genism word2vec.

Rydym wedi adeiladu model word2vec-gram sgip-gram wedi'i hyfforddi'n arbennig ac wedi cyflymu'r model gyda dimensiynau: maint fectorau geiriau fel 100, maint ffenestr yn hafal i 15, min_cyfrif 2 ar gyfer geiriau sy'n ymddangos llai na 2 waith yn ein corpws, negatif hafal i 5, a chyfradd samplu hafal i 1e−5. Rydym wedi defnyddio'r holl ddimensiynau hyn i adeiladu geirfa o'n brawddegau adolygu.

increase memory

Rydym yn hyfforddi ein model word2vec ar gyfer 1000 epocs. +cy rydym yn cyfrifo'r golled ym mhob cyfnod. +e mae colled yn uchel ar y dechrau ac mae'n lleihau tua'r cyfnod olaf. +e colled ar y pryd 0 yw 2239394.0 a'r golled yn yr epoc 1000 yw 11504.0.+e mae'r model a arbedwyd wedyn yn cael ei ail-lwytho a bydd gweithrediadau'n cael eu perfformio arno.

Er enghraifft, os ydym am ddod o hyd i eiriau tebyg i sŵn yn ein set ddata, rydym yn cael canslo a chlustffonau.

Yn yr un modd, gallwn hefyd ddod o hyd i'r tebygrwydd rhwng geiriau penodol megis clustffonau a chlustffonau sef {{0}}.48756, a'r tebygrwydd rhwng y geiriau charge a charger yw 0.89264.

Er mwyn lleihau dimensiynau ein data, rydym wedi defnyddio delwedduTSNE i blotio'r data yn ddau ddimensiwn. Nawr, gellir defnyddio'r fectorau geiriau hyn ar gyfer dosbarthiad pellach. +mae'r mewnosodiadau hyn wedyn yn cael eu defnyddio fel nodweddion ar gyfer ffrydio pellach.

3.2.1. Paratoi Data ar gyfer LSTM. Mae ein set ddata yn cynnwys 938254 o gofnodion gyda'r rhan fwyaf o'r adolygiadau â dosbarthiad sgôr o fwy na 3. Rydym wedi cyfrifo nifer y geiriau ar gyfer pob adolygiad yn gyntaf. +e defnyddir cymedr cyfartalog fel ystadegau i ganfod hyd cyfartalog adolygiadau. +e cymedr yr adolygiad yw 44.59 a'r hyd mwyaf yw 4303.

Rydym wedi creu set ddata sy'n cynnwys adolygiadau sydd â 100 gair neu lai. Mae adolygiadau y mae eu hyd yn fwy nag 20 ond yn llai na 100 yn cael eu categoreiddio o dan adolygiadau byr ac mae'r gweddill yn cael eu categoreiddio o dan adolygiadau hir. +e nifer yr adolygiadau byr yw 411313 ac adolygiadau hir yw 100239. Disgrifir hyperparameters a ddefnyddir yn y model yn Nhabl 3.

Nesaf, rydym wedi diffinio'r sgôr teimlad yn bositif os yw'r sgôr yn fwy na neu'n hafal i 3; fel arall, mae'r sgôr yn negyddol. Rydym wedi ystyried testun yr adolygiad a'r teimlad ar gyfer creu'r set ddata trenau. +e mae data prawf yn cynnwys cynhyrchion sy'n cael o leiaf mwy na 10 adolygiad.

Ar ôl ei ddosbarthu, roedd y set ddata hyfforddi yn cynnwys cyfanswm o 203891 o gofnodion, ac yn eu plith roedd 175910 yn perthyn i'r dosbarth cadarnhaol a 27981 i'r dosbarth negyddol. Roedd set ddata prawf +e yn cynnwys cyfanswm o 686345 o gofnodion, ac yn eu plith roedd 592118 yn perthyn i'r positif a 94227 i'r dosbarth negyddol.

Yn yr astudiaeth hon, rydym wedi defnyddio Keras i adeiladu ein model LSTM, sy'n cymryd uchafswm o 50,000 o nodweddion fel mewnbwn i'r haen mewnosod. Mae cof tymor byr hir (LSTM) yn fath o rwydwaith niwral cylchol sy'n defnyddio mecanwaith mewnol sy'n rheoli llif gwybodaeth.+ yw mecanwaith mewnol yn cynnwys giatiau y mae angen eu hyfforddi fel y gallant hidlo gwybodaeth amherthnasol yn gywir a chadw gwybodaeth ddefnyddiol.

ways to improve brain function

Mae Ffigur 3 yn dangos pensaernïaeth sylfaenol y model LSTM yn ein methodoleg arfaethedig.

Ht−1 ac Xt yw'r mewnbynnau i'r uned LSTM; Mae Ht−1, y cyfeirir ato'n gyffredin fel cof tymor byr, yn cymryd yr allbwn o'r cyflyrau blaenorol fel y mewnbwn. +e cofgell neu'r cof hirdymor, Ct −1, yn helpu i gario gwybodaeth berthnasol drwy gydol y broses o ddilyniant. + Mae pensaernïaeth eLSTM yn cyfuno tair giât: giât anghofio, porth mewnbwn a giât allbwn. Yn yr uned LSTM, defnyddir ffwythiannau tanh a sigmoid i gael y gatiau hyn.

Yna rhannwyd data trenau +e yn ddata trenau a dilysu o hyd cyfartal. +e cyfrifwyd hyd y data fel 101945 a dosbarthiad y dosbarth oedd {1: 87955, 0:13990}. Er mwyn creu setiau data prawf a dilysu trên TensorFlow, mae angen i ni drosi ein data trenau yn ddilyniannau. Rydyn ni wedi eu padio i uchafswm hyd o 100 fel bod pob dilyniant o'r un hyd. +e hyfforddi a phrofi labeli

improve your memory


For more information:1950477648nn@gmail.com



Fe allech Chi Hoffi Hefyd