多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內(nèi)最全I(xiàn)T社區(qū)平臺 聯(lián)系我們 | 收藏本站
阿里云優(yōu)惠2
您當(dāng)前位置:首頁 > 服務(wù)器 > 機器閱讀理解中文章和問題的深度學(xué)習(xí)表示方法

機器閱讀理解中文章和問題的深度學(xué)習(xí)表示方法

來源:程序員人生   發(fā)布時間:2016-12-07 08:14:55 閱讀次數(shù):3349次

/* 版權(quán)聲明:可以任意轉(zhuǎn)載,轉(zhuǎn)載時請標(biāo)明文章原始出處和作者信息 .*/

                                       author: 張俊林


注:本文是《深度學(xué)習(xí)解決機器瀏覽理解任務(wù)的研究進(jìn)展》節(jié)選,該文將于近期在“深度學(xué)習(xí)大講堂”公眾號發(fā)布。



2.1文章和問題的表示方法


   用神經(jīng)網(wǎng)絡(luò)處理機器瀏覽理解問題,首先面臨的問題就是如何表示文章和問題這兩個最重要的研究對象。我們可以從現(xiàn)有機器瀏覽理解相干文獻(xiàn)中歸納總結(jié)出經(jīng)常使用的表示方法,固然這些表示方法不單單局限于瀏覽理解問題,也常常見于NLP其他子領(lǐng)域中。



    4.文檔表示方法:模型1


首先,對機器瀏覽理解中的文章來講,有兩種常見的文章內(nèi)容表達(dá)方式。最多見的1種即是將1篇文章看成有序的單詞流序列(參考圖4的模型1),在這個有序序列上使用RNN來對文章進(jìn)行建模表達(dá),每一個單詞Dt對應(yīng)RNN序列中的1個時間步t的輸入,RNN的隱層狀態(tài)Ht代表融會了Dt本身詞義和其上下文語義的語言編碼。這類表示方法其實不對文章整體語義進(jìn)行編碼,而是對每一個單詞及其上下文語義進(jìn)行編碼,在實際使用的時候是使用每一個單詞的RNN隱層狀態(tài)Ht來進(jìn)行相干計算。至于具體的RNN模型,常見的有標(biāo)準(zhǔn)RNN、LSTMGRU及其對應(yīng)的雙向版本等。對機器瀏覽理解來講雙向RNN是最經(jīng)常使用的表示方法,1般每一個單詞的語義表示由正向RNN隱層狀態(tài)和反向RNN隱層狀態(tài)拼接來表示,即:


模型1常常在機器瀏覽理解系統(tǒng)的原始輸入部份對文章進(jìn)行表征,由于對很多瀏覽理解任務(wù)來講,本質(zhì)上是從文章中推導(dǎo)出某個幾率最大的單詞作為問題的答案,所以對文章以單詞的情勢來表征非常自然。


另外1種常見的文章內(nèi)容表達(dá)方式則是從每一個單詞的語義表達(dá)推導(dǎo)出文章整體的Word Embedding表達(dá),這類情勢常常是在對問題和文章進(jìn)行推理的內(nèi)部進(jìn)程中使用的表達(dá)方式。典型的表達(dá)進(jìn)程如圖5所示的模型2所示。



             5. 文檔表示方法:模型2


    模型2的含義是:首先類似于模型1,用雙向RNN來對每一個單詞及其上下文進(jìn)行語義表征,構(gòu)成隱層狀態(tài)表示Ht,然后對Ht向量的每維數(shù)值,乘以某個系數(shù),這個系數(shù)代表了單詞對全部文章終究語義表達(dá)的重要程度,將每一個單詞的系數(shù)調(diào)劑后的隱層狀態(tài)Ht累加便可得到文章的Word Embedding語義表達(dá)。而每一個單詞的權(quán)重系數(shù)通經(jīng)常使用Attention計算機制來計算取得,也有不使用權(quán)重系數(shù)直接累加的方式,這等價于每一個單詞的權(quán)重系數(shù)都是1的情形,所以可以看做加權(quán)平均方法的特殊版本。以公式表達(dá)的話,文章的語義表達(dá)公式以下:


對機器瀏覽理解中的問題來講,有3種常見的語義表達(dá)方式。如果將查詢看做1種特殊的文章的話,很明顯文章的語義表達(dá)方式一樣可以用來表征問題的語義,也就是類似于文檔表示方法的模型1和模型2,除另外,還有另外1種不同的表達(dá)方式。問題的表示方法模型1如圖6所示,模型2如圖7所示,其代表的含義與文章表征方式類似,所以此處不贅述。


  6.問題表示方式:模型1



     7.問題表示方法:模型2

問題表示方法的另外1種表示如圖8所示,我們可以稱之為模型3。


              8.問題表示方法:模型3


模型3也是在模型1的基礎(chǔ)之上的改進(jìn)模型,也是NLP任務(wù)中表達(dá)句子語義的最多見的表達(dá)方式。首先類似于模型1,使用雙向RNN來表征每一個單詞及其上下文的語義信息。對正向RNN來講,其尾部單詞(句尾詞)RNN隱層節(jié)點代表了融會了全部句子語義的信息;而反向RNN的頭部單詞(句首詞)則逆向融會了全部句子的語義信息,將這兩個時刻RNN節(jié)點的隱層狀態(tài)拼接起來則可以表征問題的整體語義:


理論上模型3也能夠用來表征文章的語義信息,但是1般不會這么用,主要緣由是文章常常都比較長,RNN對太長的內(nèi)容表征能力不足,所以類似模型3的方法會存在大量的信息丟失,而“問題”1般來講都是比較短的1句話,所以用模型3表征是比較適合的。


以上介紹的幾個模型是在機器瀏覽理解領(lǐng)域里經(jīng)常使用的表征文章和問題的表示方法。下面我們從機器瀏覽理解神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的角度來進(jìn)行經(jīng)常使用模型的介紹。


掃1掃關(guān)注微信號:“布洛卡區(qū)” ,深度學(xué)習(xí)在自然語言處理等智能利用的技術(shù)研討與科普公眾號。


生活不易,碼農(nóng)辛苦
如果您覺得本網(wǎng)站對您的學(xué)習(xí)有所幫助,可以手機掃描二維碼進(jìn)行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關(guān)閉
程序員人生
主站蜘蛛池模板: 国产视频一区在线 | 精品成人网 | 日韩国产欧美在线观看一区二区 | 亚洲国产成人久久一区www | 日本不卡免费在线 | 亚洲精品αv一区二区三区 亚洲精品播放 | 中文字幕在线视频在线看 | 波多野结衣一区二区三区高清在线 | 久久性生大片免费观看性 | 亚洲精品国产福利一区二区三区 | 欧美亚洲另类图片 | 欧美最猛性xxxxx69交 | 国产成人久久777777 | 国产在线欧美日韩一区二区 | 啦啦啦啦高清视频免费观看 | 性欧美黑人 | 在线免费网站 | 日韩欧美一区二区精品久久 | 国产成人精品免费视频网页大全 | www.操操操 | 欧美性精品videofree | 免费国产高清精品一区在线 | 日本不卡一区二区三区视频 | 欧美videos另类极品 | 午夜影院免费 | 内部片免费一区 | 精品视频在线观看一区二区三区 | 农村女人的一级毛片 | 每日更新在线 | 视频在线免费看 | 亚洲精品欧美 | 久久一区二区三区99 | 欧美乱妇高清无乱码亚洲欧美 | 性国产videofree另类 | 欧美精品18videos性欧美 | 日本一区二区三区四区不卡 | 欧美中日韩在线 | 国产成人亚洲综合在线 | 最近中文字幕视频在线资源 | 一本大道高清香蕉中文大在线 | 亚洲乱码在线播放 |