日本高级黄区免费,91精品国产一区二区三区免费,99爱国产精品免费视频,一区二区三区国产日韩欧美

<table id="k6kw8"><abbr id="k6kw8"></abbr></table>

<code id="k6kw8"><tr id="k6kw8"></tr></code><abbr id="k6kw8"><optgroup id="k6kw8"></optgroup></abbr><acronym id="k6kw8"></acronym>

<acronym id="k6kw8"><li id="k6kw8"></li></acronym>

<acronym id="k6kw8"><abbr id="k6kw8"></abbr></acronym>

<center id="k6kw8"><pre id="k6kw8"></pre></center>

<li id="k6kw8"><nav id="k6kw8"></nav></li>

<tfoot id="k6kw8"><tr id="k6kw8"></tr></tfoot>

<li id="k6kw8"></li>

面向命名實體抽取的大規(guī)模中醫(yī)臨床病歷語料庫構(gòu)建方法研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-12 格式：pdf 頁數(shù)：70 大小：10.80MB 人氣指數(shù)：12 舉報 版權(quán)申訴

面向命名實體抽取的大規(guī)模中醫(yī)臨床病歷語料庫構(gòu)建方法研究.pdf_第1頁

已閱讀1頁，還剩69頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、中醫(yī)學(xué)是以觀察型臨床診療實踐研究為基礎(chǔ)的臨床醫(yī)學(xué)，病歷是醫(yī)務(wù)人員對診療過程進行的全面記錄，是保證和提高診療質(zhì)量，加強教學(xué)和促進科研的重要檔案資料，是臨床醫(yī)生寶貴經(jīng)驗的載體。因此，中醫(yī)臨床病歷已經(jīng)成為中醫(yī)學(xué)和信息學(xué)關(guān)注的重要數(shù)據(jù)資源。
　　當前，以英文語言為載體的生物醫(yī)學(xué)文獻文本挖掘和自然語言處理應(yīng)用、算法和語料庫等已較為成熟，但國際上臨床病歷的研究仍處于前沿，且我國的中文臨床病歷文本挖掘研究更是處于起步階段。其中，大規(guī)模領(lǐng)域語料庫

2、的研發(fā)是推動高質(zhì)量研究的基礎(chǔ)，由于中醫(yī)領(lǐng)域尚無成型的規(guī)模化語料庫，因此，中醫(yī)臨床病歷語料庫及其構(gòu)建方法研究是急需開展的重要工作。
　　本文以中醫(yī)臨床病歷的命名實體抽取為應(yīng)用目標，根據(jù)其文本數(shù)據(jù)的特點，研制了多種批量標注方法，以輔助規(guī)?；闹嗅t(yī)病歷文本標注，支持大規(guī)模中醫(yī)臨床病歷語料庫的構(gòu)建。在此基礎(chǔ)上，設(shè)計研發(fā)了中醫(yī)臨床病歷標注系統(tǒng)，具體工作包括以下三個方面:
　　(1).針對面向命名實體抽取的大規(guī)模中醫(yī)臨床病歷庫的構(gòu)建問題

3、，實現(xiàn)了結(jié)構(gòu)化病歷數(shù)據(jù)、條件隨機場(Conditional Random Fields，CRFs)和Bootstrapping等三種自動化批量語料標注方法，其中首次嘗試使用基于Bootstrapping的混合命名實體識別方法。并且在使用2，500個標注訓(xùn)練集實驗的評估中，結(jié)構(gòu)化電子病歷和Bootstrapping的F1值分別為76.46％和53.8％，而CRFs的F1值則達到了98％以上，并且基于Bootstrapping的混合方法也達

4、到87％。實驗結(jié)果表明，這三種方法能夠完成文本病歷（以主訴為示范）的批量標注，從而為構(gòu)建大規(guī)模中醫(yī)語料庫提供基礎(chǔ)性方法。
　　(2).初步研制了中醫(yī)臨床病歷命名實體批量標注系統(tǒng)。該系統(tǒng)實現(xiàn)了以上三種批量標注方法，并支持病歷文本數(shù)據(jù)的導(dǎo)入、批量標注和人工審核等主要功能，同時，實現(xiàn)了標注后語料的標準化格式（以XML的規(guī)范行業(yè)格式）導(dǎo)出處理。并利用該系統(tǒng)導(dǎo)入32，411個診次的中醫(yī)病歷文本共351，963份，實現(xiàn)了3，550中醫(yī)臨床病歷

5、（主訴）的批量標注和初步審核，形成了初步的語料數(shù)據(jù)庫，包括診斷、文本病歷、基本信息等病歷內(nèi)容。
　　(3).針對命名實體抽取的機器學(xué)習(xí)方法如CRFs性能與樣本相似性結(jié)構(gòu)之間的關(guān)系問題，通過計算病歷文本之間的字符編輯距離，研究了CRFs標注性能與樣本集相似結(jié)構(gòu)的關(guān)系。實驗結(jié)果表明，在開放式測試中，CRFs的標注性能（以F1值表達）與測試樣本和訓(xùn)練樣本之間的最小編輯距離成反比，測試樣本集與訓(xùn)練集的平均最小編輯距離增大，則CRFs的測試

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論

 聯(lián)系客服

本站為文檔C2C交易模式，即用戶上傳的文檔直接被用戶下載，本站只是中間服務(wù)平臺，本站所有文檔下載所得的收益歸上傳人(含作者)所有。眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私，請立即通知眾賞文庫，我們立即給予刪除！

備案號: 經(jīng)營許可證編號:浙ICP備20018660號
Copyright ? 2013-2023 眾賞文庫版權(quán)所有違法與不良信息舉報電話：15067167862

/ 70

  0
 分享

復(fù)制分享文檔地址

http://shengwuziyuan.com/shtml/view-2821628.html

復(fù)制

下載本文檔

<button id="66uo2"><delect id="66uo2"></delect></button><code id="66uo2"><wbr id="66uo2"></wbr></code>

<table id="66uo2"><s id="66uo2"></s></table>

<code id="66uo2"><cite id="66uo2"></cite></code>

<tr id="66uo2"></tr>

<button id="66uo2"><nav id="66uo2"></nav></button>
<code id="66uo2"><tr id="66uo2"></tr></code>

<tbody id="66uo2"></tbody>

<blockquote id="66uo2"><abbr id="66uo2"></abbr></blockquote>