基于關(guān)系形式概念的教育資源語(yǔ)義模型研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩118頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、近年來(lái),隨著國(guó)家信息化戰(zhàn)略的深入推進(jìn)以及數(shù)字化教育的持續(xù)發(fā)展,我國(guó)各級(jí)教育資源建設(shè)已經(jīng)取得了巨大的成就。Web上各類教育資源的存量巨大、內(nèi)容豐富、增長(zhǎng)迅速,特別是隨著“互聯(lián)網(wǎng)+”思維在社會(huì)生活中的深入應(yīng)用實(shí)踐,眾多輔助的學(xué)習(xí)模式和手段在技術(shù)變革中也在悄然演變和進(jìn)步,終端學(xué)習(xí)者對(duì)資源的獲取、貢獻(xiàn)與影響會(huì)越來(lái)越直接,由此必將進(jìn)一步推動(dòng)教育資源的建設(shè)共享規(guī)模以及強(qiáng)化其發(fā)展質(zhì)量,所有這些對(duì)教育資源的有效組織與獲取技術(shù)提出了更高的要求。而同時(shí),巨

2、量的教育資源處在開(kāi)放、動(dòng)態(tài)和多變的Internet環(huán)境下,位置分散、內(nèi)容多樣、實(shí)際描述標(biāo)準(zhǔn)不統(tǒng)一,針對(duì)特定學(xué)習(xí)目的,學(xué)習(xí)者往往較難實(shí)現(xiàn)有效的資源內(nèi)容篩選與獲取。如何利用文本信息技術(shù)實(shí)現(xiàn)資源語(yǔ)義層面的自動(dòng)標(biāo)識(shí),關(guān)聯(lián)整合不同組織、不同形式的教育資源數(shù)據(jù),實(shí)現(xiàn)更為有效的教育資源組織和共享具有十分重要的理論和實(shí)用價(jià)值。
  為此,論文提出了基于關(guān)系形式概念(Relational Formal Concept,RFC)的教育資源語(yǔ)義互聯(lián)模型

3、——資源關(guān)聯(lián)語(yǔ)義鏈網(wǎng)絡(luò)(Resource Association Link Network,RALN),主要聚焦于三個(gè)關(guān)鍵研究問(wèn)題:
  (1)針對(duì)開(kāi)放的Web教育資源標(biāo)識(shí)組織,如何引入更多的背景知識(shí),提高資源模型的通用性與適應(yīng)性,論文需要為背景知識(shí)的表達(dá)與獲取提供靈活、通用的語(yǔ)義框架支持;
  (2)為了改善文本主題單純依靠離散關(guān)鍵詞統(tǒng)計(jì)特征的局限,使其獲取與人類的并行閱讀方式更為接近,論文在獲取局部詞條概念的同時(shí),還需獲

4、取資源片段的上下文語(yǔ)境特征,更好發(fā)揮背景知識(shí)的效用;
  (3)針對(duì)個(gè)性化資源的時(shí)空動(dòng)態(tài)性,如對(duì)于不同學(xué)習(xí)者和不同學(xué)習(xí)階段,資源間的關(guān)聯(lián)都可能存在差異或變化,資源模型在表達(dá)資源內(nèi)容靜態(tài)關(guān)聯(lián)的同時(shí),還應(yīng)該具備動(dòng)態(tài)學(xué)習(xí)能力,為教育資源語(yǔ)義標(biāo)識(shí)、關(guān)聯(lián)組織提供動(dòng)態(tài)模型支持。
  論文針對(duì)以上問(wèn)題進(jìn)行了研究,主要內(nèi)容為:
  (1)擴(kuò)展了傳統(tǒng)形式背景(Formal Context,F(xiàn)C),構(gòu)建了關(guān)系形式概念模型(Relation

5、al Formal Concept Model,RFCM)?;谌M關(guān)系構(gòu)建的RFCM,為實(shí)體詞條(包括主體概念、客體概念)、實(shí)體關(guān)系(謂詞概念)的語(yǔ)義描述提供了統(tǒng)一的形式化框架,即關(guān)系表達(dá)成主、客體概念、謂詞概念。其中主、客體概念、謂詞概念是關(guān)系不同側(cè)面語(yǔ)義的集合二元組形式化體現(xiàn),均由概念的內(nèi)涵和外延兩部分組成。論文基于關(guān)系形式概念模型,借助開(kāi)放協(xié)作知識(shí)庫(kù)(如百度百科、維基百科),自動(dòng)獲取其中的條目數(shù)據(jù)、標(biāo)簽數(shù)據(jù)作為關(guān)系形式背景的初

6、始來(lái)源,以此構(gòu)建關(guān)系形式概念背景知識(shí);在關(guān)系形式概念提供的初始背景知識(shí)下,綜合考慮詞條上下文句法信息,本文采用圖理論對(duì)實(shí)體詞條間的關(guān)系形式概念連通度進(jìn)行計(jì)算,實(shí)現(xiàn)實(shí)體關(guān)系的抽取、實(shí)體概念識(shí)別的協(xié)作處理,輔助關(guān)系形式背景的擴(kuò)展學(xué)習(xí),為資源標(biāo)識(shí)提供動(dòng)態(tài)的背景知識(shí)。關(guān)系形式概念模型作為一種協(xié)作、自組織的文本語(yǔ)義獲取與表達(dá)模型,能為后續(xù)資源文本的主題抽取與表達(dá)、Web資源關(guān)聯(lián)組織,提供更為靈活的形式化背景知識(shí)和統(tǒng)一的語(yǔ)義框架。
  (2)

7、基于關(guān)系形式概念模型,為文本主題的定義與獲取設(shè)計(jì)了完整的技術(shù)路線,構(gòu)建了關(guān)系形式概念主題模型(Relational Formal Concept Topic Model,RFCTM)。RFCTM借助了關(guān)系形式概念背景知識(shí),首先對(duì)實(shí)體詞條的關(guān)系形式概念相關(guān)度進(jìn)行計(jì)算;并綜合考慮詞條上下文句法信息,進(jìn)行文本中關(guān)系形式概念的連通度語(yǔ)義計(jì)算,實(shí)現(xiàn)了從文本原始詞條—詞條主題—文本離散主題—文本連通主題的資源主題獲取路徑。相比離散關(guān)鍵詞的主題表達(dá),

8、RFCTM具有關(guān)系形式概念更為靈活的語(yǔ)義表達(dá)粒度和更為完整的主題表達(dá)框架。現(xiàn)代系統(tǒng)科學(xué)認(rèn)為[3]:新事物的性質(zhì)以既有組成要素為基礎(chǔ),但又不能由組成要素完全說(shuō)明,組成要素之間的特定內(nèi)在聯(lián)系才是事物的本質(zhì)。該觀點(diǎn)用以文本主題的分析同樣適合,即詞條是語(yǔ)義的基礎(chǔ),但離散詞條及其概念也難以完全刻畫(huà)文本語(yǔ)義主題。RFCTM則模擬了人的基于局部特征和基于語(yǔ)境的并行閱讀認(rèn)知方式,可以為基于內(nèi)容的Web資源標(biāo)識(shí)提供形式化的主題向量,為資源的關(guān)聯(lián)組織提供基

9、礎(chǔ)的語(yǔ)義要素。
  (3)以文本主題模型為基礎(chǔ),為教育資源的標(biāo)識(shí)與組織構(gòu)建了基于語(yǔ)義的標(biāo)識(shí)模型。該模型包括知識(shí)關(guān)聯(lián)語(yǔ)義鏈網(wǎng)絡(luò)(Knowledge Association Link Network,KALN)以及資源關(guān)聯(lián)語(yǔ)義鏈網(wǎng)絡(luò)(Resource Association Link Network,RALN)。KALN是由關(guān)系形式概念及其連接關(guān)系構(gòu)建的知識(shí)網(wǎng)絡(luò),它為資源標(biāo)識(shí)組織提供了基礎(chǔ)的背景知識(shí)網(wǎng)絡(luò);RALN表達(dá)了資源文本片段間的

10、語(yǔ)義關(guān)聯(lián)關(guān)系。論文以資源片段的語(yǔ)義作為獨(dú)立的主題模式,它也是RALN進(jìn)行關(guān)聯(lián)的邏輯結(jié)點(diǎn),并對(duì)雷同的主題模式約簡(jiǎn)合并,以此減少在資源標(biāo)識(shí)過(guò)程中的RALN結(jié)點(diǎn)增加速度,控制RALN的規(guī)模,提高資源的標(biāo)識(shí)組織效率。由于KALN、RALN是由通用的開(kāi)放協(xié)作知識(shí)庫(kù)初始化的,針對(duì)特定的教育資源標(biāo)識(shí)組織往往語(yǔ)義粒度過(guò)粗或缺少領(lǐng)域知識(shí)的支持,難以反映領(lǐng)域資源間特定關(guān)聯(lián)或領(lǐng)域背景,需結(jié)合領(lǐng)域資源的內(nèi)容作進(jìn)一步擴(kuò)展。
  (4)借助神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)理論中

11、的四個(gè)相關(guān)假設(shè),對(duì)KALN進(jìn)行了連接強(qiáng)度的計(jì)算擴(kuò)展。論文模擬人類記憶的激活擴(kuò)散、遺忘抑制機(jī)制,借助資源內(nèi)容對(duì)關(guān)系形式概念的關(guān)聯(lián)強(qiáng)度進(jìn)行動(dòng)態(tài)學(xué)習(xí)調(diào)整,使其不僅反映關(guān)系形式概念語(yǔ)義關(guān)聯(lián),還體現(xiàn)Web資源中關(guān)系形式概念的領(lǐng)域共現(xiàn)語(yǔ)義,使知識(shí)關(guān)聯(lián)語(yǔ)義鏈網(wǎng)絡(luò)與特定領(lǐng)域背景更為接近。論文還提出了基于資源文檔的結(jié)構(gòu)信息對(duì)RALN進(jìn)行擴(kuò)展的思路,使主題模式之間的關(guān)聯(lián)不僅體現(xiàn)其包含的關(guān)系形式概念細(xì)粒度語(yǔ)義關(guān)聯(lián),也體現(xiàn)資源同一文檔中的多主題模式間粗粒度領(lǐng)域

12、關(guān)聯(lián)。最后還對(duì)KALN與RALN增量更新算法進(jìn)行了優(yōu)化,提高模型的擴(kuò)展學(xué)習(xí)效率。
  針對(duì)當(dāng)前資源標(biāo)識(shí)組織存在的問(wèn)題,論文的創(chuàng)新性工作主要體現(xiàn)在:
  (1)擴(kuò)展了形式背景(Formal Context,F(xiàn)C),定義了關(guān)系形式概念模型(RelationalFormal Concept Model,RFCM),從形式上統(tǒng)一了詞條、關(guān)聯(lián)和概念間的語(yǔ)義表達(dá),為文本主題的表達(dá)提供了一個(gè)新思路;
  (2)基于關(guān)系形式概念的連通

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論