leileiya的個人博客分享 http://www.ueservicedoffices.com/u/leileiya

博文

《知識抽取及其應用》報告聽后感

已有 3131 次閱讀 2013-6-19 12:29 |個人分類:講座心得|系統分類:科研筆記|關鍵詞:信息檢索,NLP,知識層| NLP, 信息檢索, 知識層

    6月18號在南京大學仙林校區聽取了美國印地安納大學劉曉鐘博士報告——知識抽取及其應用。首先講了信息檢索相關內容,提出了信息檢索面臨的3個Task,Task1:用戶提供的查詢式并不能很好的表達用戶的信息需要;Task2:系統可以在最短時間內找到用戶需要的相關文檔;task3:怎樣把用戶最需要的相關文檔列到查詢結果前列。因此用戶的信息需要、查詢式、查詢結果三者之間就形成了一個三角關系,現在主要的研究集中在用系統的方法解決用戶問題。從用戶的角度進行研究主要集中在如何更好的理解用戶的信息需要,從文檔的角度研究主要集中在如何選擇出的檢索結果更具有代表性。劉博士又講到在前幾年研究者認為NLP將是未來解決信息檢索問題的有效途徑。NLP從最基礎的Morphological(詞根)到lexical(詞法)、syntactic(句法)、semantic(語義)、discourse(語篇)、pragmatic(語用),從最底層向上檢索需要的時間長,算法的復雜度高并且準確性也不高,所以現在的搜索引擎都還是集中在底層上,自然語言處理并沒有很好的應用到信息檢索中。

   接著劉博士講了最近的研究,在對論文檢索中,提出了在用戶信息需求之上建立一個知識層,在文檔之上也建立一個知識層,將兩個知識層進行匹配,選擇醫藥領域進行研究,因為此領域已經有了很完善的知識關系網可以直接使用。首先給每篇論文建立類似維基百科的一個全自動的詞條系統,將每篇文章涉及到的內容、方法、結論等列出,但其中肯定有不準確的地方,然后可以請一些用戶來進行修正,利用機器學習的方法根據用戶修正的少部分然后改變其余的論文詞條,這就是一種human intelligence與computer之間的交互。接著劉博士還講了另外兩個研究內容,一個為用戶給出摘要,系統可以給用戶推薦相關論文;一個為幫助用戶理解論文的系統,系統可以給出與此篇論文相關的資源,包括有關的文檔、PPT、視頻等。劉博士的研究工作實用性很強,值得我們好好學習。



http://www.ueservicedoffices.com/blog-918667-700877.html

上一篇:用計量的方法研究語言
下一篇:《現代信息檢索-研究進展》課程總結

8 章成志 羅春元 唐常杰 王賢文 劉桂鋒 蘇金亞 趙星 rosejump

該博文允許注冊用戶評論 請點擊登錄 評論 (7 個評論)

數據加載中...
掃一掃,分享此博文

Archiver|手機版|科學網 ( 京ICP備14006957 )

GMT+8, 2019-7-16 16:35

Powered by ScienceNet.cn

Copyright © 2007- 中國科學報社

返回頂部
时时彩平台