應用語句關係網路計算語句向心性之新聞事件摘要方法

葉 鎮源(Jen-Yuan Yeh), 楊 維邦, 柯 皓仁(Hao-Ren Ke), 鄭 培成(Pei-Cheng Cheng)

研究成果: 雜誌貢獻期刊論文同行評審

摘要

摘錄式摘要技術的核心在於評估語句的摘要代表性,藉以排序語句作為摘錄語句時的依據。本研究將語句視為節點,藉由語句相似度來決定節點間是否存在連結,依此建構出語句關係網路模型。接著,衡量節點在網路中的重要性或對於其他相連節點的影響性,提出:(1)Degree Centrality、(2)Normalized Similarity-based Degree Centrality、(3)HITS Centrality、(4)PageRank Centrality,及(5)iSpreadRank Centrality的節點向心性分析;並以語句向心性作為語句的摘要代表性,藉此達到排序語句的目的。最後,導入CSIS(Cross-Sentence Information Sub-sumption)過濾重複性資訊,依序擷取語句組成摘要。實驗使用DUC 2004資料集來驗證上述摘要方法的可行性。在ROUGE-1的指標下,結合不同語句向心性之摘要效能依序是:iSpreadRank > Normalized Similarity-based Degree > PageRank > Degree > HITS。整體而言,實驗得知應用語句關係網路計算語句向心性之摘要方法確實可行。
原文繁體中文
頁(從 - 到)271-304
頁數34
期刊資訊管理學報
21
發行號3
出版狀態已發佈 - 2014

Keywords

  • 多文件摘要
  • 摘錄式摘要
  • 語句關係網路
  • 網路節點向心性
  • 語句排序
  • multidocument summarization
  • extraction-based summarization
  • sentence similarity network
  • network-based sentence centrality
  • sentence ranking

引用此