應用語句關係網路計算語句向心性之新聞事件摘要方法

葉 鎮源(Jen-Yuan Yeh), 楊 維邦, 柯 皓仁(Hao-Ren Ke), 鄭 培成(Pei-Cheng Cheng)

Research output: Contribution to journalArticle

Abstract

摘錄式摘要技術的核心在於評估語句的摘要代表性,藉以排序語句作為摘錄語句時的依據。本研究將語句視為節點,藉由語句相似度來決定節點間是否存在連結,依此建構出語句關係網路模型。接著,衡量節點在網路中的重要性或對於其他相連節點的影響性,提出:(1)Degree Centrality、(2)Normalized Similarity-based Degree Centrality、(3)HITS Centrality、(4)PageRank Centrality,及(5)iSpreadRank Centrality的節點向心性分析;並以語句向心性作為語句的摘要代表性,藉此達到排序語句的目的。最後,導入CSIS(Cross-Sentence Information Sub-sumption)過濾重複性資訊,依序擷取語句組成摘要。實驗使用DUC 2004資料集來驗證上述摘要方法的可行性。在ROUGE-1的指標下,結合不同語句向心性之摘要效能依序是:iSpreadRank > Normalized Similarity-based Degree > PageRank > Degree > HITS。整體而言,實驗得知應用語句關係網路計算語句向心性之摘要方法確實可行。
Original languageChinese
Pages (from-to)271-304
Number of pages34
Journal資訊管理學報
Volume21
Issue number3
Publication statusPublished - 2014

Cite this