Abstract
摘錄式摘要技術的核心在於評估語句的摘要代表性,藉以排序語句作為摘錄語句時的依據。本研究將語句視為節點,藉由語句相似度來決定節點間是否存在連結,依此建構出語句關係網路模型。接著,衡量節點在網路中的重要性或對於其他相連節點的影響性,提出:(1)Degree Centrality、(2)Normalized Similarity-based Degree Centrality、(3)HITS Centrality、(4)PageRank Centrality,及(5)iSpreadRank Centrality的節點向心性分析;並以語句向心性作為語句的摘要代表性,藉此達到排序語句的目的。最後,導入CSIS(Cross-Sentence Information Sub-sumption)過濾重複性資訊,依序擷取語句組成摘要。實驗使用DUC 2004資料集來驗證上述摘要方法的可行性。在ROUGE-1的指標下,結合不同語句向心性之摘要效能依序是:iSpreadRank > Normalized Similarity-based Degree > PageRank > Degree > HITS。整體而言,實驗得知應用語句關係網路計算語句向心性之摘要方法確實可行。
Original language | Chinese (Traditional) |
---|---|
Pages (from-to) | 271-304 |
Number of pages | 34 |
Journal | 資訊管理學報 |
Volume | 21 |
Issue number | 3 |
Publication status | Published - 2014 |