建置與評估文字自動生成的情感對話系統

楊 德倫(Te-Lun Yang), 曾 元顯(Yuen-Hsien Tseng)

Research output: Contribution to journalArticlepeer-review

Abstract

本研究藉由2019年中文情緒對話生成(CECG)評比任務所提供約170萬則語料,運用深度學習GPT-2與BERT等技術與工具,實作了具備情感對話的系統,並以CECG提供的測試發文評估其成效。由三位人工判斷的結果,顯示本研究建置發展的系統,與2019年CECG評測最佳團隊的系統有類似的成效水準。而進一步的案例分析發現,對於訓練資料中較普遍的話題,GPT-2的語言建模技術,的確可以生成創新、有趣、完美的回應文句。本研究的主要貢獻為:㈠將情感融入發文字串中做為條件求機率,以便簡潔地依原方式訓練並使用GPT-2;㈡運用BERT來預測回應文句的連貫性以做為排序的依據。雖然這兩項技巧分別源自GPT與BERT的訓練機制,但本研究稍加修改應用於CECG的任務上,獲得了不錯的效果。
Original languageChinese (Traditional)
Pages (from-to)355-378
Number of pages24
Journal教育資料與圖書館學
Volume57
Issue number3
DOIs
Publication statusPublished - 2020

Cite this