臺灣歷史人物文本探勘系統與數位工具之建置

研究計畫: 政府部門科技部計畫

專案詳細資料

說明

「人物」是歷史學研究重要的實體類型之一,因此,對人物傳記的深入了解有助於歷史事件的相關研究。目前許多人物傳記資料是以數位文件的形式存在,而要以人力從大量人物傳記爬梳、彙整資料頗為曠日廢時,宜妥為運用資訊科技協助歷史學家。此外,儘管臺灣過去已建置眾多資料庫,也有各種人物傳和可資應用的資料文獻,卻較少進行歷史人物資料庫勘考、分析工具的開發。有鑑於此,研究者乃組成研究團隊,以《新修彰化縣志‧人物志》為初始文本來源,發展資料庫檢索、全文檢索、文本探勘與社會網絡等分析工具,協助歷史人文學者進行研究,建置「臺灣歷史人物資料庫(Taiwan Biographical Database, TBDB)」。TBDB發展至今,已收錄包含彰化縣、南投縣、澎湖縣、臺中市、台北市等二都、三縣市1,921位歷史人物的傳記文本。本研究計畫主要目的在於支持TBDB所需文本探勘及數位工具的發展,研究成果包含:(1) 運用OpenCV函式庫於TBDB歷史老相片中偵測人臉,以利社會網絡的建立;(2) 運用階層式聚合分群法整合一個以上的社會網絡,有助於深入的社會網絡分析;(3) 設計臺灣歷史人物的知識本體,有助於歷史人物知識的外顯表達,以及資料交換與系統互操作性。
狀態已完成
有效的開始/結束日期2018/08/012020/12/31

Keywords

  • 數位人文;臺灣歷史人物傳記資料庫;社會網絡分析;人臉偵測;OpenCV;階層式聚合分群法;知識本體

指紋

探索此專案觸及的研究主題。這些標籤是根據基礎獎勵/補助款而產生。共同形成了獨特的指紋。