跳到主要內容
::: 網站導覽
:::

數位檔案的多重脈絡

主講人 | 項潔(國立臺灣大學數位人文研究中心主任)

上架日期 | 2021/09/07

主講人:項潔(國立臺灣大學數位人文研究中心主任)
時間:2021年8月5日(四)14:00~16:00
地點:國史館4樓大禮堂(臺北市中正區長沙街1段2號)

內容簡介:
對歷史研究而言檔案是一種重要的史料來源,然而因爲受到檔案必需用線性方式編排的限制,如果要同時使用不同的檔案或卷宗,要尋找貫穿在其間的脈絡往往不是一件容易的事。 但是檔案一旦被數位化後,這個限制就被打破了,因爲數位檔案可以用其他虛擬的方法編排而不破壞原來的規則,所以文件之間的各種脈絡就可以同時被觀察。譬如説,我們可以把不同檔案中同一天的文件抽離出來,看看不同人或單位對於同一天發生的某個事件的反應。這個工作在數位的環境裡透過重新編排檢索結果就可以大致達到。然而有些脈絡單憑檢索是無法歸納出來的,譬如如果想要知道在一個大文件集中,哪兩個人同時出現在同一份文件裡的頻率最高。一般的檢索系統,對於這樣的脈絡就無法處理。 要充分發揮數位檔案多重脈絡的功能,僅僅憑藉一般的檢索系統是不夠的。在這個報告裡,我們介紹一個建構數位檔案檢索系統的方法論,我們稱之爲“脈絡分析系統“,除了檢索查詢的功能外,脈絡分析系統强調對檢索結果(或任何文件的子集合)進行脈絡分析。我們介紹四種不一樣的脈絡,分別是詮釋資料的脈絡(contexts from metadata)、標記的脈絡(contexts from annotation)、統計脈絡(statistical contexts)、語義脈絡(semantic contexts)。在這個報告中,我們會用一些例子説明這些脈絡如何產生和如何運用,也會對標記的重要性和作法做説明。
00:00:00 陳儀深館長開場
00:02:40 演講開始
00:06:46 數位人文:結合大數據的人文研究
00:27:45 數位人文檢索系統的新需求:尋找文本脈絡
00:32:07 臺大數位人文中心介紹
00:43:37 歷代寳案脈絡分析系統
00:56:35 省議會史料總庫
01:20:33 結語
01:22:15 QA時間

觀看人數

443

Top
Loading