主講人:項潔(國立臺灣大學數位人文研究中心主任)
時間:2021年8月5日(四)14:00~16:00
地點:國史館4樓大禮堂(臺北市中正區長沙街1段2號)
內容簡介:
對歷史研究而言檔案是一種重要的史料來源,然而因爲受到檔案必需用線性方式編排的限制,如果要同時使用不同的檔案或卷宗,要尋找貫穿在其間的脈絡往往不是一件容易的事。 但是檔案一旦被數位化後,這個限制就被打破了,因爲數位檔案可以用其他虛擬的方法編排而不破壞原來的規則,所以文件之間的各種脈絡就可以同時被觀察。譬如説,我們可以把不同檔案中同一天的文件抽離出來,看看不同人或單位對於同一天發生的某個事件的反應。這個工作在數位的環境裡透過重新編排檢索結果就可以大致達到。然而有些脈絡單憑檢索是無法歸納出來的,譬如如果想要知道在一個大文件集中,哪兩個人同時出現在同一份文件裡的頻率最高。一般的檢索系統,對於這樣的脈絡就無法處理。 要充分發揮數位檔案多重脈絡的功能,僅僅憑藉一般的檢索系統是不夠的。在這個報告裡,我們介紹一個建構數位檔案檢索系統的方法論,我們稱之爲“脈絡分析系統“,除了檢索查詢的功能外,脈絡分析系統强調對檢索結果(或任何文件的子集合)進行脈絡分析。我們介紹四種不一樣的脈絡,分別是詮釋資料的脈絡(contexts from metadata)、標記的脈絡(contexts from annotation)、統計脈絡(statistical contexts)、語義脈絡(semantic contexts)。在這個報告中,我們會用一些例子説明這些脈絡如何產生和如何運用,也會對標記的重要性和作法做説明。
觀看人數
1392