型的实用性
这种广义变换的实现仍然需要概念证明。为了保证数据的后续使用,编辑工作需要一个理论上一致的编码模型。然而,编码模型的实用性也同样重要。目前,上述TEI编码正在各个项目中测试其实际可行性。人们还在寻求允许计算机创建文档“发票”的数字表示的方法,例如借助自动转换,将 XML 代码结构转换为事实陈述之间的关系,以及可用于维护分类法和受控词汇的方法。在线发布的发票在GAMS(基于 Fedora Commons 的格拉茨人文数据数字档案馆)[34]中可以证明,发票版本的理论方法在现实中是可行的。[35]只需花费少量工作,即可将印刷版和新创建的版本中的五个示例转换为上面概述的 TEI 格式。在转换用作打印模板的文本文档时,可以使用正则表达式进行广泛搜索来识别例如罗马数字或交易末尾的金额。
在对新创建的版本进行编码时,重要的是确保该技术能够很好地融入投入专业知识来转录和索引文本的研究人员的工作流程。为此,在巴塞尔年度账户项目[36]的框架内开发了TEI 定制,允许用短标识符标记相应的文本部分,例如<r:e> 表示每个预订,<r:sum>表示总计或 <r:b>表示预订金额。该版本项目的合作者还决定使用标记来转录货币金额,因此<r:lb>、 <r:sh>和<r:d> 代表英镑、先令和便士。在转换中,这些细节和罗马数字被转换成数值和形式样式表将罗马数字转换成数值,并将这些数字转换为通用的计算基础,即便士。这些数字作为交易金额存储在数据库中,特别是芝麻三重存储库中,并可在那里分配给 TEI 文档中包含的帐户层次结构。这样就可以高效地搜索预订,快速计算总数或表示数值时间序列,以及生成经典版本视图或数据表格表示。数据本身可以通过 TEI 编码和 RDF/XML 数据表示形式访问。
5. 结论
给出的例子表明,理论上开发的模型(可以在 RDF 中形式化)可以用于实 白俄罗斯电报数据 际的编辑工作,并且可以以数字方式表示源的属性,而这在已建立的面向文本的 TEI 编码中是不理想的。创建的数字版本除了可以呈现文本的视觉和语言视图之外,还可以代表其含义。该模型是在中世纪计算的基础上开发出来的,有助于将数字批判性编辑领域的理论考虑(如何对文本对象中的不同研究兴趣进行建模)转化为数字编辑的实用模型。因此,以语言学为主导的批判性数字编辑模式不再是不对中世纪和近代早期计