|
タイトル |
人文学のためのテキストデータ構築入門(ジンブンガクノタメノテキストデータコウチクニュウモン) |
|
より効果的にテキストデータを蓄積・共有し、広く世界につなげるために、人文学研究においてテキストデータはこれからどう作っていけばいいのか。
私たちの読みを残し、共有し、たどれるようにする、あるいはどう読んだかを次世代に継承するためには、どういう処理や方法が必要なのか。
今後の人文学研究にとって必須のテキストデータ構築の方法を、丁寧に解説、紹介していく書です。
欧米ではすでに、こういったことに1980年代から取り組んできており、TEI(Text Encoding Initiative)ガイドラインという形でルールを共有してきましたが、日本では文字の扱いなどで難しい部分もあり、導入が遅れていました。しかし近年状況が劇的に変化しつつあります。
本書では、今後の人文学のための、より広い世界につながっていけるようにするためのテキストデータの構築手法を、全4部構成でレクチャーします。第1部ではテキストデータの構築に関する概要とこれまでの日本での動向、第2部は、テキストデータ構築のための実践、第3部、4部はテキストデータ構築やその利活用に関する事例を紹介します。
特に実践編では、実際使用するソフトウェアについての紹介とチュートリアルを提供するなど、具体的に紹介し実践的に作られています。ぜひ本書をガイドに、自身のテキストデータを扱ってみて下さい。現時点で考え得る実現可能かつ有用性の高いテキストデータ構築の手法を提示しています。実践演習として「漱石書簡を用いたTEIによるテキスト構造化入門」も掲載。
事例も豊富に紹介しています。古代から近代、日本や中国、中東、欧州までと、広範囲におよぶうえ、仏典の一大叢書である大正新脩大藏経に対するTEIガイドライン準拠のための構造化を組織的に推進しているSAT大蔵経データベース研究会の取り組みも紹介しました。
これからの人文学研究のために、必携の書です。
執筆は、石田友梨/大向一輝/小風綾乃/永崎研宣/宮川 創/渡邉要一郎/井上さやか/井野雅文/王 一凡/岡田一祐/小川 潤/片倉峻平/金 甫榮/小風尚樹/佐久間祐惟/左藤仁宏/中村 覚/南 亮一/矢島正豊。
【…ただいろいろなデータをテキストに書き込んでいくだけでは、そのデータをうまく読み取ることも、より広い観点から活用することも十分にはできない。それが深くなればなるほど困難さも増していく。そこで、何らかのルールに基づいてデータを構築していくことが有力な選択肢となる。欧米の先進国では、これに1980年代から取り組んできており、TEI(Text Encoding Initiative)ガイドラインという形でルールを共有し、それに基づいてすでに相当の蓄積をなしている。欧米に比べ、日本では文字の扱い等に困難さを抱えていたこともあり、そのような習慣が根付くことに時間がかかり、その一方で、欧米で作られたルール…