北方芸能プロジェクト成果報告/学術情報発信ツールとしてのWiki

Top / 北方芸能プロジェクト成果報告 / 学術情報発信ツールとしてのWiki

学術情報発信ツールとしてのWiki

千田 大介

はじめに

WikiやBlogの流行については、昨今、さまざまな雑誌などで取り上げられており、容易に他のサイトと連携できるオープン性と批評メディアとしての特質、サイト構築の簡便性などさまざまな理由が指摘されているが、WWWの利用が定着し情報の発信者・受容者ともに成熟した結果として、デザインに凝ったサイトよりも実質的な情報を発信するサイトへの評価が高まっていることも一つの要因なのではあるまいか。

そもそも学術サイトとは、大学の学科組織や研究会サイトであれ個人サイトであれ、第一に研究・教育に有用な情報を継続的に発信し続けることが求められる。この点において、オープン性と簡便性とを備えた情報発信ツールであるWikiは、まさしく学術サイトの構築に適しているといえよう。

かかる観点から、筆者は、各種Wikiクローンの多言語化を進めるとともに、個人サイト「電脳瓦崗寨」*1およびWebマスターをつとめる中国都市芸能研究会サイトをWikiに移行させ、さまざまな学術情報の発信に活用している。小文はその報告である。

1.Wikiの多言語・多漢字化

1.1YukiWikiとUniWiki

日本で作成・配布されているWikiクローンの大半は、日本語(Shift JISやEUC-JP)にしか対応していない。このため、Wikiを中国学用途に用いるにあたっては、多言語・多漢字処理といういつもの問題をクリアしなくてはならない。

日本語版のWikiクローンは複数存在するが、Perlによって記述されたものとしては、YukiWiki*2が最も広く利用されている。しかし、YukiWikiはjcode.plを利用する日本語CGIであり、多言語・多漢字ドキュメントを扱うのは難しい。そのため、筆者がYukiWiki 2.05をUTF-8化し多言語処理に対応させたのがUniWikiである。最新版はβ1.56で、筆者のサイトで配布している。

実のところ、日本語のPerl CGIをUTF-8による多言語CGIに改造するのは比較的簡単である。文字コードを変換し、HTMLヘッダ生成部分とjcode.pl関連部分を調整するだけでよい。スクリプト中に正規表現による置換部分がある場合は、左辺にASCIIコードの文字しか使えないという制限はあるものの、最新のPerl5.8のみならず、Perl 5.xで問題なく利用できる。UniWikiでは、多言語混在ページに対応するため、文字列の言語を

<span lang="xxx">

タグで指定できるよう整形ルールを追加している。最新のブラウザでは、これによって表示フォントが当該言語のものに自動で切り替わるので、Unicodeで統合されている「骨」と「」、「差」と「」などの日中の字形差をも表現することができる*3

1.2 PukiWikiのUTF-8化

PukiWiki は、PHPで記述された国産Wikiクローンである。メニューバーを備えた洗練されたインターフェス、プラグインによる豊富な機能と優れた拡張性を備えており、筆者もサイトの運営に利用している。執筆時点での最新版は1.4.3*4

PukiWikiには、UTF-8化による台湾版が存在しているので*5、それをベースに、HTMLヘッダ等の言語設定部分を書き換え、日本語スキンファイル等をUTF-8にコンバートすれば、比較的容易に多言語化が実現できる。また、default.ini.phpに整形ルールの拡張設定が用意されているので、spanタグによる言語指定なども簡単に追加できる*6

ただし、PukiWikiはPHP 4.1.0以上でないと動作しないため、設置できないサーバも多い。その場合は、PerlベースのCGIを利用するしかなかろう。

2.Wikiによる研究会サイトの構築

2.1中国都市芸能研究会PukiWiki

中国都市芸能研究会は、近現代中国の都市における芸能とそれをとりまく事象について研究する、分野横断的な研究会であり、会誌『中国都市芸能研究』を毎年発行している*7

中国都市芸能研究会サイトは、執筆時点では、三つのPukiWikiから成り立っている。第一は一般向けの情報公開用Wiki*8。第二は焦循『劇説』Wiki*9で、会読成果を公開するとともに、後述するように古典戯曲総合データベースとして発展させていくことを計画している。第三は対外非公開の会員専用Wikiで、整理中の各種資料や、名簿などの非公開情報・個人情報などを交換する必要から設置している。

2.2研究会サイトWiki化のメリット

研究会サイトをWikiで運営することの最大のメリットは、いうまでもなくサイト更新の負担を分散できることにある。

FTPによるサイト更新では、パスワード管理が不可欠である上に、HTML・FTP等の知識が欠かせないので、勢い数少ない電脳派の人がWebマスターに指名され、更新負担が集中してしまうことになる。一般的に、人文学・中国学の領域では電脳人材が豊富とはいえず、事務作業の電脳化が進んだ昨今は、限られた電脳派の人に仕事が集中する傾向に拍車がかかっているようである。このため、忙しさからサイトの更新頻度が低下する、更にはWebマスターの異動によってサイトが死んでしまう、などという事態がしばしば発生する。

現実的には、研究会・学科等を問わず、Webを通じた情報の公開に理解のある人はごく少数であり、いかにWikiを利用したところで、だれもが積極的にサイトの更新や情報公開を始めるとは考えられない。しかし、WikiはHTMLやFTPの知識を必要としないので、インターネットに接続しBBSを利用できる程度のPCスキルさえあれば、誰でも簡単にページの更新や追加ができる。それゆえに、Webマスターは具体的なページ作成・更新作業を比較的気楽に会員に割りふることができ、サイトメンテナンスの負担を分散することができるのである。ひいては組織全体のPCスキルや情報公開意識を向上させることにも繋がろう。

また、PukiWikiではファイルをページに添付してアップロードすることができる。つまり、Webサイトを手軽にサーバの共有スペースとして利用することができるわけである。この機能を利用することで、写真や動画、Word・Excelのファイル等を共有することができる。

中国都市芸能研究会サイトでは、主に会員専用Wikiでこの機能を活用している。全国に会員が散らばる研究会では、研究例会等の欠席者との情報共有化が一つの問題となる。欠席者にレジュメを一々郵送するのは非常な手間で、実現が困難であったが、PukiWikiの添付ファイル機能を利用することで、基本的にこの問題は解決された*10。このほか、現地調査の記録写真、校正中のテキストデータ、さらには各種申請書の共有化・交換等にも利用している。

中国都市芸能研究会 PukiWiki

以上は、Wikiのコラボレーションツールとしての特性を生かした利用方法といえよう。

2.3研究論文の公開

a) PukiWikiによる人文学論文の処理

筆者は『中国都市芸能研究』誌の編集とデジタル化について紹介したことがあるが*11、その際に『中国都市芸能研究』PDF版のデータ容量が大きいという問題を指摘した。そこで、論文データの公開にPukiWikiを用いることで、その問題の解決を試みた。

前述のように、PukiWikiは非常に機能が豊富であるため、人文学の学術論文に用いられる書式であれば、ほぼ問題なく表現できる*12。例えば、ページに画像を添付してアップロードするとともに、任意の位置に読み込むことができる。表組みでは上下・左右のセルを結合させることもできる。また、丸カッコ二つで文字列を囲うことで、脚注を追加することができる。注釈番号がアラビア数字に限られるなどの制限はあるものの、実用上問題ないといってよかろう。

ただ問題となるのが、見出しのレベルである。一般に国産Wikiクローンでは、ページ中の子見出しのレベルは三段階まで(h2~h4)の対応である。しかし、多少長めの人文学論文であれば、四段階、あるいは五段階を越える見出しレベルが使われることも珍しくはない。

この問題を解決するためには、PukiWikiそのものを改修する必要がある。具体的には、アスタリスクから始まる行を見出しタグに置換する箇所、html.phpの316・323行、およびconvert_html.phpの168行に見える「3」を任意の数字に書き換えればよい。例えば「5」に書き換えれば、見出しを五段階(h2~h6)まで利用できるようになる。

中国都市芸能研究会の刊行物のうち、科研費報告書はWordで、『中国都市芸能研究』はAdobe InDesignで組版している。Wordファイルは、独自のテンプレートを用意し、スタイル機能を用いて各自作成したものである。従って、Word上で書式を検索して見出しや引用箇所の行頭に記号を挿入することで、Wikiの整形ルールに従ったテキストに変換することができる。InDesignの場合は、データを独自タグ付きUTF-8テキストで書き出すことができるので、それらのタグを置換すればよい。

『中国都市芸能研究』ページ

脚注はもとのInDesignデータでは本文とは独立したストーリーに配置されていたが、さしたる量でもなかったため、二重括弧を付けて本文に埋め込む作業は手で行った。

Wikiは、ディレクトリや階層構造を持たないために、作成したページの整理やアクセスにとかく困難がつきまとうのだが、PukiWikiではその対策としてページ名の階層処理と、サブメニューという機能が用意されている。ページ名の階層処理は、「分類名/ページ名」と命名することで、ページをカテゴリ分類する機能である。階層は何段階にも分類することができる。サブメニューは、「分類名/SubMenu」というページを作成し、「MenuBar」に「#includesubmenu」と記述することで、分類名が含まれるページを開いたときに、メニューバーにサブメニューが表示される機能である*13

論文データの公開に際しては、この機能を活用し、「『都市芸研』第一輯/論文タイトル」というページ名でページを作成し、サブメニューとの連繋によってアクセシビリティーの向上をはかった。

b)利点と問題点

人文学の学術論文の公開では、PDF、あるいはWordなどのワープロソフトからエクスポートしたHTMLが使われることが多い。しかし、前者にはファイルサイズが大きくなるという問題が、後者には独自のタグが大量に付されてしまいアクセシビリティーの高いシンプルなHTMLの生成が困難であるという問題がそれぞれ存在する。

Wikiでは、WordやDTPソフトのスタイルを検索し置換・整形することで、比較的簡単にWikiデータを作成することができる。しかも、Wikiに登録してしまえば常にシンプルかつ正確なHTMLが生成されるので、HTMLに比べて作業の手間をかなり低減できる。全文検索機能が利用できるのも嬉しい。ただし、Wikiページが増えるに従い、検索速度が遅くなるという問題はある。

学術研究では常に研究が深化し新たな資料が発見されつづける以上、研究論文にも本当の意味での完成はありえないし、いかに万全を期しても、それでも誤りや校正漏れが発生することは避けられない。この点、Wikiによる公開には、論文を容易に修正できるというメリットがある。

ただし、学術論文のデータは、それぞれの著者の研究業績であり、改訂・書き換えは著者の責任のもとに行われなくてはならないので、不特定多数による書き換えが可能な状態で公開するのには、些か危険がともなう。このため論攷に関しては、部外者が更新できないよう、パスワードによるロックをかけている。

ページのロックを解除し、ページに閲覧者が掲示版の感覚でコメントを書き込めるように一行コメントを付け加えるなどすれば、閲覧者とのオープンな対話によって論文を更新していく、つまり知的生産の場としてWikiを活用することも可能になろう。もっとも、Wikiには悪意ある書き込みや改竄・ページ消去などのリスクがどうしてもつきまとうので、運用方法には工夫が必要となる。また、論文は引用されるものであることを考えれば、頻繁な書き換えに適さない面もあるし、書き換えが数次にわたる場合のバージョン管理問題もある。この点は、今後の課題である。

2.4電子テキストと会読成果の公開

a)『劇説』Wiki

『劇説』は、清代中期の人、焦循の手になる全六巻の筆記小説である。歴代の戯曲・演劇の作品・作家と上演に関する記事を編纂したもので、中国古典戯曲を研究する上で最も重要かつ根本的な資料であり、中国古典戯曲史の大半は同書をもとに記述されているといっても過言でないほどである。

『劇説』の排印本は数種類刊行されているが、しかしながら、引用文献の原典を一々確認して校訂を加えたものは存在しない。そこで中国都市芸能研究会では、同書を会読して校注を施すとともに邦訳をすすめており、その成果を逐次、「『劇説』校注 附:訳注稿」として『中国都市芸能研究』誌上に発表している。焦循『劇説』Wikiは、それをPukiWiki上に公開したものである。

『劇説』Wiki

b) Wikiデータファイルへの加工

『劇説』WikiはInDesignでDTPしたデータを元にしたものであり、作成しなくてはならないWikiページは、本文・訳文・注釈あわせて数百ページにも及ぶ。このため、データを手作業で一々Wikiに登録するのは現実的ではない。

多くの国産Wikiクローンでは、各ページのデータはテキスト形式で保存され、ファイル名はタイトルの文字列を文字コード番号に変換したものになる。例えば、UTF-8を使用している場合、「元曲」というタイトルのファイル名は「E58583E69BB2.txt」になる。このファイル名は、Perlスクリプト等を用いて容易に生成することができる。

さて、紙版の『劇説』校注では、校訂済み原文に中国語の注釈を、校注・戯曲用語注・作品名注・人名注などに分類して付し、その後に日本語訳と訳注とを掲載する形になっている。注釈を内容ごとに分類したのは、歴代の戯曲資料をひろく収集した『劇説』の全編に施した注釈を抽出・加工することで、簡明な古典戯曲辞典や用語集を作成しうるものとの見通しを持っており、将来的な再編集の便を考慮したものである。

作業は、InDesignからエクスポートしたInDesignタグ付きテキストデータをもとに、まずEmEditor*14を用いて不要なInDesignタグの除去などの加工を施した。その上で本文・注釈・訳文などを、それぞれ別ファイルに抽出した。

注釈のうち校注と訳注とは、それぞれ原文・日本語通釈に脚注として埋め込んだ。その他の注釈は、リンクの便を考え、それぞれ独立したページに加工した。まず見出し語が重複するものの内容を調整し、他の脚注を参照するだけのものを削除した上で、Perlを用いて見出し語ごと、つまりは一行ごとに別ファイルに切り出し、Wikiデータを生成した。注釈は、本文中から容易にリンクできるよう、それぞれの見出し語をファイル名とした。

本文と訳文は、校注・訳注を脚注として手作業で埋め込み、やはりPerlを用いて記事ごとに別ファイルに切り出した。ファイル名は、本文については記事の通し番号、訳文については「通し番号/通釈」とし、対応する本文と訳文との間を容易に行き来できるよう、それぞれのページへのリンクを付け加えた。日本語Wikiクローンでは、一般に二重のブラケット([[]])で囲んだ字句には、その字句をタイトルとするページへのリンクが設定されるので、リンクの設定は容易である。それを利用し、本文・訳文に現れる注釈の見出し語についても、各注釈にリンクするよう一括置換した。

こうして作成されたデータをPukiWikiのデータディレクトリにアップロードし、パーミッションを変更してユーザーにも書き込み権限を与え、『劇説』Wikiの公開作業は完了した。

c) ハイパーテキスト化の方法としてのWiki

『劇説』Wikiでは、メニューバーの目次に従って各記事を閲覧する。表示した記事本文中のリンクをクリックすれば、注釈にジャンプできる。また、多くのWikiクローンはページタイトルをクリックすることで、そのタイトルをキーワードとしてWikiページを全文検索する機能があるので、注釈の立てられた語彙の出現箇所を一覧しジャンプすることもできる。

このように『劇説』Wikiは、ハイパーリンク等の機能によってテキストのリニアな構造を解体した典型的なハイパーテキストとして成立している。ハイパーテキストは、WWWの登場とともにその革新的意義が盛んに喧伝されてきたが、中国学の分野では、コーパスこそ構築が進んでいるものの、学術的に有用なハイパーテキストはほとんど存在しないのが実情である。その理由は、HTMLファイルの本文に一々ハイパーリンクを張り込むのは手間がかかるし、また漢字のファイル名が利用できないのでファイル名を一々考えるかあるいはスクリプトで一括処理するしかなく、ある程度のレベルの電脳スキルが必要になってしまう、という点に求められよう。

『劇説』Wikiでは、既存のテキストに基づいて作成したため、Perlスクリプトによる一括処理でWikiデータファイルを生成した。しかし、会読の成果を整理・公開する場としてWikiを活用し、徐々にコンテンツを構築していくのであれば、二重ブラケットで本文の語句を囲い、注釈の見出し語をファイル名にしてページを作成すればいいので、さほどスキルの高くないユーザーであっても十分に対応できる。ゆえに、学術・教育に役立つハイパーテキストサイトを容易に構築しうるツールとして、Wikiは非常に有用であるといえよう。

d) 今後の拡張計画と問題点

前述のように、『劇説』校注は、将来的に中国古典戯曲・演劇の小辞典として加工することを目指している。これは、Wikiに注釈語彙の索引を設置することで、ほぼ実現できのではないかとの見通しを持っている。

現在、『劇説』Wikiには、中国都市芸能研究会が書同文公司に委託入力した中国古典戯曲作品の解題目録、『曲海総目提要』を仮に登録してある。『曲海総目提要』は、校正や異体字の統一作業が完了していないし、リンクの埋め込みも完全ではない。しかし、まがりなりにも『劇説』と『曲海総目提要』という古典戯曲研究における重要資料がWiki上で有機的に結合されているので、例えば『劇説』の本文上の「王實甫」リンクをクリックして注釈に移動し、注釈本文からさらに「西廂記」注釈に跳び、さらに「西廂記」の含まれる全てのページを検索する、というような使い方が可能なのであるから、現状でも十分、研究・教育に利用しうるものと思われる。

今後、『劇説』校注の作成を進めるとともに、さまざまな古典戯曲資料や各種目録などのデータをWikiに登録し、相互に連携させることで、総合的な古典戯曲研究データベースとして発展させていく計画である。

ただ、前にもふれたように、PukiWikiやYukiWikiでは、ページ数が増えるにつれてページの表示や検索の速度が極端に低下するという問題がある。今後、WikiからHTMLファイルを生成させる、あるいはSQLを用いたサイト管理システムを導入するなどの対策が必要になるかもしれない。

また、『劇説』では本文は繁体字、訳文は常用漢字を採用するため、本文と訳文との連携が必ずしも十分ではない。異体字や類義語の一括検索の実現も、今後の課題である。

終わりに

以上のように、学術情報発信にWikiを活用する試みは、現時点では一定の成果を上げている。従来から指摘されているコラボレーションツールとしての適性もさることながら、ハイパーテキスト構築ツールとしても有用であることは、Wikiの人文学分野における応用の可能性を示している。

しばしば指摘されているように、日本国内の研究・教育組織あるいは研究者個人のWWWを通じた情報発信は、全体としてまだまだ立ち後れている。そのような状況を緩和する手段として、Wikiは一つの有力な選択肢となろう。


*1 http://wagang.econ.hc.keio.ac.jp/
*2 結城浩氏作。http://www.hyuki.com/。執筆時点での最新バージョンは2.1.2。
*3 『漢字文献情報処理研究』第3号(好文出版、2002年)「WWWブラウザ」レビュー(師茂樹)参照。
*4 http://pukiwiki.org/
*5 http://pukiwiki.kandix.idv.tw/
*6 改造の具体的手順については、筆者のサイト(注1参照)の「PukiWiki改造覚書」を参照して頂きたい。
*7 『漢字文献情報処理研究』第3号「電子版学術雑誌をめぐる諸問題」参照。
*8 http://wagang.econ.hc.keio.ac.jp/~chengyan/
*9 http://wagang.econ.hc.keio.ac.jp/~chengyan/jushuo/
*10 ただし、文献コピー資料をスキャンしてアップする必要がある、という問題はのこる。
*11 注7参照。
*12 PukiWikiの人文学論文記述への適性については、PukiWiki.org「Use PukiWiki/論文だって書けちゃう」ページ参照。
*13 以上の機能については、PukiWiki.orgのプラグイン解説参照。
*14 EmEditorについては、『漢字文献情報処理研究』第4号(好文出版、2003年)「テキストエディタ」レビュー(山田崇仁)参照。なお、バージョン4でUTF-8の正規表現検索・置換・Grep等に対応した。入手先はhttp://www.emeditor.com/jp/