北方芸能プロジェクト成果報告/京劇上演データベース構築のパースペクティブ

Top / 北方芸能プロジェクト成果報告 / 京劇上演データベース構築のパースペクティブ

京劇上演データベース構築のパースペクティブ

千田 大介

はじめに

近年の中国伝統演劇研究は、社会学や文化人類学的な方法論・視点を導入し、演劇をとりまく社会環境を重視することで、従来の審美学的な上演技術論や批評の枠にとどまらない、多様な研究成果を生み出している。

しかしその一方で、それらの研究をささえるべき研究資料の整理状況はといえば、いまひとつの感がある。例えば、新聞資料に基づいた資料匯編のたぐいはいくつか出版されてはいるが、総合的な資料索引やデータベースは未だに出現していない。中国古典で文献の大半がデータベース化され、容易にアクセス・検索できるのと比較すると、その立ち後れは明白である。

かかる観点から、中国都市芸能研究会では、民国時期の演劇関連文献資料の収集およびデジタルデータ化を進めている。本稿で報告する京劇上演データベースもその一環である。

以下、現在構築を進めている京劇上演データベースの目的と概要を紹介するとともに、試験的に作成した評価版データベースに基づき、その研究上の有効性や問題点、将来的な展望について論じたい。

1.データベースの構想

a)目的

我々が構築を進める京劇上演データベースは、何時・何処で・誰が・何を演じていたのかをデータベース化し、京劇の上演状況の検索および統計処理機能を提供するものである。現在作成中のプロトタイプは、Windows XP上でMicrosoft Access 2003を用いて作成しているが、将来的にはPostgreSQL等を用いて、オンラインデータベースとして公開する計画である。

このデータベースによって、ある特定の日や劇場において、誰が何を演じていたのかが容易に検索できるようになるので、劇団・劇場・俳優に関する演劇学研究に大きく寄与するのはもちろん、例えば文学作品のコンテクスト研究、人物の伝記的研究などにも幅広く活用できよう。

データベースの特色に、データ抽出条件を指定してさまざまなデータを抽出できることがある。たとえば、ある俳優がどのような演目を演じていたのか、ある演目が誰によって演じられてきたのか、さらにはある劇場がどのように使用されてきたのか、といった資料を切り出すことができるので、上演状況を通時的かつ計量的に把握できるようになる。また、特定の期間に絞って上演状況を検索・抽出することもできるので共時的な状況の把握に有用であるし、何より、演劇上演の実態を計量的に把握する途を開くものである。

以上のように、京劇上演データベースの構築は、京劇の歴史を、具体的かつ計量的に研究する基礎資料を提供するもので、完成の暁には研究の進展に大いに寄与するものと期待される。

b)収録データの範囲

京劇の上演に関する資料は、新聞・雑誌・専門書籍から骨董店で売られる戯目単まで、非常に膨大である。これらを全てデジタル化することは、もちろん不可能であり、データベースの対象となる地域・時間・資料を絞り込む必要がある。

まず、データの範囲であるが、京劇が急速に発展を遂げた民国時期の北京に絞ることとした。その上で、データベース化する資料として、『五十年来北平戯劇史材後編』<cstyle:注釈参照>[注1]<cstyle:> (以下『後編』)、および『順天時報』を選定した。

前者は、周明泰が編纂した清末から民国時期にかけての戯目単をまとめた資料である。ただし、前言によれば、主に新作劇初演時の戯目単を選んで収録したものであり、網羅的な資料ではない。後者は清末から1930年にかけて北京で発行された日本陸軍系新聞である。しかし、戯迷として知られた辻聴花が編集に参画しており、長期間にわたって演劇面が設けられている。本研究では、研究遂行の過程で『順天時報』に見える演劇資料の抽出作業を完了しているが、その資料から同紙演劇面に掲載された、掲載当日の演劇上演状況をまとめたコラム<cstyle:注釈参照>[注2]<cstyle:>を再抽出した。同紙には海報も掲載されるが、掲載状況にむらが多くまた海報の趣向をこらした組み版が効率的なデジタル化に適さないことから、今回は対象としなかった。

資料の電子化は、北京書同文数字化技術有限公司<cstyle:注釈参照>[注3]<cstyle:>に委託した。同社は、『四庫全書』・『四部叢刊』など豊富な文献デジタル化の経験を持ち、繁体字文献を効率的かつ安価にデジタル化することができる。具体的には、対象資料の日付・劇場・役者・演目など、専門的知識を有さなくともレイアウトだけで容易に判別可能な要素についてXML形式でマークアップしてもらい、そうして完成したXMLデータを我々が再度校正・整形した。

2.データベースの概要

a)RDBの採用

一口にデータベースといっても、さまざまな種類が存在する。一般にイメージされるデータベースというと、カード型データベースになるのではなかろうか。しかし、カード型はいうなれば表計算ソフトのスプレッドシートのようなもので、項目リストが積み重なった、二次元的な構造にすぎない。このため、レコードごとに掲載できる項目数は固定になる。住所録や資料目録のような単純なデータベースには向いているが、京劇上演データベースでは、複数の演目がそれぞれ異なる役者によって一回の公演の中で上演される、その全貌をデータベース化しなくてはならない。このような、内部に一対多の関係のデータを含むものは、カード型データベースでは処理しきれない。

そこで、京劇上演データベースの構築には、リレーショナルデータベース(RDB)を採用した。RDBとは、複数のテーブルを関連づけることで、柔軟なデータベース構造を実現するものである。技術的には既に枯れたものであるといえよう。現在構築中のプロトタイプには、Microsoft Access 2003を利用している。将来的には、PostgreSQLなどを利用して、オンラインデータベース化する計画である。

データベースにはもう一つ、XMLデータベースという形式がある。XMLデータベースでは、DTDでデータのツリー構造や要素の数・形式等を定義し、データソースはXMLテキストとなるので、RDBでは複数のテーブルの組み合わせで表現される階層構造を、一つのテキストデータに全て盛り込むことができるなど、技術的にはRDBよりも先進的なものである。京劇DBの元データはXMLテキストとして作成しているので、XMLデータベース化することも検討したが、作成時点では適当なフリーXMLデータベースソフトが見あたらず、データベースアプリケーションを構築する上で多大な手間がかかることが予測されたため、ひとまずRDB形式を採用した。この点は、適当なXMLデータベースソフトが登場した段階で再検討したい。

b)上演・演目・劇目の階層化

京劇上演資料のRDB化においては、上演と演目との関係を適切に処理しなくてはならない。

民国時期の京劇公演は、一般的に、昼過ぎに前座の上演が始まり、夜にかけてより名望の高い役者による中軸・圧軸へと進んでいく。全体は、一つの劇場で一つの劇団によって演じられるのが一般的であり、一回の上演と見なされる。圧軸などの、上演の中の一つのユニットでは、単一の劇目が演じられることが多いが、しかし中には複数の劇目が演じられていたり、通し狂言名を記さずに折子戯の名称を列挙するような例もしばしば見られる。

 

このため、京劇上演資料のデータベース化にあたっては、一回の上演全体と上演劇目に加えて、その中間にユニットという概念を導入し三階層に分けて処理する必要が生ずる。本DBではそれを仮に「演目」と名付け、上演・劇目とあわせて三種のテーブルを作成した。演目テーブルの実体は、上演テーブルのIDと上演テーブルのIDとを一対多関係で関連づけるもので、具体的なデータは含まれない。前ページの図は、上演テーブルから、関連する演目・劇目・役者のデータを表示させたところである。各テーブルの階層構造が見て取れよう。

このほか、連台本戯や記念公演など、複数の日に跨るシリーズ上演も想定されるが、それは、上演テーブルにメモフィールドを設けることで対応した。

テーブルのリレーションシップ

その他の劇場やデータソースなどのテーブルは、元のXMLテキストデータを加工し切り出すことで、それぞれのテーブルを作成し、他のテーブルと関連づけた。

c)役者名・劇目の処理

役者名と劇目を処理する上で問題となるのが、異称の処理である。上演資料の記述は、時に姓名、時に姓を省略した名のみと一定しないし、程艶秋と程硯秋、周信芳と麒麟童のように、同一人物が複数の呼称を有することも多い。誤字もしばしば見うけられる。データベースの利便性を考えると、一つの名称を指定するだけで、異称までも一括検索できることが望ましい。

この問題は、役者一人一人にID番号を付与し、そのIDと異称との対照テーブルを作成することで解決できる。本DBでは次ページのような異称テーブルを作成した。

この例では、人名ID:71の役者に五種類の異称が使われていることを表している。この人名IDと異称IDとを、劇目テーブル上で上演劇目と関連づけ、人名IDの指定による異称の一括検索を実現した。異称テーブルを介さずに検索すれば、ある特定の名称標記のみを抽出することもできる。

人名ID異称ID名称(全)
7177王幼泉
7178王又荃
7179王幼荃
7180王又全
7181王幼全

ところで、上の例では、「幼・又」、「泉・荃・全」がそれぞれ同じ発音であることから、正式な表記はいずれか一つであると思われる。また、姓を書かずに名前だけで記述されるケースでは同名の可能性を考慮して慎重に検討しなくてはならない。今回、人名の同定にはひとまず『後編』の索引を参照したが、異称問題については別途、周辺資料の詳細な調査・検討を通じて同定作業を進めていく必要がある。

劇目に関しては問題はより複雑である。劇目には、本戯(通し狂言)としての名称と折子の名称とがある。例えば、「大保国・探(嘆)皇陵・二進宮」が「大探(嘆)二」と略されたり「龍鳳閣」と称されたりするし、折子戯として「大保国」だけが上演されることもある。問題は、本戯と折子戯との関係が、かならずしもきれいなツリー構造にはならない、という点にある。

例えば、データには「空城計」と記されたり「空城計代(帶)斬謖」と記されたりする例があるが、どうも前者にも「斬馬謖」を含むものがあったようである。つまり、「空城計」というタイトルが、「失・空・斬」という本戯の名称、「空城計」という折子戯の名称など、複数の意味で使われていた可能性が高く、名称のみでは本戯・折子戯いずれの階層を示しているのか分からないのである。

この問題を完全に解決する方法は、まだ発見できていない。現在のところ、劇目テーブルに時代・ジャンル・物語全体の名称などのフィールドを追加し、一対一対応する別名の対照テーブル、多対多対応の関連劇目対照テーブルを作成することで一括検索に対応し、実用上の問題を緩和する方法を考えている。また、劇目テーブルに、文戯・武戯・流派などの情報を付加することで、より多彩な検索も可能になろう。

3.展望と課題

a)評価版による分析

現在、Access 2003で作成した評価版データベースには、『後編』のデータのみが収録されている。それをもとに、いくつかの劇目・役者について統計を取った結果をいくつか紹介する。『後編』のデータは網羅的ではないし、劇目の一括処理テーブルも未完成であるので、あくまでデータベースの有効性検証のためのサンプルに過ぎないことを、お断りしておく。

まず、上演回数上位七劇目である。数値は、1910年より、五年ごとののべ上演回数である。

上演劇目合計10前10後20前20後30前
砂痣8293522115
艷陽樓80101730211
泗州城7441824217
脂虎70513172510
取金陵6361321203
馬上緣624282433
草橋關6161517202

これらのうち、現在でもかろうじて演じられているのは「艶陽楼」くらいではなかろうか。第一位の「砂痣」は、現在ではまず演じられることがない。

次に役者ごとの上演回数。

合計10前10後20前20後30前
高慶奎27221125594423
楊小樓2532410191288
朱桂芳2432011050584
郝壽臣2391438788127
九陣風2382250884434
梅蘭芳2263111849215
王鳳卿2202610961185

四大老生・四大名旦が意外と少ないが、役者としての評価と上演頻度とは必ずしも一致するものではないのかもしれない。あるいは、新作劇の初演時の戯目単を中心に収録するという『後編』の編纂方針の反映と見るべきであろうか。

梅蘭芳と楊小楼の上演回数上位七劇目。

楊小楼梅蘭芳
上演劇目回数上演劇目回数
連環套15金山寺7
戰宛城11醉酒7
落馬湖9天河配5
安天會7天女散花5
長坂坡7汾河灣5
艷陽樓7鄧霞姑5
𧈢蜡廟6奇雙會4

前の表に見える彼らの総上演回数にくらべて、いずれの劇目も上演回数が非常に少ない。また、彼らの上演劇目の総数はそれぞれ140・106であり、劇目の同一視処理を行っていないため重複が含まれ可能性があるとはいえ、旧時の俳優のレパートリーの広さがうかがい知れる。「<ct:Regular><cf:Simsun \(Founder Extended\)>𧈢蜡<ct:><cf:>廟」「天河配」という応節戯が入っているのも面白い。

もとよりデータの網羅性には問題のある『後編』ではあるが、しかし以上のごく簡単な統計結果からも、現在とは相当に異なる民国時期の京劇舞台の様子をうかがい知ることができる。京劇データベースの演劇研究における有効性は、明らかである。

b)収録データの量・分野の拡充

現在、データベースの典拠に用いている『後編』および『順天時報』は、一定の分量を持つものではあるが、しかしそれでもデータ量はまだまだ足りない。前述のように、『後編』は網羅的な資料ではないし、『順天時報』も圧軸相当の演目と各二三人の主要役者しか掲載しないため、共演者や劇団などの情報が十分に得られない。また、1930年代以降のデータも含まれない。このため、今後は収録データの質的充実と、収録年代の拡大をはかっていく必要がある。

コレクションブームに沸く中国では、骨董・古銭・切手などばかりでなく、文革グッズなどまでが蒐集の対照となっている。当然、京劇の戯目単も重要なコレクションの一つとなっている。潘家園などの骨董市では解放前のものも売られているが、しかし我々日本人からしても購入が少々ためらわれるほど高くなっている。

そのような世相を反映したのか、いくつかの戯目単の影印が出版された。たとえば、『旧京老戯単』<cstyle:注釈参照>[注4]<cstyle:>や、首都図書館の館蔵の戯目単を影印した『首都図書館蔵旧京戯報』<cstyle:注釈参照>[注5]<cstyle:>などがある。これらの資料は、京劇データベースの内容を拡充する有力なデータソースとなろう。

収録地域の拡大が、もう一つの課題である。中国全土をカバーするのは非常に難しいが、しかし、京劇の一方の中心地であった上海、そして天津における上演状況は、是非ともデータベースに取り込んでいきたいところである。

また、『順天時報』以後の北京の新聞における演劇記事の掲載状況については、戸部氏の詳細な調査報告がある<cstyle:注釈参照>[注6]<cstyle:>。それらの新聞資料からの演劇関連記事の抽出・整理作業を行うことで、データベースのカバーする時期を文革前にまで拡大することが可能になると思われる。

c)関連データベースの構築

現在作成しているデータベースは評価版であるため、多くのテーブルが作成途上である。例えば、劇場や劇団については、上演IDとの関連づけテーブルは作成されているものの、劇場や劇団の情報を登録するテーブルはまだ作成していない。役者・劇目の同一視・関連づけテーブルとともに、これらのデータテーブルの作成および充実が、まず第一の課題である。

しかし、これらの情報は、京劇データベースが基づいた資料からは得られないものである。従って、別途情報を収集する必要がある。最も簡便な方法は、著作権の切れた京劇概説書・辞典の類を電子テキスト化し、必要なデータを切り出すやり方である。今後、そのような書籍を選定し、データテーブルの充実を図りたい。また、京劇関連の書籍を広くテキストデータベース化し、上演データベースと伝記資料・台本資料・用語解説などとをリンクさせることで、京劇総合データベースへの発展の途も開けよう。

d)オープンデータベースとしての拡張

ところで、我々は現在、過去の上演状況の把握に苦労をしているが、しかしながら、将来の研究者のために現在の上演状況を記録・蓄積する努力を行っているかと言えば、はなはだ心許ない。中国にいくつかある伝統劇サイトも、ニュースなどのドキュメント、写真・音声・動画などの収集には熱心であるが、しかし、上演記録や劇評などの蓄積は、ほとんどなされていない。

映画においては、例えばIMDb<cstyle:注釈参照>[注7]<cstyle:>のようなデータベースがあり、基本的にはエンターテイメントを目的としているが、映画・俳優の詳細、さらには売り上げや批評などの膨大なデータの蓄積は、学術的な使用にも十分耐えうるものであるし、なによりこのようなデータを同時代的に集積していくシステムは非常に素晴らしいものである。

中国伝統劇に関しても、同種のデータベースが構築できないものだろうか。しかし、これは日本に住む我々にとっては、現実的に困難な課題でもあり、現地の研究機関や個人との協力が不可欠である。将来、京劇上演データベースをWWW上に公開し、だれもがデータを登録できるオープンデータベースとして運用すれば、そのような活動の拠点として利用することも可能になろう。

理想的な学術データベースとは、構築の過程で教育・研究効果が得られ、作成されたデータベースからは従来にない新たな知見が得られ、かつコラボレーションの拠点として利用しうるものであると、筆者は考えている。京劇データベースが、そのような理想的な学術データベースとして完成できるよう、今後とも努力を重ねていく所存である。