『都市芸研』第三輯/京劇上演データベース構築のパースペクティブ

Top / 『都市芸研』第三輯 / 京劇上演データベース構築のパースペクティブ

京劇上演データベース構築のパースペクティブ

千田 大介

はじめに

近年の中国伝統演劇研究は、社会学や文化人類学的な方法論・視点を導入し、演劇をとりまく社会環境を重視することで、従来の審美学的な上演技術論や批評の枠にとどまらない、多様な研究成果を生み出している。

しかしその一方で、それらの研究をささえるべき研究資料の整理状況はといえば、いまひとつの感がある。例えば、新聞資料に基づいた資料匯編のたぐいはいくつか出版されてはいるが、総合的な資料索引やデータベースは未だに出現していない。中国古典で文献の大半がデータベース化され、容易にアクセス・検索できるのと比較すると、その立ち後れは明白である。

かかる観点から、中国都市芸能研究会では、民国時期の演劇関連文献資料の収集およびデジタルデータ化を進めている。本稿で報告する京劇上演データベースもその一環である。

以下、現在構築を進めている京劇上演データベースの目的や概要を紹介するとともに、試験的に作成した評価版データベースについて、その研究上の有効性や問題点、将来的な展望について論じたい。

1.データベースの構想

a) 目的

我々が構築を進める京劇上演データベースは、何時・何処で・誰が・何を演じていたのかをデータベース化し、京劇の上演状況の検索および統計処理機能を提供するものである。現在作成中のプロトタイプは、Windows XP上でMicrosoft Access 2003を用いて作成しているが、将来的にはPostgreSQL等を用いて、オンラインデータベースとして公開する計画である。

このデータベースによって、ある特定の日や劇場において、誰が何を演じていたのかが容易に検索できるようになるので、劇団・劇場・俳優に関する演劇学研究に大きく寄与するのはもちろん、例えば文学作品のコンテクスト研究、人物の伝記的研究などにも幅広く活用できよう。

データベースの特色に、データ抽出条件を指定してさまざまなデータを抽出できることがある。たとえば、ある俳優がどのような演目を演じていたのか、ある演目が誰によって演じられてきたのか、さらにはある劇場がどのように使用されてきたのか、といった資料を切り出すことができるので、上演状況を通時的かつ計量的に把握できるようになる。また、特定の期間に絞って上演状況を検索・抽出することもできるので、共時的状況の把握にも有用である。

以上のように、京劇上演データベースの構築は、京劇の歴史を、具体的かつ計量的に研究する基礎資料を提供するもので、研究の進展に大いに寄与するものと期待される。

b) 収録データの範囲

京劇の上演に関する資料は、新聞・雑誌・専門書籍から骨董店で売られる戯目単まで、非常に膨大である。これらを全てデジタル化することは、もちろん不可能であり、データベースの対照となる地域・時間・資料を絞り込む必要がある。

まず、データの範囲であるが、京劇が急速に発展を遂げた民国時期の北京に絞ることとした。その上で、データベース化する資料として、『五十年来北平戯劇史材後編』*1 (以下『後編』)、および『順天時報』を選定した。

前者は、周明泰による清末から民国時期にかけての戯目単をまとめた資料である。ただし、前言に見えるように、主に新作劇初演時の戯目単を選んで収録したもので、網羅的な資料ではない。後者は清末から1931年にかけて北京で発行された日本陸軍系新聞である。しかし、戯迷として知られた辻聴花が編集に参画しており、長期間にわたって演劇面が設けられている。中国都市芸能研究会では、科学研究費による研究プロジェクト*2 を通じて、『順天時報』に見える演劇資料の抽出作業を完了しているが、その資料から、同紙演劇面に掲載された当日の演劇上演状況をまとめたコラム*3を再抽出した。同紙には海報も掲載されるが、掲載状況にはむらがおおいこと、また海報の趣向をこらした組み版が効率的なデジタル化に適さないことから、今回は対象としなかった。

資料の電子化は、北京書同文数字化技術有限公司*4 に委託した。同社は、『四庫全書』・『四部叢刊』など豊富な文献デジタル化の経験を持ち、繁体字文献をも効率的かつ安価にデジタル化することができる。具体的には、対象資料の日付・劇場・役者・演目など、専門的知識を有さなくても、レイアウトから容易に判別可能な部分をXML形式でマークアップしてもらい、そうして完成したXMLデータを我々が再度校正・整形した。

2.データベースの概要

a) RDBの採用

一口にデータベースといっても、さまざまな種類が存在する。一般にイメージされるデータベースというと、カード型データベースになるのではなかろうか。しかし、カード型はいうなれば表計算ソフトのスプレッドシートのようなもので、項目リストが積み重なった、二次元的な構造にすぎない。このため、レコードごとに掲載できる項目数は固定になる。住所録や資料目録のような単純なデータベースには向いているが、京劇上演データベースでは、一回の公演で、複数の演目が、それぞれ異なる役者によって上演される、その全貌をデータベース化しなくてはならない。このような、内部に一対多の関係のデータを含むものは、カード型データベースでは処理しきれない。

そこで、京劇上演データベースの構築には、リレーショナルデータベース(RDB)を採用した。RDBとは、複数のテーブルを関連づけることで、柔軟なデータベース構造を実現するものである。技術的には既に枯れたものであるといえよう。現在構築中のプロトタイプには、Microsoft Access 2003を利用している。将来的には、PostgreSQLなどを利用して、オンラインデータベース化する計画である。

データベースにはもう一つ、XMLデータベースという形式がある。XMLデータベースでは、DTDでデータのツリー構造や要素の数・形式等を定義し、データソースはXMLテキストとなるので、RDBでは複数のテーブルの組み合わせで表現される階層構造を、一つのテキストデータに全て盛り込むことができるなど、技術的にはRDBよりも優れた点が多い。京劇DBの元データはXMLテキストとして作成しているので、本来ならばXMLデータベースとして作成するのが妥当である。しかし、執筆時点では、無償もしくは安価なXMLデータベースソフトが存在せず、データベースアプリケーションを独自に作成しなくてはならないという大きな問題があるため、ひとまずRDB形式を採用した。問題を解決する目途がついた暁には、XMLデータベースに改めることも十分にあり得る。

b) 上演・演目・劇目の階層化

京劇上演資料のRDB化において、最も難しいのが、上演と劇目との関係をどう処理するのか、という問題である。

民国時期の京劇公演は、一般的に、昼過ぎに前座の上演が始まり、夜にかけてより名望の高い役者による中軸・圧軸と進んでいく。全体は、一つの劇場で一つの劇団によって演じられるのが一般的であり、一回の上演と見なされる。圧軸などの、上演の中の一つのユニットでは、単一の劇目が演じられることが多いが、しかし中には複数の劇目が演じられていたり、通し狂言名を記さずに折子戯の名称を列挙するような例もしばしば見られる。

このため、京劇上演資料のデータベース化にあたっては、一日の上演活動全般と、上演劇目に加えて、中間的なユニットの概念が必要になる。本DBではそれを仮に「演目」と名付け、上演・劇目と合わせて三種のテーブルを作成した。演目テーブルの実体は、上演テーブルのIDと上演テーブルのIDとを一対多の関係で関連づけるためのもので、文字データは含まれない。図は、上演テーブルから、関連する演目・劇目・役者のデータを表示させたところである。

 

このほか、連台本戯や記念公演など、複数の日に跨るシリーズ上演も想定されるが、それは、上演テーブルにメモフィールドを設けることで対応した。

それらに加えて、劇場やデータソースなどのテーブルを、元のXMLテキストデータを加工し切り出すことで、各テーブルのデータを作成し、それぞれのテーブルを関連づけた。

 

c) 役者名・劇目の処理

役者名と劇目を処理する上で問題となるのが、異名の処理である。

上演資料の記述は、時に姓名、時に名のみと一定しないし、程艶秋と程硯秋、周信芳と麒麟童のように、同一人物が複数の呼称を有することも多い。誤字もしばしば見うけられる。しかし、データベースの利用を考えると、一つの名称を指定するだけで、異称までも一括検索できることが望ましい。

この問題は、役者一人一人にID番号を付与し、そのIDと異称との対照テーブルを作成することで解決できる。本DBでは以下の例のような異称テーブルを作成した。

異称ID人名ID名称(全)
7771王幼泉
7871王又荃
7971王幼荃
8071王又全
8171王幼全

ID:71の役者が五種類の異称を持っていることがわかる。この人名IDと異称IDとを、劇目テーブルで上演劇目と関連づけることで、人名IDの指定による異称の一括検索が実現される。異称テーブルを利用しないで検索すれば、ある特定の名称標記のみを検索することもできる。

ところで、上記例では、「幼・又」、「泉・荃・全」がそれぞれ同じ発音であることから、正式な記述はいずれか一つであることが予測される。同一人物であるとの認定には、ひとまず『後編』の索引を参照したが、その妥当性も検証する必要があろう。また、名前だけで記述されている場合など、同名の可能性も考慮しなくてはならない。これらは、京劇DBの基づく資料だけからは解決できない問題であり、別途考証が必要となる。

劇目に関しては、問題はより複雑である。劇目には、通し狂言としての名称、折子の名称とがある。例えば、「大保国・探(嘆)皇陵・二進宮」が「大探(嘆)二」と略されたり「龍鳳閣」と称されたりするし、折子戯として「大保国」だけが上演されることもある。問題は、通し狂言と折子戯との関係が、かならずしもきれいなツリー構造にはならない、という点にある。

例えば、データには「空城計」と記されたり「空城計代(帶)斬謖」と記されたりする例があるが、どうも前者にも「斬馬謖」を含むものがあったようである。つまり、「空城計」というタイトルが、「失・空・斬」という通し狂言の名称、「空城計」という折子戯の名称、二つの意味で使われていた可能性が高く、単純なツリー構造が描けないのである。

この問題を完全に解決する方法は、まだ発見できていない。現在のところは、劇目テーブルに、時代・ジャンル・物語全体の名称などのフィールドを追加し、一対一対応する別名の対照テーブル、多対多対応の関連劇目対照テーブルを作成することで、実用上の問題を緩和する方法を考えている。また、劇目テーブルに、文戯・武戯・流派などの情報を付加することで、より多彩な検索も可能になろう。

3.展望と課題

a) 評価版による分析

現在、Access 2003で作成した評価版データベースには、『後編』のデータのみが収録されている。それをもとに、いくつかの劇目・役者について統計を取った結果をいくつか紹介する。『後編』のデータは網羅的ではないし、劇目の一括処理テーブルも未完成であるので、あくまでデータベースの有効性検証のためのサンプルに過ぎないことを、お断りしておく。

まず、上演回数上位七劇目である。数値は、1910年より、五年ごとののべ上演回数である。

上演劇目合計10前10後20前20後30前
硃砂痣8293522115
艷陽樓80101730211
泗州城7441824217
胭脂虎70513172510
取金陵6361321203
馬上緣624282433
草橋關6161517202

これらのうち、現在でもかろうじて演じられているのは「艶陽楼」くらいではなかろうか。第一位の「硃砂痣」は、現在ではまず演じられることがない。

次に役者の上演回数。

合計10前10後20前20後30前
高慶奎27221125594423
楊小樓2532410191288
朱桂芳2432011050584
郝壽臣2391438788127
九陣風2382250884434
梅蘭芳2263111849215
王鳳卿2202610961185

四大老生・四大名旦が意外と少ないが、役者としての評価と上演頻度とは必ずしも一致するものではないのかもしれない。あるいは、新作劇の初演時の戯目単を中心に収録するという『後編』の編纂方針の反映と見るべきかもしれない。

梅蘭芳と楊小楼の上演回数上位七劇目。

楊小楼梅蘭芳
上演劇目回数上演劇目回数
連環套15金山寺7
戰宛城11醉酒7
落馬湖9天河配5
安天會7天女散花5
長坂坡7汾河灣5
艷陽樓7鄧霞姑5
𧈢蜡廟6奇雙會4

いずれも、前の表の総上演回数にくらべて非常に数が少ない。それぞれの上演劇目の総数は、140・106であり、この数字は劇目の同一視処理を行っていないために重複が含まれるとはいえ、旧時の役者のレパートリーの広さがうかがい知れる。また「𧈢蜡廟」「天河配」という応節戯が入っているのも面白い。

もとよりデータの網羅性には問題のある『後編』ではあるが、しかし以上のごく簡単な統計結果からも、現在とは相当に異なる民国時期の京劇舞台の様子をうかがい知ることができる。京劇データベースの演劇研究における有効性は、明らかである。

b) 収録データの量・分野の拡充

現在、データベースの典拠に用いている『後編』および『順天時報』は、一定の分量を持つものではあるが、しかしそれでもデータ量はまだまだ足りない。前述のように、『後編』は網羅的な資料ではないし、『順天時報』も圧軸相当の演目と各二三人の主要役者しか掲載しないため、競演人物や劇団などの情報が十分に得られない。また、1930年代以降のデータも含まれない。このため、今後は収録データの質的充実と、収録年代の拡大をはかっていく必要がある。

コレクションブームに沸く中国では、骨董・古銭・切手などばかりでなく、文革グッズなどまでが蒐集の対照となっている。当然、京劇の戯目単も重要なコレクションの一つとなっている。潘家園などの骨董市では解放前のものも売られているが、しかし我々日本人からしても購入が少々ためらわれるほど高くなっている。

そのような世相を反映したのか、いくつかの戯目単の影印が出版された。第一は『旧京老戯単』また、首都図書館でも館蔵の戯目単を網羅的に影印した図版の出版を予定している *5 。これらの資料は、京劇データベースの内容を拡充する有力なデータソースとなろう。

収録地域の拡大が、もう一つの課題である。中国全土をカバーするのは非常に難しいが、しかし、京劇の一方の中心地であった上海、そして天津における上演状況は、是非ともデータベースに取り込んでいきたいところである。

また、『順天時報』以後の北京の新聞における演劇記事の掲載状況については、本誌第二輯において戸部氏が報告している*6 。それらの新聞資料からの演劇関連記事の抽出・整理作業を行うことで、データベースのカバーする時期を文革前にまで拡大することが可能になると思われる。

c) 関連データベースの構築

現在作成しているデータベースは評価版であるため、多くのテーブルが作成途上である。例えば、劇場や劇団については、上演IDとの関連づけテーブルは作成されているものの、劇場や劇団の情報を登録するテーブルがまだ作成していない。役者・劇目の同一視・関連づけテーブルとともに、これらのデータテーブルの作成および充実が、まず第一の課題である。

しかし、これらの情報は、京劇データベースが基づいた資料からは得られないものである。従って、別途情報を収集する必要がある。最も簡便な方法は、著作権の切れた京劇概説書・辞典の類を電子テキスト化し、必要なデータを切り出すやり方である。今後、そのような書籍を選定し、データテーブルの充実を図りたい。また、京劇関連の書籍を広くテキストデータベース化し、上演データベースと伝記資料・台本資料・用語解説などとをリンクさせることで、京劇総合データベースへの発展の途も開けよう。

d) オープンデータベースとしての拡張

ところで、我々は現在、過去の上演状況の把握に苦労をしているが、しかしながら、将来の研究者のために現在の上演状況を記録・蓄積する努力をおこなっているかと言えば、はなはだ心許ない。中国にいくつかある伝統劇サイトも、ニュースなどのドキュメント、写真・音声・動画などの収集には熱心であるが、しかし、上演記録や劇評などの蓄積は、ほとんどなされていない。

映画においては、例えばIMDb*7 のようなデータベースがあり、基本的にはエンターテイメントを目的としているが、映画・俳優の詳細、さらには売り上げや批評などの膨大なデータの蓄積は、学術的な使用にも十分耐えうるものであるし、なによりこのようなデータを同時代的に集積していくシステムは非常に素晴らしいものである。

中国伝統劇に関しても、同種のデータベースが構築できないものだろうか。しかし、これは日本に住む我々にとっては、現実的に困難な課題でもあり、現地の研究機関や個人との協力が不可欠である。将来、京劇上演データベースをWWW上に公開し、だれもがデータを登録できるオープンデータベースとして運用すれば、そのような活動の拠点として利用することも可能になろう。

理想的な学術データベースとは、構築の過程で教育・研究効果が得られ、作成されたデータベースからは従来にない新たな知見が得られ、かつコラボレーションの拠点として利用しうるものであると、筆者は考えている。京劇データベースが、そのような理想的な学術データベースとして完成できるよう、今後とも努力を重ねていく所存である。


  • 本稿は、日本学術振興会科学研究費・基盤研究B「近代北方中国の芸能に関する総合的研究――京劇と皮影戯をめぐって――」(平成14~16年度・課題番号14310204)による成果の一部である。

*1 匯文閣書店、1932。台湾広文書局本の影印本を用いた。
*2 「近代北方中国の芸能に関する総合的研究-京劇と皮影戯をめぐって-」2002~2004年度文部科学省補助金(基礎研究(B)(1)・課題番号14310204)
*3 1915.8.18~16.4.4は「梨園歌舞」とのタイトルで、主要劇場の上演演目・役者を掲載する。1917.12.7~18.1.11は、コラムのタイトルはなく、各劇場の当日(一部数日後)の上演演目・役者を掲載する。このうち1917.12前半は広和楼のみを、後半から吉祥戯院・広徳楼なども掲載する。1918.1.12以降は「舞台大観」のタイトルで、主要劇場の演目・役者を掲載する。
*4 http://www.unihan.com.cn/
*5 2003年12月刊行予定であったが、執筆時点ではまだ刊行されていない。
*6 「慶應義塾図書館所蔵民国時期北京新聞資料紹介」
*7 The Internet Movie Database。http://us.imdb.com/