- きょういくじん会議
5月28日、現代日本語の書き言葉を集める『現代日本語書き言葉均衡コーパス』のデモ版が公開された。
【明子】国立国語研究所から日本語コーパスのデモ版が発表されたらしいわね。授業に使えそうかどうか、さっそく見てみようかしら。
【治子】 こ~ぱすってなに? ちょっとよくわからないんだけど……。
【明子】日本語コーパスっていうのはね、大ざっぱに言うと日本語研究のために大量に集められた例文のデータベースのことなの。
【治子】……、よけいわかんなくなっちゃった。
【明子】う~ん。たとえば、最近話題の「読解力」っていう言葉があるでしょ。これをコーパスで検索すると、「読解力」が過去においてどんな文脈・文献で使われているか、という情報がたくさんヒットするの。「読解力」がいつ頃から使われ始めたか、ということも一目瞭然よ。
【治子】へぇー。なんとなくわかってきた。膨大な情報がつまってるんだね。
【明子】ためしに、デモ版を使ってみるわね。……、「読解力」っと。……、あ、出てきた出てきた。えっ、PISA2000調査の結果が出たときの文部科学白書(2002年)が一番古い!
【治子】けっこう新しい言葉なんだね。
【明子】デモ版だから全て網羅されているわけじゃないわ。今回のデモ版で公開されているのは
政府刊行の白書から無作為抽出した500万語、および、「Yahoo!知恵袋」データから無作為抽出した500万語の合計1000万語
という「書き言葉」に関するものなんだって。少なくとも白書の中では「読解力」は比較的新しい言葉ってことね。このコーパスも今後さまざな文献を収録して整備していくらしいわ。
【治子】それはわかったんだけど、これが授業とどう関係するの?
【明子】基本的には国語科よね。たとえば、漢字指導に役立てるために多くの文例を引けるとか、作文を書かせるときとか語彙力をつけたいときに使えそう、かしら。国語科教育への運用研究はまだまだこれからのようね。
【治子】そういえば、コーパスとは違うけど、「シソーラス(分類語彙表、類義語辞典)」を使った授業実践は行われて語彙力アップに効果を上げている、って聞いたことがあるような……。
【明子】そう! 現代の子どもたちは語彙が少ないと言われているみたいだから、これまで日本で蓄積されてきた英知を活用していく道を模索するのも一つの手なのかもしれないわ。
【治子】だんだん利用できる教材が増えるのもいいけど、使いやすく整理してほしいかも。
・・・・・・・・・・
ということで、日本語コーパスについてご紹介してみました。
日本語コーパスの整備には著作権問題などいろいろと絡んで大変なようですが、今後を期待していいのかどうか、見守っていきたいところです。