小木曽智信氏(人間文化研究機構国立国語研究所言語資源研究系)「古典のコーパス化とその可能性」(人文情報学月報 / Digital Humanities Monthly)

人文情報学月報 / Digital Humanities Monthlyの第35号【前編】に、《巻頭言》古典のコーパス化とその可能性 (小木曽智信:人間文化研究機構国立国語研究所言語資源研究系)、が掲載されています。
【 私は、国立国語研究所で日本語コーパスを作る仕事に取り組んでいる。コーパスとは大規模に蓄えられた言語資料のことである。文章が集められた大量のテキストデータという程度に考えられる場合もあるが、言語研究の分野では、特に言語研究を目的として設計されそのための情報を付与されたものを指す。2011年に1億語の『現代日本語書き言葉均衡コーパス』を公開した後、現在は日本語の歴史を研究できるコーパスとして『日本語歴史コーパス』の構築を進めている。】
つづきはこちらから。人文情報学月報。
http://www.dhii.jp/DHM/dhm35-1

『日本語歴史コーパス 平安時代編』
https://maro.ninjal.ac.jp/login
なお、メールマガジン・人文情報学月報 は以下のサイトで無料購読可能です。
http://www.mag2.com/m/0001316391.html