第107回CH研究発表会

第107回人文科学とコンピュータ研究発表会

標記の研究発表会はペーパレスで行います(貸し出し用のUSBメモリもご用意しています)。
  • 研究会に登録されている方
    研究報告は開催初日の1週間前(=公知日)に電子図書館当日用サイト(登録会員用)で公開します。

  • 研究会に登録されていない方
    当日受付で資料閲覧用のアカウント情報(URL,ID,PW)をお渡しいたします。
    尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては 研究会に登録する」のページをご参照ください。

開催案内

◆第107回 人文科学とコンピュータ研究会発表会
主査:  松村敦
幹事:  亀田尭宙、鹿内菜穂、土山玄、山田太造

会場情報
日時 2015年8月9日(日)
会場  奈良大学 A棟 A-130(奈良県奈良市山陵町1500)

懇親会
時間:終了直後
会場:奈良大学近辺
予算:4500円程度(学生割引あり)

募集内容と締切
(1)募集内容
申し込みは締め切りました
一般口頭発表 合計 8件〜10件
(今回もロング形式[通常の発表]に加えてショート形式を追加します。)

ショート:15〜20分程度の持ち時間(質疑を含む)
ロング:20分〜25分程度の持ち時間(質疑を含む)
(※ロング/ショートでも2p〜8pの予稿は必要となります。[この範囲であれば枚数
は自由です])

参加費(聴講)
研究会登録会員:無料
学会正会員:1500円
学会会員学生:500円
学会非会員学生:1000円
非会員:2500円
  詳しい情報は下記URLをご覧ください.
  http://www.ipsj.or.jp/kenkyukai/sanka.html


【プログラム】

[10:00-10:05]
開会の挨拶

[10:05-10:25]
(01) 明治以降の「旧暦」のデータベース化
〇関野 樹(総合地球環境学研究所)

日本では、明治6年の改暦以降もそれまで用いられてきた太陰太陽暦が「旧 暦」 として祭礼、易学、年中行事、日常生活などの各所を利用されている。 本研究で は、この「旧暦」を明治の改暦から現代に至るまでの全ての期間に ついて当時の 資料を使って再現し、そのデータを日付文字列の解析機能を有 するデー タベー スに統合することで、他の暦との相互変換を行う仕組みを 構 築した。当該データ ベースはWeb上で利用可能である (http://www.hutime.jp/)。

[10:25-10:50]
(02) 漢字の包摂粒度の符号化に関する諸問題について
〇守岡 知彦(京都大学)

    漢字を含む電子テキストをアーカイブする場合、符号化 文字の指示対象 を 明確にすることが重要である。漢字に おいて符号位置の包摂範囲を確定 す るの は包摂規準の役 割であるが、さまざまな漢字文献を対象とした場 合、汎 用符号 化文字集合が想定する包摂規準だけでは不十分な 場合があ り、複数の 包摂規準 を混在した文字処理が必要 な場合がある。ここでは、 こうした場合 の課題や適 切な 情報の記述や処理の可能性について議論した い。

[10:50-11:00]
休憩

[11:00-11:25]
(03) 「デジタル・アーカイブ」の利活用可能性を高めるために
 —仏典画像統合検索APIの構築を通じて
〇永崎 研宣(一般財団法人人文情報学研究所)

近年、「デジタル・アーカイブ」はこれまでにない注目を浴びるようになり つ つ ある。色々な観点からの「デジタル・アーカイブ」が議論され公開さ れる ように なってきているが、多くは画像をWebに公開してメタデータをつ けると いうこと を指しているようである。画像とメタデータを公開するタ イプの 「デ ジタル・ アーカイブ」は、必ずしも利活用が容易であるとは限 らないよ うに思われること が多々ある。筆者は近年、国内外の「デジタ ル・アーカイ ブ」 における仏典画 像のURLを収集し、擬似的に検索可能な システムを構築 し、さらに改良と収集を 続けている。本発表では、このシ ステム構築の実践 を 通じ、「デジタル・アー カイブ」利活用可能性を高め るための方策につい て検討する。

[11:25-11:50]
(04) 異文化交流、歴史評価へのマトリックス履歴書の適用
〇大野 邦夫(株式会社モナビITコンサルティング)
 西口 美津子(福島工業高等専門学校)

起業家人材育成のために活用してきたマトリックス履歴書を、異文化交流や そ の 関連の歴史の評価に活用することを試みた。日本と西洋の歴史的関係 とし てキリ スタン伝来、明治維新、戦後の民主化の3つの時期について取り 上げ、 その類似 性の評価にマトリックス履歴書の適用を試みた結果、きあ なりの類 似性 が存在 することが判明した。さらに共通のパターンを明確化 することに より、異文化交 流と歴史評価へのマトリックス履歴書の可能性 を検討した。

[11:50-13:00]
お昼休憩

[13:00-13:25]
(05) 外国人日本語学習者の発音能力を測定するシステムの開発
〇高橋 恵利子(目白大学)
 畑佐 由紀子(広島大学)
 山元 啓史(東京工業大学)
 前川 眞一(東京工業大学)
 畑佐 一味(パデュー大学)

本研究の目的は,外国人日本語学習者の発音能力を簡易に診断するシステム を 開 発することである.その目的を達成するためにはさまざまな問題があ る が,本稿 では音声データの収集形式の問題と評価者の問題を取り上げ る.音 声データの収 集方法としては,短文を読み上げ,それを録音する方 法(読み 上げ課 題)と, 同じ短文をあらかじめ録音したものを聞いて発音 したものを 録音する方法(リ ピート課題)の2つを検討する.録音の評価 者は,全員日 本語母 語話者(日本 語教師,日本語教育未経験者)とし,こ れらの条件 で,6名(母語話者2名,ほ ぼネイティブ水準の発音技能を持 つ者2名,顕 著な外国人 訛りを持つ者2名) の音声提供者の録音資料を用 い,一対比較法 による評価実験を行った.実験の結 果,データの収集方法 については,いず れの方法に よっても0.86以上の相関係 数が得られたが, リピート課題(0.86 以上)よりも読み上げ課題(0.92以上)の 方が,若干 高かった.これによ り,今後のシステム設計計画では,一般の母語 話者を 評価者とし,あらかじ め音声材料を準備する必要のない読み上げ課題によ るデータ収集方式を採用 することにした.

[13:25-13:50]
(06) 小袖屏風を対象とした知的構造の抽出に関する研究
〇濱上 知樹(横浜国立大学大学院工学研究院)
 澤田 和人(国立歴史民俗博物館情報資料研究系)

本研究では歴史資料デジタルアーカイブデータに機械学習・セマンティック デー タ処理を試みることで,デジタルアーカイブデータからの新たな知的構 造を抽出 することをめざしている。特に本稿では,国立歴史民俗博物館との 共同研究のも と,小袖屏風を対象にした知的構造の抽出と知的デジタルアー カイブの 研究事 例について,ディープラーニングを用いたモチーフの分類 手 法について紹介をする。

 [13:50-14:00]
休憩

[14:00-14:20]
(07) 文学作品の計量分析:その方法と歴史
〇土山 玄(同志社大学研究開発推進機構)

文学作品の計量分析は主に計量文献学と称される。文学作品を対象に計量的 に ア プローチするという点で、計量文献学は最近の学問のようにも思われ る が、実の ところ、計量文献学に関連した研究の歴史は長く、19世紀にま でさ かのぼる。草 創期にはプラトンの著作やシェイクスピアの戯曲が研究 対象と なり、 著者の識 別や執筆順序の推定を目的とし分析がなされた。本 発表で は、このような代表的 な研究事例を採り上げ、計量文献学の歴史と その研究 方法を概 観する。

[14:20-14:40]
(08) データに基づいた「花日記」の代作問題検証
〇孫 昊(同志社大学文化情報学研究科)
 李 鍾賛(同志社大学文化情報学部外国人研究員)
 金 明哲(同志社大学文化情報学部)

日本初のノーベル文学賞を受賞した川端康成にまつわる数多くの代作問題が あ り、その一つは「花日記」である。「花日記」は新潮社1981年版の川端全 集第 20巻に収録されているが、本作は当時川端康成を師事した主婦作家・中 里恒子 の 代作だという説がある。本研究は文章から抽出した読点の打ち 方、タ グの Bigram、文節パターン特徴量を基に、統合的分類アルゴリズム を始めとする分 析 手法を用いて分析した。

[14:40-14:50]
休憩

[14:50-16:50] チュートリアル
(09) フリーソフトウェア「KH Coder」による計量テキスト分析
——手軽なマウス操作による分析からプラグイン作成まで
〇樋口 耕一(立命館大学産業社会学部)

実際の操作も含めてのチュートリアルになりますので、ノートPCのご持参を お 勧 めします。
Windowsの場合は事前の準備は不用ですが、LinuxやMacの場合には事前に KH Coder をインストールの上、ご参加ください。事前登録は不要です。
なお、会場は無線LANの環境がございませんので、事前のインストールを推奨 い たします。

http://khc.sourceforge.net/

    KH Coderとは、計量テキスト分析(テキストマイニング)のためのフ リー ソフトウェアである。内部では茶筌・MeCab・Stanford POS Taggerのほ か、 MySQLやRを利用しており、これらのツールの機能を統合するためにPerl を使用 し ている。 本チュートリアルセッションでは第一に、計量テキスト 分析の考 え 方、すなわちKH Coderの フィロソフィーを紹介する。具体的な 分析事例を 通じ て、社会学の分野で伝統的に利用されてきた 内容分析 (content analysis)の 考え方にもとづいた分析方法とソフトウェアである ことを示 す。 第二に、非常 に手軽なマウス操作によってテキスト型データ の分析が行 えることに加えて、 Perl ないしRの短いコードを追加すれば新 たな分析機能 を追加したり、分析を自 動化できることを紹介する。これら の点について は、ご自身のPC上で実際に操作 を 行っていただく予定である。

[16:50-16:55]
閉会の挨拶