第120回CH研究発表会

第120回人文科学とコンピュータ研究発表会

標記の研究発表会はペーパレスで行います(貸し出し用のUSBメモリもご用意しています)。
  • 研究会に登録されている方
    研究報告は開催初日の1週間前(=公知日)に電子図書館(情報学広場)で公開します。
    ※2019年度より研究発表会当日用サイトのID・パスワードの事前配布は行わないことになりました。研究会に登録されている方で研究発表会に参加されない場合の論文のダウンロードには上記電子図書館をご利用くださいますようお願いいたします。

  • 研究会に登録されていない方
    当日受付で資料閲覧用のアカウント情報(URL,ID,PW)をお渡しいたします。
    尚、研究会にご登録いただくことで当研究会のバックナンバーも含めて全て電子図書館でご購読いただけます。登録に関しては  「研究会に登録する」のページをご参照ください。

開催案内

 【会場情報】
 日時 2019年5月11日(土) 
 会場 京都大学人文科学研究所
 
【参加費(聴講)】
種別         金額
研究会登録会員 無料
学会正会員 2000円
学会会員学生 500円
学会非会員学生 1000円
非会員         3000円

【プログラム】
 
2019年5月11日(土)
 
9:50-10:00 開会の挨拶
 
10:00-11:20 一般セッション1
 
10:00-10:25 ロング
(01)Universal Dependenciesの拡張にもとづく古典中国語(漢文)の直接構成鎖解析の試み
○安岡 孝一 (京都大学)
 古典中国語(漢文)の解析手法として,Universal Dependenciesの拡張により,構成鎖(catena)解析をおこなう手法を提案する.言語横断的な依存構造記述であるUniversal Dependenciesは,ニューラルネットを用いた言語解析ツール等に採用されており,言語をまたいだ係り受け解析に非常に有用である.しかし,Universal Dependenciesは,句構造という考え方をかなり意識的に排除しており,古典中国語の文法構造に適用した場合,この点で,どうしてもいくつかの齟齬が生じてしまう.本稿では,これらの齟齬を出来る限り解決すべく,Universal Dependenciesを直接構成鎖解析へと拡張する形で,句構造の導入を試みる
 
10:25-10:40 ショート
(02)漢字字体規範史データセット用従来型 UI 再生の試み
○守岡 知彦  (京都大学人文科学研究所)
・劉 冠偉 (北海道大学文学研究科)
・高田 智和(国立国語研究所)
 2015年4月頃に停止した漢字字体規範史データベース (HNG) の代替サービスとしては2015年11月に公開された「CHISE-IDS HNG 漢字検索」が存在するが、元々の HNG と UI が大きく異なるため旧来の UI が使いたいというユーザーの声が寄せられていた。このため、我々は「HNG 単字検索」と呼ぶ従来型 UI を提供する検索サービスを実装した。この検索サービスは従来風の操作性や表示を再現するだけでなく、検索結果に対するパーマリンクやレスポンシブ Web デザインを実現することでスマートフォンやタブレットを含んだ現代的な Web 環境における快適な操作性の実現を目指した。また、EsT / CHISE-wiki 上の紙カード画像及び文字情報へのリンクを通じて CHISE ベースの HNG の機能や Unihan / GlyphWiki 等の国際的に利用されている文字データベースとの連携も実現している。本発表ではこの HNG 単字検索の概要について概説する。
 
10:40-10:55 ショート
(03)移点ツールの仮名点・語順点への拡張
○田島 孝治 (岐阜工業高等専門学校)
・堤 智昭 (筑波大学)
・高田 智和(国立国語研究所)
・小助川 貞次(富山大学)
 これまでに我々は、訓点資料に付与されたヲコト点に注目したデータ記述方式を検討し、移点を支援するツールを開発してきた。また、ツールを用いて作成したデータを用いた書き下し文の機械的な生成を試みてきた。ヲコト点だけでは語順の入れ替えに対応することが難しく、語順点であるレ点、一二点の電子化は急務であった。また、仮名点を電子化しておくことで、ヲコト点だけでは区別できなかった、読み仮名と助詞・助動詞の識別も可能であると考えられる。そこで、今回これまでの入力ツールを改良し、語順点と仮名点の入力を可能としたのでこれを報告する。またこれに合わせてデータ構造も多少変更し、具体的な資料として、尚書の語順点、仮名点を入力したので、この際に起こった問題点なども合わせて報告する
 
10:55-11:20 ロング
(04) 国際的な画像共有に基づくデジタル学術編集版の構築  SAT大蔵経テキストデータベースの事例を通じて
○永崎 研宣 (一般財団法人人文情報学研究所)
・下田 正弘 (東京大学人文社会系研究科)
 デジタル学術編集版の構築において、これまではテクスト化した上での構造化が常であったが、近年、国際的な画像共有の枠組みが広まることにより、デジタル画像を活用した新しいステージが開かれつつある。本発表では、これに対応した仕組みを開発し、既存の全文テクストデータベースに組み込むことにより、画像とテクストを融合させたデジタル学術編集版の構築したことについて報告する。
 
11:20-11:30 休憩
 
11:30-12:10 一般セッション2
 
11:30-11:55 ロング
(05)日本の学術出版物における引用データのオープン化の現状分析
○西岡 千文 (京都大学附属図書館)
・亀田 尭宙 (京都大学東南アジア地域研究研究所)
・佐藤 翔(同志社大学免許資格課程センター)
 近年、学術出版物のオープンアクセスが進展し、自由にアクセス可能な学術情報が蓄積されている。一方で、研究評価など様々な目的で利用されている学術出版物の引用データに関しては、機械可読なアクセスのオープン化が遅れてきた。このような状況を解決するために、I4OC(Initiative for Open Citations)が学術機関と出版社によって設立された。本稿では、I4OCが公開している引用データを、JaLCメタデータとunpaywallにより公開されているデータとともに利用することで、日本の学術出版物の引用データのオープン化の現状分析を試みる。
 
11:55-12:10 ショート
(06)文末表現の計量分析に基づく夏目漱石の小説の分類
○土山 玄 (一橋大学 森有礼高等教育国際流動化機構)
 文学的文章の計量分析では書き手の識別や同定を目的とした研究は広くなされているが、それに比べ執筆年代や執筆順序を推定する研究は十分に展開されているとは言えない。そこで、本研究では作者の識別日本を代表する文豪である夏目漱石の小説を採り上げ、文末表現に注目し計量的な手法を用いて検討を加えた。分析においては、文末に現れる単語の出現率を特徴量とし多変量解析を行った。分析の結果、1908年の前後において夏目漱石の小説は2群に分類されることを明らかにした。
 
12:10-13:40 昼休憩
(運営委員会等)
 
13:40-15:10 学生ポスターセッション
(13:40-13:52 ショートプレゼンテーション)
 
(07)TEI を用いた『リグ・ヴェーダ』のマークアップについて
○塚越 柚季(東京大学)
 『リグ・ヴェーダ』 (RV) をはじめヴェーダ文献はマークアップされたデジタルテクストがほぼない。そこで RV のマークアップを行い、各詩節の韻律およびその詩を作成したと伝承されている詩人の情報を加えた。韻律詩である RV は、伝承されるテクストが想定される韻律に当てはまらない場合がある。そのような詩は、インド・ヨーロッパ祖語やインド・イラン祖語の再建により韻律が復元される。これら伝承されるテクストおよび韻律の復元されたテクストをまとめて構造化することに関しても議論をする。
 
(08)字母の違いを考慮した機械学習によるくずし字認識
○木村 優太 (同志社大学文化情報学部)
・星野 智紀 (同志社大学文化情報学部)
・杉浦 遊平 (同志社大学文化情報学部)
・深川 大路 (同志社大学文化情報学部)
 江戸期の日本古典籍が含む文字情報をデジタル化するにあたって,くずし字の翻刻テキストを作成することが急務である.機械学習による文字認識の性能が向上するとともに,くずし字の自動認識も性能は向上してきた.しかし,くずし字の文字認識という課題は,他の文字とは異なる種類の困難さを含んでいる.現代の平仮名とは異なる仮名文字の存在はその一つである.本研究では,くずし字の機械学習における新たな手法として,字母情報を含む拡張ラベルを利用する方法を提案する.さらに,提案手法の有効性を検証するための計算機実験を行い,提案手法が既存手法を上回る性能を示すことを確認した.
 
(09)テキスト分析を用いた近代短歌作品の比較
○村田 祐菜(東京大学人文社会系研究科)
 近代短歌結社の一つである「アララギ」は、大正五年~昭和初期にかけて島木赤彦、斎藤茂吉、中村憲吉、小泉千樫らの同人を中心に、歌壇において隆盛を極めた。その理由の一つとして同人間の強い結社意識が指摘できるが、具体的な表現についての影響関係は必ずしも明らかではない。本発表では、その短歌テキストにN-gramのテキスト分析の手法を用いて、同人間の短歌表現の影響関係を考えたい。
 
(10)古辞書をグラフデータベース化する試み —観智院本『類聚名義抄』を例にー
○劉 冠偉 (北海道大学)
・池田 証壽 (北海道大学)
 平安時代漢字字書総合データベース(HDIC)では、日本の『篆隷万象名義』・『新撰字鏡』、中国の『宋本玉篇』の古辞書データベースを構築・公開した。現在は観智院本『類聚名義抄』の公開を準備している。これらのデータベースは関係データベースであり、FileMakerとMySQLによって管理されている。しかし、研究の深化によって、スキーマの更新やリレーションシップの増加は頻繁に生じるため、関係データベースによる管理は難しくなる。項目・出典・異体字の三者の関係は多・多・多の関係となることが多い。こうした複雑な関係を現在のシステムで対応することが難しくなってきた。直感的なモデリングが可能なシステムが求められている。そこで、本発表ではHDICで公開予定である観智院本『類聚名義抄』テキストデータベースを用いて、収録の各項目、掲出字、注文、所属部首、所在情報をNeo4jに格納して、古辞書のグラフデータベース化を試みる。
 
(11)歴史学と情報学のより良い協働を目指して—オープンなDH支援ツールを用いたボスニアのカトリック修道院所蔵のオスマン・トルコ語文書群のデータ整理の一事例
○佐治 奈通子 (東京大学大学院人文社会系研究科アジア文化研究専攻)
・中村 覚 (東京大学情報基盤センター)
 本発表では,歴史学と情報学の協働による,史料画像データ整理の実践事例を示す.具体的には,歴史史料から得られる情報を整理・分析可能な史料研究支援システムを利用して,ボスニアのカトリック修道院所蔵の未整理のオスマン・トルコ語文書の画像データ2,268点を整理する. その作業を通じて,歴史学的な観点からのニーズを反映させたシステムの改良を試みた.また,個々のデータ詳述と,可視化による史料群の全体像の把握が可能となったことで,作業の効率化とバランスのよい史料理解に繋がった.
 
(12)デジタル学術情報流通環境に基づく文献目録情報作成の試み:『史学雑誌』文献目録を事例に
○小林 拓実 (東京大学大学院人文社会系研究科)
・小川 潤 (東京大学大学院人文社会系研究科)
 文献目録の作成においては、関連する著作を作成者が確認し、必要性を認めたものを記録するのが一般的である。それを学会誌の業務として行う場合、チェックする対象の雑誌・書籍の数が膨大となり、作業者の負担が非常に大きくなってしまうという困難が生じていた。そこで今回、東京大学人文社会系研究科の史学系大学院生が史学会の依頼を受け行っている『史学雑誌』の西洋史文献目録の作成作業を題材として、PythonとCiNii等の学術情報基盤で公開されるWebAPIを用いた著作データ取得の自動化を試みた。この結果、作業時間の短縮には成功したものの、取得データと史学系の雑誌として要求されるデータのギャップを補正する必要性、またそのシステムを持続的に運用する上での課題も明らかになった。
 
15:10-15:20 休憩
 
15:20-17:15
 
企画セッション「人文科学とコンピュータ分野」における研究資源と情報技術を考える
○後藤 真 (国立歴史民俗博物館)
・阪田 真己子 (同志社大学)
・松村 敦 (筑波大学)
・山田 太造 (東京大学)
 これまで本研究会では,文学・歴史・考古・音楽・舞踊などの人文・芸術等の研究におけるデータを対象に,検索・分類・提示・発見などを実現するための情報技術の方法論・適用手法等について多数の報告がなされてきた.CH120では,ここでのデータおよび方法論について議論し,本研究会の特徴を見いだし,本研究会の将来の方向性について議論していく討論会を開催する.
 
17:15 奨励賞発表、閉会の挨拶
 
18:00〜 懇親会
 
 
【懇親会】
発表会終了後に、懇親会を予定しています。ぜひご参加ください。 懇親会の参加申し込みについては、後日ML及びこのHPでお知らせします。
 
会場: BONBON CAFE(ボンボンカフェ) https://bonboncafe.owst.jp/
参加費: 一般 5000円 学生 1000円(予定)
 
 
【お問い合わせ先】
madoguchi■jinmoncom.jp(@を■に変更しています )

発表募集

◆第120回 人文科学とコンピュータ研究会発表会

 情報処理学会人文科学とコンピュータ研究会(IPSJ SIG Computers and the Humanities)では、下記の通り第120回研究会発表会の開催を予定しております。
歴史、地理、芸術、民俗、文学、言語、社会などなど、様々な人文科学の諸領域での情報資源の記録、蓄積、分析、提供や応用に関わる研究発表をお考えの方はぜひ奮ってご応募ください。
ポスターセッションも予定しておりますので、学生の方による萌芽的な研究発表やアイデアの議論の場としてもご活用いただけますと幸いです。
詳細は追ってウェブサイト(http://www.jinmoncom.jp/?CH120)およびMLでお知らせさせていただきます。

皆様のお越しを心よりお待ちしております。 

********************
日時    2019年5月11日(土)
会場    京都大学人文科学研究所(京都市左京区吉田本町)
発表申込締切 2019年3月29日(金)
原稿提出締切 2019年4月12日(金)

******************** 

(1)募集内容
・学生ポスターセッション 6-8件
学生ポスターセッションの中で優秀な発表には、「奨励賞」が授与されます。
学生のみなさま、奮ってご参加ください。 

・一般口頭発表 3-4件
ショート:15~20分程度の持ち時間(質疑を含む)
ロング:20分~25分程度の持ち時間(質疑を含む) 

※ポスターセッション/ロング/ショートいずれも2p~8pの予稿の提出が必要となります(この範囲であれば枚数は自由です)。
※予稿のフォーマットは情報処理学会のページ(https://www.ipsj.or.jp/kenkyukai/genko.html)をご参照ください。 

(2)申込方法
申込書のページ https://ipsj1.i-product.biz/ipsjsig/CH/)をご利用ください(なお、原稿提出はこちらのページから行っていただきます)。
*「研究会への連絡事項」欄に「一般(ロング)」「一般(ショート)」「学生ポスターセッション」「企画セッション」の別を、必ずご記入ください。
* 投稿システムで申込後、「講演申込完了のお知らせ」という件名のメールが自動配信されます。
* 担当幹事より、「講演申込受理のお知らせ」という件名のメールで、整理番号とパスワード、原稿執筆の詳細が届き、正式受理となります。
正式受理の連絡がない場合は照会先までご連絡ください。
* 先着順にて、定足数に達し次第、締め切りとさせていただきます。
* お申込み後、原稿提出時の発表ご辞退はお控えいただくようにお願いします。 

(3)遠方からの発表学生への金銭的補助について
今回CH120では、遠方から参加する学生の金銭的負担を軽減し発表の機会を増やすことを目的に金銭的補助を受けたい方を募集します。
・補助額:9200円
・対象学生の条件:発表を行うこと
                          マイク担当等のアルバイトとして働けること
                           会場まで片道9200円以上(新幹線利用,正規の値段)の遠方からの参加であること
                           学内/他資金での補助が受けられないこと
・人数:若干名
  なお、CH120ではCH研究会30周年記念事業パネルディスカッション準備会を実施します。
 
以上、よろしくお願いいたします。