電子情報通信学会情報・システムソサイエティ
電子情報通信学会ヒューマンコミュニケーショングループ
情報処理学会
A
モデル・アルゴリズム・プログラミング
B
ソフトウェア
C
ハードウェア・アーキテクチャ
D
データベース
E
自然言語・音声・音楽
F
人工知能・ゲーム
G
生体情報科学
H
画像認識・メディア理解
I
グラフィクス・画像
J
ヒューマンコミュニケーション&インタラクション
K
教育工学・福祉工学・マルチメディア応用
L
ネットワーク・セキュリティ
M
ユビキタス・モバイルコンピューティング
N
教育・人文科学
O
情報システム
抄録
E-018
単語論理和での属性拡張による文書分類性能向上
○
廣川佐千男(所属なし)
同義語を同一視することで文書分類の性能する事が知られている。さらに共通の上位概念の単語群を同一視した属性の導入で、文書分類の識別性能が上がる事が知られている。二つの単語uとwの論理和u+wは、u,wの上位概念といえる。このような単語の論理和を導入する事で、文書分類の性能が向上すること事を、5種類の標準的データセット reuter21578, 20newsgroups, wap, k1a, k1bで示す。