会誌「情報処理」Vol.63 No.2(Feb. 2022)「デジタルプラクティスコーナー」

Glossary─グロッサリ─

ABM(Account-Based Marketing,アカウントベースドマーケティング)

ターゲット企業を定義し,ターゲット企業別に営業・マーケティング情報を集約し,ターゲット企業別に営業・マーケティング組織を再編成し,ターゲット企業からのLTV最大化を目指すマーケティングのこと.(高柳慎一)

API(Application Programming Interface)

ソフトウェアのコンポーネント同士が互いに連携するためのインターフェイスを定めたもの.APIには,データ構造の定義や関数の入出力の取り決め,エラーの定義などが含まれる.(村田賢太)

AUC(Area Under the Curve)

機械学習における評価指標の一種.0から1までの値をとり,値が1に近いほどそのモデルの識別能力が高いことを示す.識別能力がランダムであるとき,0.5となる.(高柳慎一)

B2B(Business To Business)

企業と企業の間での取引のこと.また似た意味を持つ用語としてB2C(Business to Customer)があり,これは企業と一般消費者の取引を表す.(高柳慎一)

CPU時間

プログラムがCPUを利用した時間.実行時間のうち入出力待ちなどでCPUが動いていない時間を除いた時間とほぼ等しい.複数のコアを同時に利用した場合は,それぞれのコアの稼働時間の合計となる.(村田賢太)

Foreign Function Interface(FFI)

異なるプログラミング言語で実装された関数を呼び出せるようにするための仕組み.(村田賢太)

GBDT(Grandient Boosting Decision Trees)

弱学習器(通常は決定木)を組み合わせて(アンサンブル)予測モデルを生成.予測誤差に対して逐次的に決定木を学習させていく点が特徴的である.(高柳慎一)

GLCM(Gray‐Level Co‐occurrence Matrix)

画像の輝度値の空間分布や局所的な関係性などから統計量を求めることによって画像のテキスチャの特徴を抽出する統計的解析法.(辰己賢一)

ICD‐10(International Classification of Diseases, 10th Revision)

ICDとは,疾病,傷害及び死因の統計を国際比較するために WHOが定めた,疾病および関連保健問題の国際統計分類であり,ICD‐10はその第10版である.各国で言語や呼び名が異なる場合でも,アルファベットと数字からなる統一されたコードで記載することで,各国間の統計比較を可能にしている.大阪府KDBデータの場合は,ICD‐10は医療傷病名データの項目として,各被保険者の診療年月ごとに傷病名と併せて記載されている.(古徳純一)

JSON

データ記述言語の1つであり,JavaScriptのオブジェクト表記法のサブセットとなる構文で,型つきの構造化データを記述できる.(村田賢太)

NB(Naive Bayes classifier)

各特徴量に独立性を仮定し,ベイズの定理を用いて構築された分類器.特徴量が独立であると仮定されているため,効率的に学習が可能である.(高柳慎一)

Precision@N

クラス分類においてPositiveであろうと予測したN個のもののうち,実際にPositiveであったものの割合を表す.推薦問題においてしばしば用いられる.(高柳慎一)

RGB画像

Red(赤),Green(緑),Blue(青)の原色を使ってカラー表示される画像.(辰己賢一)

SIMD(Single Instruction Multiple Data)

1命令で複数のデータに対して同じ演算を行うこと.メモリ上の連続する2〜4つのデータに対して同時に命令を適用できるため,ベクトル同士の演算や,配列をスキャンする処理などが効率良く実装できる.(村田賢太)

拡張ライブラリ

たとえばRubyの場合,Rubyのみでは実現できないがほかの言語では実現できるような機能があったとする.そのような機能をRuby以外の言語で記述し,RubyのC APIを介してRubyから呼び出せるようにするライブラリが拡張ライブラリである.(村田賢太)

キャッシュメモリ

CPUとメインメモリの間に配置される高速化かつ小容量のメモリ.メインメモリ上のよく参照される領域をキャッシュメモリ上に配置することでCPUとメインメモリ間の直接のデータ伝送の頻度を抑え,CPUがデータを待つ時間を短くする効果がある.(村田賢太)

傾向スコア

観察研究において因果推論などを行う際に,ある共変量(説明変数)を持つ個体が介入を受ける確率として傾向スコアと呼ばれる量を定義すると,与えられた傾向スコアのもとで結果変数が介入と条件付き独立となることを示せる.そのため 傾向スコアを用いることで,無作為化比較試験をやりにくい状況下でもそれに近い状態の解析が可能になる.たとえば逆確率重み付き推定を利用すれば,介入前後での結果の変化の期待値(平均処置効果)を小さいバイアスで推定できる.(古徳純一)

構文解析

文章やプログラムコードなどを表現している記号列を読んで文法に従った構造を特定し,構文木と呼ばれる木構造を構築する処理.(村田賢太)

シリアライズ

プログラムが扱っているデータを,保存したり通信相手に送ったりするためにバイト列に変換すること.(村田賢太)

正則化

解が一意に定まらない不良設定問題を解決したり過学習を防ぐために,モデルの複雑さに対して罰則を科す手法の総称.機械学習においてはパラメータのノルムの大きさに罰則を付加することが一般的である.(高柳慎一)

テクスチャ情報

形状の情報ではない,特定の物体や物質,素材などの表面の質感などを表現するために使われる情報.(辰巳賢一)

デシリアライズ

プログラムがデータを読み出したり通信相手から受信したりした際に,バイト列からデータを復元すること.(村田賢太)

データフレーム

2次元の表形式のデータ構造であり,列と行のそれぞれにラベルを付けられ,個々の列は異なる型の値を持てるもの.R言語では組込みのデータ型として提供されている.Pythonではpandasライブラリによって実装されている.(村田賢太)

トランザクション処理

データベースのトランザクション処理を用いてデータの一貫性を保ちながら,小さいサイズのデータに対する更新や問合せを行うこと.(村田賢太)

バインディング

たとえばRubyの場合,Rubyで書かれたライブラリは直接利用できるが,C言語で書かれたライブラリは直接利用できない.このように,ほかの言語で実装されていて直接利用できないライブラリを利用するために必要なものがバインディングである.(村田賢太)

分析的データ処理

蓄積された大量のデータを多次元的に見て集計処理や統計処理などの複雑な処理を行うこと.(村田賢太)

マングル

C++の変数名と関数名を固有の名前に符号化して,リンカが識別できるようにすること.C++では名前空間とクラスがあり,また関数は同名で異なる引数を持つものを多重定義できるため,このような仕組みが必要となる.(村田賢太)

列指向

2次元データをメモリ上に配置するときの値の並べ方の流儀の1つで,列の方向に値を連続配置する場合を列指向という.対して,行の方向に値を連続配置する場合を行指向という.(村田賢太)

会員登録・お問い合わせはこちら

会員種別ごとに入会方法やサービスが異なりますので、該当する会員項目を参照してください。