MMDS大阪大学 数理・データ科学教育研究センター
Center for Mathematical Modeling and Data Science,Osaka University

相互情報量の推定と独立性検定

鈴木 譲 (大阪大学)

大阪大学 数理・データ科学セミナー データ科学セミナーシリーズ第3回
(第73回データ科学特別セミナー共催)

相互情報量の推定と独立性検定

鈴木 譲 (大阪大学)

最近、確率変数X,Yが連続であっても、相互情報量の値を、確率1で正しく推定(強一致性)する方法が提案されている。
一般に、X,Yの相互情報量が0であることと、両者が独立であるこは同値である。
しかしながら、既存の推定量は、常に正の値をとるため、X,Yが独立であることと、0の値をとることとが一致しない。本研究では、強一致性を満足すること以外に、X,Yが独立であることと、非正の値をとる(負の値をとることもある)ことが確率1で一致するような、相互情報量の推定量を提案する。推定量は、独立である場合とそうでない場合で、BIC(Bayesian Information Criterion)の値の差をとったものである。
このBICは、近年講演者によって、X,Yが有限個の値をとるとか、正規分布にしたがうとか、特定の仮定を置かないで導き出されたものである。また、提案方式に基づいて、独立性検定を行う際には、帰無仮説をシミュレートして推定量のしきい値を設定するような手間は生じない。
また、サンプル数nに対して、O(n log n)の計算量で、推定が完結するので、HSIC(Hilbert SchmidtIndependence Criterion、O(n^3)の計算量)などのカーネルに基づく方法とくらべて、効率がよく、ビックデータにも適用できる。最後に、数値実験を示して、提案方式の実際面での有効性を示す。

講師: 鈴木 譲 (大阪大学)
テーマ: 大阪大学 数理・データ科学セミナー データ科学セミナーシリーズ第3回
(第73回データ科学特別セミナー共催)
日時: 2015年05月29日(金) 15:00-17:00(予定)
場所: 大阪大学大学院基礎工学研究科 (豊中キャンパス)J棟 7階 数理大セミナー室 (706号室)
参加費: 無料
参加方法:
アクセス: 会場までのアクセスは下記URLをご参照ください。
http://www.es.osaka-u.ac.jp/access/
お問い合せ: データ科学特別セミナーに関しては下記URLをご参照ください.
http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/tokubetsu/