相互情報量の推定と独立性検定
鈴木 譲 (大阪大学)
大阪大学 数理・データ科学セミナー データ科学セミナーシリーズ第3回
(第73回データ科学特別セミナー共催)
相互情報量の推定と独立性検定
鈴木 譲 (大阪大学)
最近、確率変数X,Yが連続であっても、相互情報量の値を、確率1で正しく推定(強一致性)する方法が提案されている。
一般に、X,Yの相互情報量が0であることと、両者が独立であるこは同値である。
しかしながら、既存の推定量は、常に正の値をとるため、X,Yが独立であることと、0の値をとることとが一致しない。本研究では、強一致性を満足すること以外に、X,Yが独立であることと、非正の値をとる(負の値をとることもある)ことが確率1で一致するような、相互情報量の推定量を提案する。推定量は、独立である場合とそうでない場合で、BIC(Bayesian Information Criterion)の値の差をとったものである。
このBICは、近年講演者によって、X,Yが有限個の値をとるとか、正規分布にしたがうとか、特定の仮定を置かないで導き出されたものである。また、提案方式に基づいて、独立性検定を行う際には、帰無仮説をシミュレートして推定量のしきい値を設定するような手間は生じない。
また、サンプル数nに対して、O(n log n)の計算量で、推定が完結するので、HSIC(Hilbert SchmidtIndependence Criterion、O(n^3)の計算量)などのカーネルに基づく方法とくらべて、効率がよく、ビックデータにも適用できる。最後に、数値実験を示して、提案方式の実際面での有効性を示す。
講師: | 鈴木 譲 (大阪大学) |
---|---|
テーマ: | 大阪大学 数理・データ科学セミナー データ科学セミナーシリーズ第3回 (第73回データ科学特別セミナー共催) |
日時: | 2015年05月29日(金) 15:00-17:00(予定) |
場所: | 大阪大学大学院基礎工学研究科 (豊中キャンパス)J棟 7階 数理大セミナー室 (706号室) |
参加費: | 無料 |
参加方法: | |
アクセス: | 会場までのアクセスは下記URLをご参照ください。 http://www.es.osaka-u.ac.jp/access/ |
お問い合せ: | データ科学特別セミナーに関しては下記URLをご参照ください. http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/tokubetsu/ |