コンピュータ工学および情報技術ジャーナル

不均衡なデータストリーム分類のための効果的なフレームワーク

ウー・K、チャン・K、ファン・W、ガオ・J、エドワーズ・A

不均衡なデータストリーム分類のための効果的なフレームワーク

歪んだ分布を持つデータ ストリームの分類は、現実的な環境で多くの用途がありますが、データ ストリームの分類と不均衡なデータ学習というこの結合した問題に対処する方法はごくわずかです。本稿では、この問題に取り組むために、重要度サンプリング駆動型の新しい動的特徴グループ重み付けフレームワーク (DFGW-IS) を提案します。私たちのアプローチは、概念が漂う不均衡なストリーミング データの固有の特性に対処します。具体的には、常に進化する概念は、一連の特徴グループでトレーニングされたアンサンブルによって処理され、各サブ分類子 (つまり、単一の分類子またはアンサンブル) は、その識別力と安定レベルによって重み付けされます。一方、不均一なクラス分布は、特定の特徴グループに組み込まれたサブ分類子によって対処され、基礎となる分布は重要度サンプリング手法によって再バランスが取られます。提案アルゴリズムの一般化誤差境界に関する理論的分析を提供します。複数の偏ったデータ ストリームに対する広範な実験により、提案されたアルゴリズムは標準的な評価基準で競合方法よりも優れているだけでなく、さまざまな学習シナリオにも適応できることが実証されています。

免責事項: この要約は人工知能ツールを使用して翻訳されており、まだレビューまたは確認されていません