ムハンマド・ショアイブ1、ナシル・サイード
近年、人工知能と無人航空機 (UAV) の統合が注目の研究テーマになっています。特に、UAV が人間の制御ではすぐに完了できない複雑なタスクを実行する必要がある場合に顕著です。ドローンは、多くの場合、トップダウン カメラや LiDAR センサーなど、複数のセンサーを使用して状態に関する詳細情報を収集し、メイン プロセッサがドローンの軌跡をすべて測定します。この論文では、単眼のオンボード カメラと強化学習モデルを使用して検出されたターゲットを追跡することを提案します。このシステムは、さまざまなセンサーと事前に計算された軌跡を使用して、以前のアプローチよりもコスト効率が高く、大気に適応できます。私たちのモデルは、以前の Deep Double Q ネットワークを Duel Architecture Model (D3QN) で拡張し、アクション テーブルとインセンティブ機能を変更して、3 次元ジェスチャとオブジェクト認識を MobileNet のサポートと組み合わせて可能にすることで、ドライブ ネットワーク画像入力に包括的なボックスの詳細を追加しました。シミュレーションは、それぞれに難易度と洗練度のレベルがあるさまざまなシミュレーション設定で実行されます。研究には、Microsoft がサポートするクワッドローター シミュレーション API である「Airsim」アプリケーションが使用されています。その結果、収束ベースの探索アルゴリズムを使用すると、モデルは途中で障害物に遭遇することなく、観測対象である人間の姿に近づき、より高速に移動できることがわかりました。