コンピュータ工学および情報技術ジャーナル

クラウドベースのサービスとディープラーニングモデルを使用した音声から音声への翻訳

アジット R パティル*、カムレシュ パティル、ソナル パティル

過去数十年で、インターネットとソーシャルメディアの出現により、グローバルコミュニティが形成され、未発達のコミュニティに直接適用されています。認知学習は、人間とコンピュータの相互作用を改善しようとする、最も人気のある研究分野の1つです。この論文では、クラウドサービスと最先端の機械学習モデルを組み合わせた音声から音声への翻訳のアプリケーションを紹介します。音声から音声への翻訳では、クラウドベースの音声からテキストへの変換、音声翻訳、トークン抽出、ディープニューラルネットワークに基づく音声合成モデル、同じくディープニューラルネットワークに基づくボコーダーを含む3段階のアーキテクチャが調査されます。この研究の主な焦点は、音声から音声への言語翻訳のための堅牢なシステムの作成と、このシステムの適用です。

免責事項: この要約は人工知能ツールを使用して翻訳されており、まだレビューまたは確認されていません