B プラバー、A プラカシュ、G ナガラジャン、J サムソン アイザック、ランジャン ワリア、ブーパシー K
この記事では、音声の取得、解釈、合成、およびジェンダー アイデンティティのためのプラットフォームについて説明します。伝統的に女性的なリファレンス モデルは、フロント エンドとバックエンドの 2 つの部分に分かれています。フロント エンド ソフトウェアの役割は、周波数領域から民族情報を取得し、次元の開発環境を使用してそれを特徴付けることです。プレゼンター情報は、パワー スペクトル密度や最大出力時の周波数などの機能を通じて伝達されます。周波数を除去するには、第 1 フーリエ変換 (FFT) フィルターを使用します。予測と促進では、バックエンド アルゴリズム (予測子とも呼ばれます) は、話者の音声出力から性別を予測するための性的アイデンティティ アプローチを構築する必要があります。この記事では、サービスが 10 人から収集された変調方式 (「A」および「B」と発音) で管理されていることも示しています。そのうち 5 人は男性で、残りは女性です。信号の近似値が調査されるエネルギー スペクトル。最大ランクの英語音韻論のようなものの波長は、計算された周波数領域から導出されます。識別ツールとして、このシステムは画像セグメンテーションを活用します。一般的に、このプラットフォームの精度パフォーマンスは 80 パーセントです。