- 公開日
GoogleはAIが音を聞く方法を再発明した
- 著者

- 名前
- AbnAsia.org
- @steven_n_t
GoogleはAIが音声を聞く方法を再発明した:新しいS2R AIモデルはテキストのステップを完全に省略し、直接あなたの声から意味を理解するのです😳
「The Scream」が「screen」に変換されることはもうない。
アクセントやノイズで壊れる脆い音声アシスタントはもうない。
S2R(Speech-to-Retrieval)は、発話されたクエリを直接意味ベクトルに符号化する - 単語ではなく意図を一致させる。
結果は、17の言語でほぼ完全な文字起こしに匹敵する精度 - 単一の文字を書き留めることなく🤯
そして、これはAIが人間とコミュニケーションする方法に哲学的な変化をもたらします🤖
数十年間、AIは私たちが何と言っているかを聞こうとしてきた。
今、AIは私たちが何を意味しているかを理解しようとしている。
これが重要な理由はこちらです:
→ 設計によってエラーを防ぐ:繊細な文字起こしパイプラインを省略する。
→ より速く軽量:電話、ウェアラブル、リアルタイム音声検索に適している。
→ 包括的:低リソース言語でも同等の性能を発揮する。
→ プライベート:テキストログがないため、データ漏洩が少ない。
→ オープン:GoogleのオープンなSimple Voice Questionsデータセット(17言語)によってサポートされる。
より重要なのは、これが意図を優先したAIの始まりである。
ただ答えるのではなく、実行する音声。
「私にフライトを予約して」と言えば、エージェントが実行する。
または「その音は何?」と聞いて、電話が知っている。
それがS2Rが導く先、音声検索から音声インテリジェンスへ。
私たちはついに人間の言葉を話すAIの構築を目撃している。
日本語版は Ai 支援を使用しているため、小さな間違いが存在する可能性があることをご了承ください。
著者
Ai Base Network (ABN), ABN ASIAは、アカデミアに深く関わり、アメリカ、オランダ、ハンガリー、日本、韓国、シンガポール、ベトナムでの仕事経験を持つ人々によって設立されました。ABN ASIAは、学問とテクノロジーが機会と出会う場所です。最先端のソリューションと優れたソフトウェア開発サービスにより、ビジネスがレベルアップし、グローバルシーンに挑戦できるよう支援しています。 私ちの取り組み: より速く。 より良い。 より信頼性が高くなります。 ほとんどの場合、価格も安くなります。
いつでも、ITサービス、デジタルコンサルティング、既製のソフトウェアソリューション、または提案依頼書(RFP)をお探しの際は、お気軽にお問い合わせください。お問い合わせ先は[email protected]です。お客様のテクノロジーに関するニーズにお応えします。

© ABN ASIA