YAML
音声認識技術 - YAML
音声認識技術(ASR: Automatic Speech Recognition)は、人間の音声をコンピュータが認識し、テキストデータに変換する技術です。深層学習や大規模言語モデルの発展により、精度が飛躍的に向上し、Siri、Google Assistant、Alexaなどの音声アシスタントや、コールセンターでの文字起こし、医療現場でのカルテ作成、自動車のハンズフリー操作など、幅広い分野で活用されています。2025年現在、リアルタイム翻訳や感情認識、マルチモーダル対話など、より高度な機能が実現されています。
音声認識
ASR
AI
音声アシスタント
Siri
Google Assistant
Alexa
自然言語処理
深層学習
スマートスピーカー
- code: "01"
slug: "virtual-assistant"
name: "音声アシスタント"
description: "音声対話型のAIアシスタントです。"
examples:
- "Siri"
- "Google Assistant"
- "Amazon Alexa"
- "Cortana"
- "Bixby"
- code: "02"
slug: "speech-to-text"
name: "音声文字起こし(STT)"
description: "音声をテキストに変換する技術です。"
examples:
- "OpenAI Whisper"
- "Google Cloud Speech-to-Text"
- "IBM Watson STT"
- "Azure Speech Services"
- "Nuance Dragon"
- code: "03"
slug: "voice-biometrics"
name: "音声生体認証"
description: "声紋による個人認証技術です。"
examples:
- "Nuance Voice Biometrics"
- "Pindrop"
- "Verint"
- "Auraya"
- "Phonexia"
- code: "04"
slug: "real-time-translation"
name: "リアルタイム音声翻訳"
description: "音声を即座に別言語に翻訳する技術です。"
examples:
- "Google Translate"
- "Microsoft Translator"
- "Pocketalk"
- "ili"
- "Langogo"
- code: "05"
slug: "command-control"
name: "音声コマンド制御"
description: "音声による機器操作技術です。"
examples:
- "Smart Home Control"
- "In-Car Voice Control"
- "TV Voice Remote"
- "Industrial Voice Control"
- "Accessibility Tools"
- code: "06"
slug: "emotion-recognition"
name: "音声感情認識"
description: "音声から感情を検出する技術です。"
examples:
- "Beyond Verbal"
- "Cogito"
- "Empath"
- " audEERING"
- "Vokaturi"
- code: "07"
slug: "speaker-recognition"
name: "話者識別"
description: "複数の話者を識別・分離する技術です。"
examples:
- "Google Cloud Speaker Diarization"
- "AWS Transcribe"
- "Rev.ai"
- "AssemblyAI"
- "Deepgram"
- code: "08"
slug: "wake-word-detection"
name: "ウェイクワード検出"
description: "特定の起動詞を検出する技術です。"
examples:
- "Porcupine"
- "Snowboy"
- "Amazon Alexa Wake Word"
- "Google Hotword"
- "Sensory TrulyHandsfree"