JSON
音声認識技術 - JSON
音声認識技術(ASR: Automatic Speech Recognition)は、人間の音声をコンピュータが認識し、テキストデータに変換する技術です。深層学習や大規模言語モデルの発展により、精度が飛躍的に向上し、Siri、Google Assistant、Alexaなどの音声アシスタントや、コールセンターでの文字起こし、医療現場でのカルテ作成、自動車のハンズフリー操作など、幅広い分野で活用されています。2025年現在、リアルタイム翻訳や感情認識、マルチモーダル対話など、より高度な機能が実現されています。
音声認識
ASR
AI
音声アシスタント
Siri
Google Assistant
Alexa
自然言語処理
深層学習
スマートスピーカー
[
{
"code": "01",
"slug": "virtual-assistant",
"name": "音声アシスタント",
"description": "音声対話型のAIアシスタントです。",
"examples": [
"Siri",
"Google Assistant",
"Amazon Alexa",
"Cortana",
"Bixby"
]
},
{
"code": "02",
"slug": "speech-to-text",
"name": "音声文字起こし(STT)",
"description": "音声をテキストに変換する技術です。",
"examples": [
"OpenAI Whisper",
"Google Cloud Speech-to-Text",
"IBM Watson STT",
"Azure Speech Services",
"Nuance Dragon"
]
},
{
"code": "03",
"slug": "voice-biometrics",
"name": "音声生体認証",
"description": "声紋による個人認証技術です。",
"examples": [
"Nuance Voice Biometrics",
"Pindrop",
"Verint",
"Auraya",
"Phonexia"
]
},
{
"code": "04",
"slug": "real-time-translation",
"name": "リアルタイム音声翻訳",
"description": "音声を即座に別言語に翻訳する技術です。",
"examples": [
"Google Translate",
"Microsoft Translator",
"Pocketalk",
"ili",
"Langogo"
]
},
{
"code": "05",
"slug": "command-control",
"name": "音声コマンド制御",
"description": "音声による機器操作技術です。",
"examples": [
"Smart Home Control",
"In-Car Voice Control",
"TV Voice Remote",
"Industrial Voice Control",
"Accessibility Tools"
]
},
{
"code": "06",
"slug": "emotion-recognition",
"name": "音声感情認識",
"description": "音声から感情を検出する技術です。",
"examples": [
"Beyond Verbal",
"Cogito",
"Empath",
" audEERING",
"Vokaturi"
]
},
{
"code": "07",
"slug": "speaker-recognition",
"name": "話者識別",
"description": "複数の話者を識別・分離する技術です。",
"examples": [
"Google Cloud Speaker Diarization",
"AWS Transcribe",
"Rev.ai",
"AssemblyAI",
"Deepgram"
]
},
{
"code": "08",
"slug": "wake-word-detection",
"name": "ウェイクワード検出",
"description": "特定の起動詞を検出する技術です。",
"examples": [
"Porcupine",
"Snowboy",
"Amazon Alexa Wake Word",
"Google Hotword",
"Sensory TrulyHandsfree"
]
}
]