Technology

音声認識

話者または音声認識 (ASRと略記) は、話している言葉をテキストに変換する技術です。
SpeechFoundry™ （Inferretの商用音声ソフトウェア）は、ディープラーニングのようなパイオニア的なＡＩ研究から、最新の技術を集積しています。
私たちは、ディープ・ニューラル・ネットワーク（DNN）音響モデルと登録商標、特許を受けた音声認識を高い精度で最も速い反応と信じられないほどのロー・メモリーで提供するために、ウェイト調整した有限状態変換器圧縮方法（WFST)を使用します。

自然音声インタフェース

音声認識で人間のユーザは機械に話すことができます。しかし、それは当然機械が話している意味の理解を可能にはしません。
このギャップは、自然言語理解（NLU）によって埋められます;
Inferretでは、このテクノロジーを自然音声インターフェース（NVI）と言います。
NVIは、人間のユーザに彼らが人間と話す同じ方法で機械に向かって話させます：
それが彼らの心に浮かんで、何を望むか言うことができ、機械がきちんと「反応する」と思うことができます：多くの音声認識システムでは、これらの情報その他を提供しています。ユーザはこの自由度を持っていません：
いくつかの特定の命令を使うことができますが、実際に、機械で声を使って何を言えるか覚えている必要があり、限界があります。