この研究に後押しされ、ヒュームは会話音声APIであるEVIを開発しました。EVIは、大規模な言語モデルと共感アルゴリズムを組み合わせて、人間の感情状態を深く理解・解析し、音声中の感情を認識するだけでなく、ユーザーとの対話において、よりニュアンスのあるパーソナライズされた応答を提供します。開発者は、わずか数行のコードでこれらの機能を使用し、あらゆるアプリケーションに組み込むことができます。
現在のほとんどのAIシステムの主な限界の1つは、その指示が主に人間によって行われることであり、エラーが起こりやすく、AIの大きな可能性を引き出すことができない。 ヒュームの共感的大規模言語モデル(eLLM)は、ユーザーの感情の言葉やトーンを文脈やユーザーの気分に適応させる。人間の幸福を機械学習、調整、インタラクションの第一原理とすることで、ヒュームは、文脈とユーザーの感情表現に基づいて言葉や声のトーンを調整する共感的大規模言語モデル(eLLM)を開発し、メンタルヘルス、教育・トレーニング、救急コール、ブランド分析などのさまざまな場面で、より自然で本物の体験を提供している。今年3月、ヒュームAIはEQTベンチャーズが主導する5,000万ドルのシリーズBラウンドの資金調達を完了し、ユニオン・スクエア・ベンチャーズ、ナット・フリードマン、ダニエル・グロスらも投資した、Metaplanet、Northwell Holdingsなどが名を連ねている。
また、この分野ではEntropikが消費者の認知的・感情的反応を測定することを専門としており、感情AI、行動AI、生成AI、予測AIの総合力を組み合わせたDecodeを通じて、消費者の行動や嗜好をよりよく理解し、より高度なサービスを提供することができます。Entropikは最近、SIG Venture CapitalやBessemer Venture Partnersなどの投資家から、2023年2月に2500万ドルのシリーズB資金調達ラウンドを完了した。
Entropik
この感情AIの分野では、それぞれの強みを持つテクノロジー専攻の選手も活躍している。
Microsoft Azure Cognitive ServicesのEmotion APIを含め、表情や感情を分析することで、写真や動画から喜び、怒り、悲しみ、驚きなど、さまざまな感情を認識することができます
IBMワトソンの自然言語理解APIは、大量のテキストデータを処理して、根底にある感情の傾向(肯定的、否定的、中立的など)を特定し、ユーザーの意図をより正確に解釈することができます;
。
GoogleのクラウドAI Cloud Vision APIは、画像内の感情表現を素早く特定できる強力な画像分析機能を持ち、テキスト認識と感情相関をサポートします。
AWSのRekognitionは、感情の検出、顔の特徴の認識、表情の変化の追跡も可能で、他のAWSサービスと組み合わせて、完全なソーシャルメディア分析や感情AIを活用したマーケティングアプリとして使用できます。
Cloud Vision API<
一部のスタートアップは、感情AIの領域でさらに速く動いており、テック大手が「ポシェット」しているほどだ。たとえば、ユニコーンInflection AIは、そのAI作業で投資家マイクロソフトに目をつけられている。例えば、ユニコーンInflection AIは、ビル・ゲイツ、エリック・シュミット、NVIDIAとともに13億ドルを投資したマイクロソフトから、AIの第一人者でInflection AIの共同設立者の一人であるムスタファ・スレイマンにオリーブの枝を投げられた。スレイマンは70人以上の従業員とともにマイクロソフトに移籍し、マイクロソフトはこのプロジェクトに約6億5000万ドルを支払った。
しかし、Inflection AIはすぐに再編成を行い、Google翻訳、AIコンサルティング、ARの経歴を持つ新しいチームを結成し、主力製品であるPi(ユーザーの感情を理解し反応するパーソナルアシスタント)の開発を継続した。Piは、ユーザーとの感情的なつながりを確立することに重点を置き、音声、テキスト、その他の入力を分析することで感情を感知し、会話の中で共感を示す。Inflection AIは、Piを単なるAIアシスタントではなく、コーチ、親友、聞き手、創造的なパートナーとして捉えている。加えて、Piは強力なメモリを持っており、相互作用の継続性を高め、経験をパーソナライズする方法として、ユーザーの複数の会話の履歴を記憶する。
抑揚AI Pi<
開発への道のり、懸念と疑問
感情的AIは、より人間的な人々との関わり方を約束する一方で、他のAI技術と同様に、その展開には懸念と疑問の両方が伴う。まず、感情AIは本当に人間の感情を正確に解釈できるのだろうか?理論的には、このテクノロジーは確かにサービスやデバイス、テクノロジーの体験をより豊かなものにすることができるが、現実的な観点から見ると、人間の感情は本質的に曖昧で主観的なものであり、2019年の時点で、一部の研究者はこのテクノロジーに疑問を呈していた。表情は人間の真の感情を確実に反映するものではないため、人間の表情や体の姿勢、イントネーションを理解するために、機械だけに頼ってシミュレーションを行うことはできないとしている。感情を理解するために、人間の表情、体の姿勢、イントネーションを模倣する機械だけに頼ることには限界がある。第二に、厳しい規制がAI開発への道の足かせとなっている。例えば、EUのAI法は、教育などの分野でのコンピュータビジョンによる感情検出システムの使用を禁止しており、そのため特定の感情AIソリューションの推進が制限される可能性がある。また、米国のイリノイ州は、許可なく生物学的根拠に基づくテストを禁止する法律を制定している。米国のイリノイ州やその他の州には、許可なく生体データを収集することを禁止する法律があり、感情AIに特定の技術を使用する前提を直接的に制限している。同時に、データのプライバシーと保護は重要な問題であり、感情AIは通常、データプライバシー要件の教育、健康、保険および他の分野で使用され、特に厳しいので、感情データのセキュリティと合法的な使用を確保するために、すべての感情AI企業が問題に直面する必要があります。
最後に、異なる文化圏の人々の間のコミュニケーションと感情の解釈は難しい問題であり、AIにとってはさらに試練である。 例えば、地域によって感情の理解や表現方法が異なるため、感情AIシステムの有効性と完全性に影響を与える可能性があり、さらに、感情AIは人種、性別、性別を扱う際に同じ課題に直面しない可能性がある。さらに、感情AIは人種、性別、性自認の偏りに対処する際にもかなりの困難に直面する可能性がある。
感情AIは、人間の労働力を削減する効率性だけでなく、人の心を読み取る思慮深さも約束してくれるが、本当に人間関係の万能ソリューションになり得るのだろうか。おそらく将来的には、AIの「読心術」が人間と機械、さらには人間の相互作用を覆すことになるのだろうが、少なくとも現時点では、人間の感情を真に理解し、それに応えるには、まだまだ人間の関与と慎重さが必要なのかもしれない。
ソース:
Uniphore、ヒューマン・マシン・インタラクション向けに4億ドルのユニファーマ資金調達を発表Uniphore Announces $400 Million Series E (Uniphore)
Hume AI Announces $50 Million Fundraise and EmpathicVoice Interface(Yahoo Finance)
あなたのパーソナルAI「Pi」を紹介(Inflection AI)
Hume AIが5000万ドルの資金調達と共感インターフェースを発表(Yahoo Finance)
「Emotion AI」はビジネスソフトウェアの次のトレンドになるかもしれないが、それは問題かもしれない(TechCrunch)<
EMERGING TECH RESEARCH Enterprise Saas Report(PitchBook)