3月28日 #76「クロスモーダルAI」

音声や映像から人の意図や状況を理解し、人に分かりやすく伝える技術「クロスモーダルAI」。部屋や物に備わった人工知能が人の声や表情を認識し、その場に最適な情報を提供してくれる。

<主な機能>
・音声認識
オフィスでの会議で、つぶやいた内容をテキスト化したり、キーワードをビジュアル化して空中に表示、参加者みんなで情報共有ができる。

・音声書き起こし
講演や会議などで録音された音声データをテキスト化し、インタビューの文字起こしや議事録を作成。言い間違いなどの校正もしてくれる。

・同時通訳
話していることをリアルタイム翻訳。テキスト化して空中に表示する。

・画像認識
携帯カメラで写した画像を解析し、その画像の被写体に関する情報を教えてくれる。