校長ブログ

AI研究の発展ーマルチモーダルAI

2022.05.26 トレンド情報

5月26日

　AIの研究開発は日進月歩。人が五感を通じて周囲を理解するように、最近、画像、音声、文書など、様々なデータからレベルの高い判断ができる「マルチモーダルAI」が開発されました。

　KDDIや情報通信研究機構は、内閣府のプロジェクトの一環として、AIによる一人暮らしの高齢者見守りに関する研究を進めています。従来のAIは画像、音声、文書の分析だけでしたが、マルチモーダルAIは会話だけでなく、感情の変化も動画で読み取れることが強みです。また、体温を感じられるようになれば、新型コロナウイルスから高齢者を守ることができると期待されています。

　1950年代にスタートしたAI研究ですが、2012年頃から深層学習によってカメラの画像認識の精度がアップし、車の自動運転などが真実味を帯びてきました。そして今、人間の五感に近い感覚をもったマルチモーダルAIが誕生したのです。将来的には、会話の内容からAIが自動で記録したり、病院でどんな手術をしたかを動画で撮ったりすることも可能だそうです。現在、IBMとマサチューセッツ工科大学（MIT）が設立した「MIT-IBMワトソンAIラボ」が最先端のマルチモーダルAIの研究に取り組んでおり、その成果が待たれるところです。

　現行のAIは「特化型」と呼ばれ、まだまだ限界があるものの、囲碁の棋士を破るなど、特定の分野ではすでに実績をあげつつあります。2045年には「シンギュラリティ」を迎え、AIが人類の知能を超えると言われる昨今、マルチモーダルAIが新たな地平線を切り開こうとしているのは紛れもない事実なのです。

一覧へ戻る