華科大研發出具備出色「看圖說話」能力的人工智能「小猴子」

December 11, 2023
332 views

新京報訊(記者張建林)12月11日,記者從華中科技大學(以下簡稱「華科大」)獲悉,該校軟件學院白翔教授領銜的VLRLab團隊近日發佈了多模態大模型——「Monkey」(意為「猴子」)。該模型能夠實現對世界的「觀察」,對圖片進行精確描述。

多模態大模型是一種可以同時處理和整合多種感知數據(例如文本、圖像、音頻等)的AI架構,近年來在眾多場景中展現了驚人的能力。

團隊將Monkey代碼在全球最大的代碼託管服務平台GitHub上開源。華中科技大學供圖

據介紹,Monkey模型在18個數據集上的實驗中表... [969 chars]

Source: 新浪香港