
喜來順財(cái)經(jīng)報(bào)道,今天凌晨3點(diǎn),微軟在官網(wǎng)開源了多模態(tài)AI Agent基礎(chǔ)模型——Magma。與傳統(tǒng)Agent相比,Magma具備跨數(shù)字、物理世界的多模態(tài)能力,能自動(dòng)處理圖像、視頻、文本等不同類型數(shù)據(jù),例如,你可以用Magma來自動(dòng)下電商訂單、查詢天氣;也可以自動(dòng)操作實(shí)體機(jī)器人,或者下真實(shí)象棋時(shí)獲得幫助。此外,Magma還能內(nèi)置了心理預(yù)測功能,增強(qiáng)了對(duì)未來視頻幀中時(shí)空動(dòng)態(tài)的理解能力,能夠準(zhǔn)確推測視頻中人物或物體的意圖和未來行為。