菠萝蜜视频在线观看国际|成免费CRM大全下载情趣直播|国产精品看高国产精品不卡|国产美女视频一区二区三区|成人酒吧2|日产无人区一线二线三线HAV|中文字幕久久波多野结衣av不卡

您的位置:首頁(yè) >正文

【獨(dú)家】蘋果探索自研多模態(tài)AI模型Manzano


(資料圖片)

據(jù)悉,蘋果正在研發(fā)名為Manzano的新圖像模型,旨在兼具圖像理解和圖像生成能力。目前Manzano尚未發(fā)布,僅有一篇預(yù)印本論文和部分低分辨率圖像樣例。蘋果表示,大多數(shù)開(kāi)源模型在圖像處理上存在取舍,而Manzano采用混合圖像分詞器,其共享編碼器可輸出連續(xù)標(biāo)記和離散標(biāo)記,減少任務(wù)沖突。Manzano整體架構(gòu)包括混合分詞器、統(tǒng)一語(yǔ)言模型和獨(dú)立圖像解碼器,解碼器有三個(gè)版本,支持不同分辨率。訓(xùn)練使用大量圖像文本樣本,內(nèi)部測(cè)試顯示其在文字密集型任務(wù)中表現(xiàn)優(yōu)異,性能隨規(guī)模提升而改善。蘋果認(rèn)為Manzano是有力替代方案,但目前其基礎(chǔ)模型仍落后于行業(yè)領(lǐng)先者,未來(lái)版本需進(jìn)一步驗(yàn)證。

關(guān)鍵詞: 解碼器 編碼器 圖像處理 ai模型 蘋果公司 知名企業(yè) 圖像生成基礎(chǔ)模型

相關(guān)內(nèi)容

熱門資訊