明略科技研究成果被ACM MM 2025接收,攻克個性化注視點預(yù)測難題
時間:2025-07-12 14:09:26 出處:綜合閱讀(143)
近日,明略明略科技與北京大學(xué)、科技吉林大學(xué)合作的研究預(yù)測最新研究成果《PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction》被ACM MM 2025正式接收。該研究為解決現(xiàn)有視覺注意力模型在個性化注視點預(yù)測中的成果局限性,提出了一種新的接收方法(PRE-MAP)和一個大規(guī)模多模態(tài)數(shù)據(jù)集(SPA-ADV),以更好地捕捉個體差異并提高高分辨率視頻中的攻克個性多屬性注視點預(yù)測精度。
ACM MM 2025(ACM International Conference on 化注Multimedia)計劃將于2025年10月27—31日在愛爾蘭都柏林舉辦。該會議由國際計算機(jī)學(xué)會(ACM)主辦,視點是難題全球多媒體技術(shù)領(lǐng)域的旗艦會議,同時也是明略中國計算機(jī)學(xué)會(CCF)推薦的A類國際學(xué)術(shù)會議。
論文標(biāo)題: PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction
(中文標(biāo)題:PRE-MAP:用于高分辨率多屬性注視點預(yù)測的科技個性化眼動追蹤多模態(tài)大語言模型)
論文作者:吳寒冰*、姜平*、研究預(yù)測蘇安煬*、成果趙晨旭、接收傅天宇、攻克個性吳明輝、譚北平、李慧盈(*為共同第一作者)
研究成果簡述:
1. 直擊行業(yè)核心痛點
在當(dāng)今的數(shù)字廣告領(lǐng)域,理解消費者的目光焦點至關(guān)重要。然而,不同背景的觀眾(如年齡、性別各異)在觀看同一視頻廣告時,其注意力分布也大相徑庭,傳統(tǒng)技術(shù)卻無法捕捉這種個性化差異。傳統(tǒng)的顯著性預(yù)測模型通常采用分割方法,依賴于降采樣的低分辨率圖像來生成顯著性熱圖,隨后將其放大到原生分辨率,這限制了它們捕捉個性化注意力模式的能力。
2. 構(gòu)建高質(zhì)量數(shù)據(jù)底座
為攻克這一難題,研究團(tuán)隊開創(chuàng)性地建立了業(yè)界領(lǐng)先的大規(guī)模個性化注視行為數(shù)據(jù)集(SPA-ADV),首次記錄了超過4500名不同年齡與性別背景用戶的真實視覺行為。該數(shù)據(jù)集提供精確的個體級注視點坐標(biāo),為個性化顯著性建模提供了高質(zhì)量的基準(zhǔn)數(shù)據(jù)支持。
3. 研發(fā)高精度預(yù)測模型
基于此數(shù)據(jù)集,團(tuán)隊研發(fā)了PRE-MAP創(chuàng)新AI預(yù)測模型。該模型能結(jié)合用戶的個人特征,利用最前沿的多模態(tài)大模型技術(shù),增強(qiáng)模型的泛化能力和個性化預(yù)測效果,精準(zhǔn)預(yù)測出“某一類人會看哪里”。有效解決現(xiàn)有AI模型預(yù)測不準(zhǔn)、難以聚焦個性化熱點的問題,幫助品牌方和廣告商更科學(xué)地優(yōu)化廣告創(chuàng)意、評估投放效果,實現(xiàn)真正的“精準(zhǔn)觸達(dá)”。
明略的多模態(tài)實踐:從腦電到眼動,補(bǔ)齊廣告預(yù)測模型的關(guān)鍵拼圖
此次成果并非孤立的突破,而是明略科技在多模態(tài)領(lǐng)域長期且深度耕耘的必然結(jié)果,彰顯了公司在前沿AI技術(shù)探索與大模型應(yīng)用落地上的前瞻性布局:
早在2023年,明略科技率先成為國內(nèi)首家基于多模態(tài)大語言模型(MLLM)實現(xiàn)智能社交媒體內(nèi)容分析和策略生成的企業(yè),首度將多模態(tài)大語言模型(MLLM)應(yīng)用于識別并預(yù)測能帶來最佳營銷效果的多樣化內(nèi)容類型,開辟了廣告領(lǐng)域全新的多模態(tài)技術(shù)應(yīng)用賽道。
2024年,明略科技推出超圖多模態(tài)大型語言模型(HMLLM),進(jìn)一步整合了腦電等非標(biāo)模態(tài)數(shù)據(jù),支持企業(yè)對廣告素材中的實體、情緒、效果、場景及受眾等多樣化元素進(jìn)行深度分析,從而提升營銷效果,生成預(yù)測效果良好的有效營銷內(nèi)容,并為企業(yè)視頻廣告提供多維度優(yōu)化建議。超圖多模態(tài)大型語言模型(HMLLM)的相關(guān)成果曾榮獲ACM MM 2024最佳論文提名。
今年6月,基于自研的超圖多模態(tài)大型語言模型(HMLLM),協(xié)同混合專家(MoE)模型,明略科技再推創(chuàng)新成果——AI驅(qū)動的全球化廣告測試及優(yōu)化平臺AdEff。該平臺專為全球廣告創(chuàng)意測量打造,可快速、準(zhǔn)確預(yù)測消費者對廣告的主觀反應(yīng)和廣告效果,并給出優(yōu)化建議。在測試效率大幅提升的同時,顯著降低廣告測試成本,讓企業(yè)有機(jī)會對每一支廣告進(jìn)行測試,在 “創(chuàng)意感性” 與 “商業(yè)理性” 之間找到平衡。
直至7月本次研究成果被接收,標(biāo)志著明略科技在多模態(tài)學(xué)習(xí)這一人工智能前沿方向取得了又一突破性進(jìn)展,補(bǔ)齊了廣告預(yù)測模型中“用戶個性化視點追蹤”這一關(guān)鍵拼圖。它既是推動廣告預(yù)測模型高質(zhì)量發(fā)展的重要一環(huán),也昭示著機(jī)器理解人類感知的精度即將邁上新的臺階。
在數(shù)字化內(nèi)容日益碎片化的今天,AI驅(qū)動的科學(xué)預(yù)測已成為提升內(nèi)容觸達(dá)效率的關(guān)鍵引擎。明略科技在多模態(tài)學(xué)習(xí)領(lǐng)域的系統(tǒng)性實踐,將在品效提升、成本優(yōu)化和內(nèi)容創(chuàng)新層面展現(xiàn)出廣闊的應(yīng)用價值。
立足于此,明略科技的視野不止于多模態(tài)領(lǐng)域的深耕。未來,公司將會面向更廣闊的AI大模型及Agent技術(shù)領(lǐng)域持續(xù)探索,致力于把前沿科研成果轉(zhuǎn)化為強(qiáng)大的產(chǎn)業(yè)動能,驅(qū)動廣告營銷乃至更多行業(yè)的智能化升級,為構(gòu)建高效、智能的技術(shù)生態(tài)貢獻(xiàn)力量。
明略科技ACMAI 新浪科技公眾號“掌”握科技鮮聞 (微信搜索techsina或掃描左側(cè)二維碼關(guān)注)
相關(guān)新聞