摘要:Cypher-RI框架通過強化學(xué)習(xí)驅(qū)動的結(jié)構(gòu)感知推理,將自然語言到圖查詢的準確率提升至新高度,為企業(yè)級圖智能應(yīng)用奠定關(guān)鍵技術(shù)基礎(chǔ)。
在人工智能基礎(chǔ)設(shè)施層研究持續(xù)高速演進的2025年,圖數(shù)據(jù)智能查詢領(lǐng)域迎來里程碑式突破。創(chuàng)鄰科技攜手浙江大學(xué)聯(lián)合研發(fā)Cypher-RI大模型訓(xùn)練框架被全球人工智能領(lǐng)域最具影響力的頂級會議 NeurIPS 2025正式收錄,該成果首次實現(xiàn)了基于強化學(xué)習(xí)的圖模式感知(Schema-Aware)自然語言轉(zhuǎn)Cypher查詢生成,通過強化學(xué)習(xí)實現(xiàn)端到端自動優(yōu)化,在Cypher查詢生成任務(wù)上取得突破性表現(xiàn),在權(quán)威基準CypherBench上以7B參數(shù)規(guī)模模型達到69%的執(zhí)行準確率,超越GPT-4o 9.41個百分點,標志著圖數(shù)據(jù)庫智能查詢進入“結(jié)構(gòu)感知”新階段。
企業(yè)復(fù)雜關(guān)系分析場景面臨的長期挑戰(zhàn)
隨著數(shù)字化轉(zhuǎn)型的深入,企業(yè)數(shù)據(jù)規(guī)模爆炸式增長,復(fù)雜關(guān)系數(shù)據(jù)的價值挖掘愈發(fā)依賴圖數(shù)據(jù)庫。無論是金融反洗錢鏈路、社交網(wǎng)絡(luò)的關(guān)系傳播,還是生物信息中的蛋白質(zhì)交互,都天然呈現(xiàn)為圖結(jié)構(gòu)。圖數(shù)據(jù)庫成為洞察復(fù)雜關(guān)系的關(guān)鍵技術(shù)。
然而,關(guān)系數(shù)據(jù)的價值能否被真正釋放,往往取決于用戶是否能夠?qū)懗稣_、高效的圖查詢語句。以Cypher為代表的圖查詢語言雖然表達能力強大,但需要用戶深度理解圖模式(Schema)結(jié)構(gòu)、熟練掌握復(fù)雜語法規(guī)則,且具備精準的 “圖思維”——這使得普通業(yè)務(wù)人員難以直接操作,而依賴模板匹配、示例學(xué)習(xí)的傳統(tǒng)查詢生成技術(shù),在面對多類型點邊、復(fù)雜邏輯查詢、跨場景泛化等企業(yè)真實業(yè)務(wù)場景時,普遍存在 “結(jié)構(gòu)理解偏差”、“生成語句不可執(zhí)行”、“結(jié)果準確率低” 等問題,導(dǎo)致圖數(shù)據(jù)庫的強大能力難以轉(zhuǎn)化為實際業(yè)務(wù)價值,成為企業(yè)數(shù)字化轉(zhuǎn)型的 “隱形壁壘”。
CypherRI 突破何在:圖結(jié)構(gòu)理解與強化學(xué)習(xí)協(xié)同優(yōu)化
為破解上述行業(yè)痛點,創(chuàng)鄰科技聯(lián)合浙江大學(xué)突破性地提出 “圖模式感知 + 強化學(xué)習(xí)” 雙核心架構(gòu),構(gòu)建了全球首個能夠主動解析圖結(jié)構(gòu)、閉環(huán)優(yōu)化查詢生成的大模型訓(xùn)練框架Cypher-RI。該框架的核心創(chuàng)新在于實現(xiàn)了圖模式感知與生成過程的深度融合。與傳統(tǒng)僅依賴文本匹配的生成方式不同,CypherRI在理解自然語言問題的同時,能夠動態(tài)感知并主動篩選與問題真正相關(guān)的圖結(jié)構(gòu)信息,確保生成的Cypher語句在語法正確、結(jié)構(gòu)可執(zhí)行的基礎(chǔ)上,精準對應(yīng)業(yè)務(wù)意圖。
研究團隊創(chuàng)新性地引入強化學(xué)習(xí)框架,以查詢可執(zhí)行性與結(jié)果準確性作為獎勵信號,推動模型在訓(xùn)練中自主優(yōu)化推理路徑。這使得模型不僅能“模仿”已有查詢樣本,更學(xué)會:
辨識與問題相關(guān)的點邊類型與屬性
基于圖語義進行多步邏輯推理
生成健壯且可穩(wěn)定執(zhí)行的Cypher查詢語句
該方法從機制上解決了生成查詢與圖結(jié)構(gòu)脫節(jié)的關(guān)鍵痛點,大幅提升跨場景適用性與可靠性。
以小搏大:7B模型超越GPT-4o,樹立企業(yè)級部署新標桿
在權(quán)威評測基準 CypherBench 上,基于7B參數(shù)模型訓(xùn)練的Cypher-RI的表現(xiàn)顯著超越所有已公開模型,并以9.41個百分點的優(yōu)勢領(lǐng)先GPT-4o,刷新該任務(wù)SOTA(State-of-the-Art)記錄。
這一研究不僅從實踐上驗證了:只要配合合適的強化學(xué)習(xí)框架,小參數(shù)模型同樣能夠在高度專業(yè)的任務(wù)上取得世界級性能,更凸顯了其對企業(yè)客戶的多重價值:
成本可控:占用資源少、部署成本低,可私有化部署,避免云端大模型的高額API成本和數(shù)據(jù)安全風險
高效可靠:響應(yīng)速度快,支持高并發(fā)查詢,更好滿足企業(yè)實時分析與交互需求
優(yōu)化深度:訓(xùn)練成本低,可針對企業(yè)專屬數(shù)據(jù)進行持續(xù)訓(xùn)練與優(yōu)化,實現(xiàn)“專用化智能”
行業(yè)意義:定義圖技術(shù)與大模型融合的新范式
CypherRI 的推出讓業(yè)務(wù)人員能夠通過自然語言直接、準確地操作圖數(shù)據(jù),大幅降低分析門檻、是圖技術(shù)邁向“平民化”與“智能化”的關(guān)鍵一步。它不僅是查詢生成任務(wù)的SOTA,更揭示了大模型在結(jié)構(gòu)化數(shù)據(jù)交互中的演進方向:從“萬能語言接口”走向“認知增強專用智能體”。其強化學(xué)習(xí)架構(gòu)與模式感知設(shè)計為GraphRAG、圖增強推理、企業(yè)知識圖譜問答等下游應(yīng)用提供了可復(fù)用的技術(shù)內(nèi)核,推動圖技術(shù)從單一分析場景邁向體系化、工程化、可規(guī)?;钠髽I(yè)級AI基礎(chǔ)設(shè)施。
創(chuàng)鄰科技將持續(xù)深化“圖技術(shù)+大模型”的協(xié)同技術(shù)路線,聯(lián)合學(xué)術(shù)界與產(chǎn)業(yè)伙伴,拓展自動化圖分析、時序圖預(yù)測、跨模態(tài)圖理解等前沿方向,構(gòu)建可信、可控、可持續(xù)演進的數(shù)據(jù)智能新底座,賦能企業(yè)在新一輪AI變革中建立結(jié)構(gòu)性競爭優(yōu)勢。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: