極客網(wǎng)·人工智能6月23日 月之暗面 Kimi 近日對外宣布發(fā)布首個 Agent 產(chǎn)品 Kimi-Researcher (深度研究),并開始小范圍灰度測試。
Kimi-Researcher 是基于端到端自主強化學習 (end-to-end agentic RL) 技術(shù)訓練的新一代 Agent 模型,在 HLE 測試中,超過 Claude 4 Opus、Gemini 2.5 Pro 及 OpenAI Deep Research,與 Gemini-Pro 的 Deep Research Agent 打平。
從功能來看,無論用戶輸入的是 “分析中國新能源汽車產(chǎn)業(yè)政策與發(fā)展趨勢”,還是 “對比中美半導體行業(yè)法規(guī)差異”,Kimi-Researcher 都會自主規(guī)劃任務(wù)執(zhí)行流程,最終交付完整結(jié)果。
Kimi-Researcher 是一個零結(jié)構(gòu) Agent,沒有復雜的提示詞,也沒有預設(shè)流程。在動態(tài)的環(huán)境里,Kimi-Researcher 自己學會了如何思考:當信息沖突時,如何權(quán)衡判斷;面對任務(wù)節(jié)點,何時切換工具;哪些中間信息值得保留,哪些可以舍棄。模型的唯一驅(qū)動力,是任務(wù)本身是否被真正解決。
據(jù)其介紹,作為深度研究模型,Kimi-Researcher 引入大量數(shù)據(jù)來源,包括資訊新聞、行業(yè)報告、學術(shù)論文、專家觀點等,同時每條引用都能直接點擊追溯,擁有文獻嚴謹性,幫助告別幻覺。
月之暗面表示,Kimi-Researcher 基礎(chǔ)預訓練模型及強化學習后的模型將逐步開源,以推動 Agent 強化學習方向的探索。
就在今年2月,OpenAI 發(fā)布了一項名為 “Deep Research”(深度研究) 的新功能。通過這一功能,ChatGPT 能夠自主在互聯(lián)網(wǎng)上進行多步驟研究,以解決復雜任務(wù)。這意味著,用戶只需提出一個復雜問題,ChatGPT 便可以自動梳理出調(diào)研思路,分步驟在網(wǎng)絡(luò)上檢索信息、分析整理,并最終輸出一份詳實的調(diào)研報告。
OpenAI 稱,Deep Research 專為那些在金融、科學、政策和工程等領(lǐng)域從事高強度知識工作、需要進行深入、精確和可靠研究的人士打造。通過這一功能,用戶只需一次查詢,便可將復雜、耗時的網(wǎng)絡(luò)研究工作交給 AI 完成,從而節(jié)省大量寶貴時間。
從產(chǎn)品功能上看,月之暗面Kimi-Researcher或為對標OpenAI的Deep Research而生,以尋求在專業(yè)領(lǐng)域取得突破,且測試性能已超過OpenAI Deep Research。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )