據消息,揭示OpenAI近日發布了一項重要研究報告。秘密思報告指出,維鏈DeepSeek和Kimi兩家機構通過獨立研究,學習顯成效成功利用思維鏈學習方法,揭示在數學解題與編程挑戰中顯著提升了模型的秘密思綜合表現。
Kimi的維鏈研究員Flood Sung在隨后的發文中詳細闡述了這一發現。他提到,學習顯成效長思維鏈的揭示有效性在內部實驗中已經得到了驗證。在實際訓練過程中,秘密思研究人員發現模型的維鏈表現會隨著訓練的深入而不斷提升,并且token數也在不斷增加。學習顯成效這一現象表明,揭示在強化訓練的秘密思過程中,模型能夠自我涌現,維鏈進一步提升其解題能力。
值得注意的是,就在1月20日,DeepSeek和Kimi在同一天發布了各自的推理模型R1和k1.5。這兩款模型的發布,無疑是對其研究成果的進一步驗證和展示。
此次DeepSeek與Kimi的研究不僅揭示了o1的秘密,更為人工智能領域的發展帶來了新的啟示。思維鏈學習方法的成功應用,為提升AI模型的解題能力和編程能力提供了新的思路和方法。