8月24日,國內公測在好未來20周年直播活動中,首個數學上線CTO田密宣布好未來自研的千億數學領域千億級大模型MathGPT正式上線并開啟公測。即日起,大模用戶可通過官網申請注冊賬號免費試用體驗。開啟
今年5月,國內公測好未來曾公布正在進行自研數學大模型的首個數學上線研發,命名為MathGPT。千億MathGPT是大模面向全球數學愛好者和科研機構,以解題和講題算法為核心的開啟數學垂直領域的大模型,也是國內公測國內首個專為數學打造的大模型。
用戶使用MathGPT時,首個數學上線用文字或圖片方式上傳數學題,千億即可得到對話式的大模解答反饋,也可以通過“隨機來一題”的開啟按鈕,隨機生成數學題目并由系統給出解答。目前,MathGPT支持中文、英文版本的PC端和移動端體驗。
田密介紹,MathGPT匯集了好未來多年教育教研數據積累,專注于數學領域。千億級大模型的訓練、推理、部署框架,為模型賦予了強大能力。通過優質教育數據,實現題目計算、講解、問答等多任務持續訓練和有監督微調,呈現出卓越表現。此外,借助人類反饋對齊,還將進一步提升模型綜合素養。MathGPT在解題準確率、穩定性及用戶體驗方面均有明顯的優勢。
MathGPT官網顯示,MathGPT的數學計算能力已覆蓋小學、初中、高中的數學題,題目類型涵蓋計算題、應用題、代數題等多個類型,還可以針對題目進行追問,暫未開放數學之外的問答互動。
MathGPT技術報告
MathGPT技術報告顯示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數學和Math401等6個公開數學評測集合的測試結果中,好未來的MathGPT取得了多項測試的最高分數。同時,MathGPT在C-Eval的初高中的全科測試集合上也均有不錯的表現。
MathGPT在C-Eval榜單初高中各科成績
在解題穩定性、講解友好度方面,MathGPT基于海量名師解題過程的數據進行模型訓練,模型的解題步驟專業清晰。
以一道數列題為例,MathGPT給出的答案包含“分析”、“詳解”、“點睛”三個部分,比通用大模型的粗略講解方式更為細致,“分析”提供了題目的解題思路、思考方式,幫助用戶更好地理解題目,“詳解”則給出具體的計算方式和答案,最后“點睛”的環節,對題目的考點、難點、關鍵點進行提示,幫助用戶回顧反思出題意圖、舉一反三。
對于使用者而言,研究數學問題不僅在于得到答案本身,更在于答案背后的解題原理、思路邏輯。與其他通用大模型相比,MathGPT能實現更高準確度的解題,也能把答案解析得更清楚、講解得更明白,更好地滿足用戶使用AI產品解答數學問題的核心需求。
在MathGPT發布同時,好未來也在官網更新了一個具有代表性和挑戰性的數學任務評測集,供全球人工智能專家、數學愛好者體驗和測評。
田密表示,希望讓MathGPT在數學教育領域發揮更大作用,好未來愿意把基于大規模、高質量的內容的千億級大模型研發經驗方法和業內分享,和行業共同進步。
以MathGPT為基礎,好未來將不斷探索AI環境下的學習方式,更好地服務于全球的學習者、數學愛好者,并將經驗及時與行業分享,通過AI技術助力教育科技的積極改變。
隨著公測的進行,MathGPT的解題能力將得到持續提升。據田密介紹,基于MathGPT的產品級應用也正在加速研發中,將于近期發布。