曰本黄色录像_天天摸天天干天天操_欧美午夜精品_欧美国产综合_精品久久久久一区二区国产_亚洲欧美久久精品1区2区

首頁 > 汽車生活 > 汽車生活 > 復(fù)雜推理大模型OpenAI o1亮相,數(shù)學(xué)與代碼能力飛躍

復(fù)雜推理大模型OpenAI o1亮相,數(shù)學(xué)與代碼能力飛躍

發(fā)布時(shí)間:2024-09-16 16:25:38

平安證券近日發(fā)布AI動態(tài)跟蹤系列(三):復(fù)雜推理大模型OpenAI o1亮相,數(shù)學(xué)與代碼能力飛躍。

以下為研究報(bào)告摘要:

9月13日,OpenAI正式發(fā)布并上線o1系列模型o1-preview和o1-mini。

平安觀點(diǎn):

OpenAI計(jì)數(shù)器重置回1,o1系列開啟復(fù)雜推理序幕。本次OpenAI發(fā)布的是o1-preview(預(yù)覽版)和o1-mini(擅長STEM、更快、更便宜)兩個(gè)版本,ChatGPT付費(fèi)用戶和API用戶可以使用。根據(jù)OpenAI官網(wǎng)介紹,o1系列被定位為用于解決難題的推理模型。對于復(fù)雜的推理任務(wù)來說,OpenAI認(rèn)為o1是一個(gè)重大進(jìn)步,代表了AI能力的新水平,鑒于此,OpenAI將計(jì)數(shù)器重置回1并將此系列模型命名為OpenAI o1。OpenAI研究發(fā)現(xiàn),隨著強(qiáng)化學(xué)習(xí)(訓(xùn)練時(shí)計(jì)算)和思考時(shí)間(測試時(shí)計(jì)算)的增加,o1的性能會不斷提高。因此在體驗(yàn)上,與此前模型不同點(diǎn)在于,OpenAIo1在作出反應(yīng)之前,需要像人類一樣,花更多時(shí)間思考問題。

o1基準(zhǔn)表現(xiàn)明顯優(yōu)于GPT-4o,數(shù)學(xué)與編碼能力實(shí)現(xiàn)飛躍。OpenAI實(shí)驗(yàn)結(jié)果表明,在絕大多數(shù)推理任務(wù)中,o1的表現(xiàn)明顯優(yōu)于GPT-4o。尤其是在具有挑戰(zhàn)性的推理基準(zhǔn)上,o1實(shí)現(xiàn)了能力飛躍,1)數(shù)學(xué)能力:在美國數(shù)學(xué)奧林匹克(AIME2024)預(yù)選賽題目中,GPT-4o平均只能解決12%的問題,o1正式版達(dá)到平均74%的準(zhǔn)確率,在使用學(xué)習(xí)評分函數(shù)重新排名1000個(gè)樣本后準(zhǔn)確率達(dá)到93%,相當(dāng)于美國排名前500的學(xué)生水平。2)編碼能力:在競爭性編程問題(Codeforces)比賽中,o1-preview、o1分別超越了62%、89%的人類競爭者,而對比GPT-4o僅超過11%。3)特定專業(yè)領(lǐng)域能力:GPQA diamond測試(專門用于評估模型在化學(xué)、物理和生物學(xué)等領(lǐng)域的專業(yè)知識水平)中,o1不僅成功完成了測試,更是超越了人類專家的表現(xiàn),成為首個(gè)在GPQA diamond基準(zhǔn)上擊敗人類專家的AI模型。

o1引入思維鏈優(yōu)化邏輯推理,助力模型性能與安全提升。o1優(yōu)越能力的背后,核心突破在于運(yùn)用思維鏈(chain of thought)方法來處理復(fù)雜任務(wù),OpenAI介紹到,類似于人類在回答困難問題之前可能會思考很長時(shí)間,o1在嘗試解決問題時(shí)會使用思維鏈。通過強(qiáng)化學(xué)習(xí),o1學(xué)會打磨其思維鏈并改進(jìn)它所使用的策略。o1學(xué)會了識別和糾正錯(cuò)誤,學(xué)會了將棘手的步驟分解為更簡單的步驟,學(xué)會了在當(dāng)前方法不起作用時(shí)嘗試不同的方法,此過程顯著提高了模型的推理能力。在OpenAI的一個(gè)官方演示中展示了o1-preview解答復(fù)雜問題的邏輯推理過程,o1-preview在過程中逐步顯示思考、翻譯問題、定義變量、理解問題、構(gòu)建方程、解方程等與人類推理相似的步驟,最終輸出結(jié)論。同時(shí),OpenAI認(rèn)為思維鏈推理也為大模型安全性的提升提供了新思路,o1-preview在關(guān)鍵越獄評估和用于評估模型安全拒絕邊界的最嚴(yán)格內(nèi)部基準(zhǔn)上取得了顯著的改進(jìn)。

投資建議:OpenAI推出專攻難題的o1系列大模型,應(yīng)對復(fù)雜推理任務(wù),o1引入思維鏈(Chain of Thought)提升邏輯推理能力,絕大多數(shù)基準(zhǔn)表現(xiàn)不僅明顯超越GPT-4o,而且在數(shù)學(xué)與編碼能力上實(shí)現(xiàn)了重要飛躍,在理化生等專業(yè)領(lǐng)域的知識水平也達(dá)到新高度。OpenAI的動向始終引領(lǐng)全球大模型的發(fā)展,我們認(rèn)為o1的正式亮相有望開啟復(fù)雜推理大模型的序幕,一方面對算力提出了更大需求,同時(shí)也將賦能下游AI應(yīng)用(如編程、教育)的快速迭代。我們堅(jiān)定看好AI主題的投資機(jī)會:1)算力方面,推薦工業(yè)富聯(lián)、浪潮信息、中科曙光、紫光股份、神州數(shù)碼、海光信息、龍芯中科,建議關(guān)注寒武紀(jì)、景嘉微、軟通動力;2)算法方面,推薦科大訊飛;3)應(yīng)用場景方面,強(qiáng)烈推薦中科創(chuàng)達(dá)、恒生電子、盛視科技,推薦金山辦公,建議關(guān)注萬興科技、福昕軟件、同花順、彩訊股份;4)網(wǎng)絡(luò)安全方面,強(qiáng)烈推薦啟明星辰。

汽車生活更多>>

2025年山東大學(xué)齊魯醫(yī)院事業(yè)編招聘啟事 2024年遵義醫(yī)科大學(xué)第二附屬醫(yī)院招聘(非編制)工作人員方案 2024年海口市美蘭區(qū)和平南街道辦事處關(guān)于擬招聘公益性崗位工作人員的公告(2人) 2024年湖北鐵道運(yùn)輸職業(yè)學(xué)院(武漢鐵路技師學(xué)院)專項(xiàng)招聘工作人員公告(4人) 2024年中國中醫(yī)科學(xué)院廣安門醫(yī)院招聘公告 價(jià)格下探至25萬元以內(nèi)?比亞迪夏前景展望 7月豪華中級車終端銷量:奔馳C級月銷13838輛領(lǐng)跑 官方一口價(jià)低至7.99萬元起 途岳新銳要和新能源搶市場 并入上汽大眾銷售網(wǎng)絡(luò) 斯柯達(dá)在中國還有希望嗎 10.99萬元起,全系518km續(xù)航,東風(fēng)風(fēng)神L7 EV有點(diǎn)給力! 預(yù)售11.98萬元起,最高650km續(xù)航+激光雷達(dá),AION RT來了 評凱迪拉克全新XT5:價(jià)格殺紅眼的同時(shí),還不忘“玩豪華”? 主打就是聽勸!2025款比亞迪漢全面升級,僅售16.58萬元起 2024年鷹潭市月湖區(qū)部分區(qū)直事業(yè)單位選調(diào)工作人員公告 2024年撫州市資溪縣事業(yè)單位引進(jìn)高素質(zhì)人才公告 2024年南昌市第一醫(yī)院臨床護(hù)士及部分技師崗位招聘公告 2024年南昌市勞動保障事務(wù)代理中心招聘工作人員公告 2024年吉安市青原區(qū)人民醫(yī)院(總醫(yī)院) 招聘公告 2024年南昌經(jīng)濟(jì)技術(shù)開區(qū)人民醫(yī)院耳鼻喉科醫(yī)生招聘公告 2024年江西中醫(yī)藥大學(xué)高層次人才招聘公告 2024年吉安市永豐縣某單位招聘派遣員工公告 增程車型升級智慧新藍(lán)鯨3.0,長安啟源全新A07真心版將于18日上市 10月18日上市!增程/純電可選,配置升級,長安啟源A07真香版 車長4988毫米,配2.0T+8AT,降至14.78萬,家用可以看這款B級車 配33英寸中控屏,237馬力,降至21.97萬,家用可看這款豪華B級車 奧運(yùn)選手黃雅瓊成問界新M7 Pro車主,新車究竟有何吸引力? 配置升級價(jià)格更香 2025款深藍(lán)SL03上市 售11.99-14.69萬 無懼國境線復(fù)雜路況考驗(yàn) 問界新M7國慶期間持續(xù)熱銷 奇瑞艾瑞澤8高能版新車上市 12.99萬起 新增瑪瑙紅配色 雷克薩斯 RX 銷量大跌,低至 33 萬且新增 2.0T+8AT,是否值的入?
主站蜘蛛池模板: jizzjizzjizz亚洲女 | 男女啪啪免费视频 | 日韩日日夜夜 | 日本不卡免费新一二三区 | 亚洲天天更新 | 精品一区二区视频 | 看特级毛片 | 欧美成人精品激情在线观看 | 国产精品成在线观看 | 6080yy精品一区二区三区 | 成年人色网站 | 久久久久琪琪免费影院 | 26uuu欧美视频在线观看 | 日日夜夜精品视频 | 欧美精品国产精品 | 天干天夜啪天天碰 | 草草免费观看视频在线 | 婷婷尹人香蕉久久天堂 | 国产一区二区三区免费观看 | 国产精品美女久久久免费 | 蜜桃传媒一区二区亚洲AV | 91精品久久久久久久久久入口 | 日韩欧美亚洲一区 | 奇米色777欧美一区二区 | 日韩久久精品 | 日韩精品在线视频 | 日韩欧美中文在线 | 女女女女bbbbbb毛片在线 | 免费无码毛片一区二区A片 成人18网站 | 91在线品视觉盛宴免费 | 91精品观看91久久久久久 | 久久美女| 黄色网址免费入口 | 欧美特级| xifan在线a精品一区二区视频网站 | 亚洲男人的天堂网站 | 久久国产高清 | 成年人在线观看视频网站 | 夜夜久久 | 一级一片免费看 | 亚洲九九 |