动漫av一区二区在线观看-a片在线免费观看-国内精品久久久久影院一蜜桃-久久视频在线视频-人妻av中文字幕久久-无码av无码一区二区

首頁(yè) > 汽車(chē)生活 > 汽車(chē)生活 > OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

發(fā)布時(shí)間:2024-09-16 16:27:04

OpenAI 發(fā)布 o1-mini:更經(jīng)濟(jì)高效的推理模型

OpenAI 推出 o1-mini,一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型。o1-mini 在數(shù)學(xué)和編碼方面表現(xiàn)出色,接近 OpenAI o1 的水平,同時(shí)成本更低,速度更快。

一、o1-mini 簡(jiǎn)介

  • OpenAI o1-mini 是一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,尤其擅長(zhǎng)數(shù)學(xué)和編碼。
  • o1-mini 在 AIME 和 Codeforces 等評(píng)估基準(zhǔn)測(cè)試中接近 OpenAI o1 的性能。
  • o1-mini 比 OpenAI o1-preview 便宜 80%,并且延遲更低,速率限制更高。

二、o1-mini 的優(yōu)勢(shì)

  • STEM 領(lǐng)域推理能力強(qiáng) :o1-mini 經(jīng)過(guò)專(zhuān)門(mén)優(yōu)化,在 STEM 領(lǐng)域表現(xiàn)出色,尤其在數(shù)學(xué)和編碼方面。
  • 成本效益高 :o1-mini 比大型語(yǔ)言模型更小,因此運(yùn)行成本更低,更適合實(shí)際應(yīng)用。
  • 速度更快 :o1-mini 的響應(yīng)速度比大型語(yǔ)言模型更快,例如在單詞推理問(wèn)題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現(xiàn)

領(lǐng)域

基準(zhǔn)測(cè)試

o1-mini

o1-preview

o1

GPT-4o

數(shù)學(xué)

AIME

70.0%

44.6%

74.4%

-

編碼

Codeforces Elo

1650

1258

1673

-

STEM

GPQA (科學(xué))

更高

更低

-

更低

STEM

MATH-500

更高

-

-

更低

 

MMLU

-

-

-

更高

  • o1-mini 在 AIME 數(shù)學(xué)競(jìng)賽中取得了 70.0% 的成績(jī),與 o1 (74.4%) 相當(dāng),并優(yōu)于 o1-preview (44.6%)。
  • o1-mini 在 Codeforces 編碼競(jìng)賽中獲得了 1650 Elo 的評(píng)分,與 o1 (1673) 相當(dāng),并高于 o1-preview (1258)。
  • 在一些需要推理能力的學(xué)術(shù)基準(zhǔn)測(cè)試中,例如 GPQA (科學(xué)) 和 MATH-500,o1-mini 的表現(xiàn)優(yōu)于 GPT-4o。
  • 在人類(lèi)偏好評(píng)估中,o1-mini 在需要推理能力的領(lǐng)域優(yōu)于 GPT-4o,但在語(yǔ)言類(lèi)領(lǐng)域則不如 GPT-4o。

四、o1-mini 的安全性

  • o1-mini 采用與 o1-preview 相同的對(duì)齊和安全技術(shù)進(jìn)行訓(xùn)練。
  • 在內(nèi)部版本的 StrongREJECT 數(shù)據(jù)集上,o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標(biāo)

GPT-4o

o1-mini

對(duì)有害提示的拒絕率(標(biāo)準(zhǔn))

0.99

0.99

對(duì)有害提示的安全完成率(挑戰(zhàn):越獄和邊緣案例)

0.714

0.932

對(duì)良性邊緣案例的合規(guī)性(“不過(guò)度拒絕”)

0.91

0.923

Goodness@0.1 StrongREJECT 越獄評(píng)估

0.22

0.83

人工來(lái)源的越獄評(píng)估

0.77

0.95

五、o1-mini 的局限性

  • o1-mini 在非 STEM 主題(如日期、傳記和冷知識(shí))方面的知識(shí)儲(chǔ)備有限。

六、未來(lái)展望

  • OpenAI 將在未來(lái)版本中改進(jìn) o1-mini 在非 STEM 領(lǐng)域的知識(shí)儲(chǔ)備。
  • OpenAI 還將嘗試將 o1-mini 擴(kuò)展到其他模態(tài)和 STEM 以外的專(zhuān)業(yè)領(lǐng)域。

OpenAI o1-mini 是一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型,在數(shù)學(xué)和編碼方面表現(xiàn)出色。o1-mini 比大型語(yǔ)言模型更經(jīng)濟(jì)、更快,是需要推理能力但對(duì)世界知識(shí)要求不高的應(yīng)用的理想選擇。

來(lái)源:

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

 

LibreOffice 24.8.1 發(fā)布,注重隱私保護(hù)的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發(fā)布! 這是 LibreOffice 24.8 系列的第一個(gè)次要版本 ,適用于 Windows(Intel、AMD 和 ARM)、macOS(Apple 和 Intel)和 Linux。

主要特點(diǎn)

  • 注重隱私: LibreOffice 24.8 系列專(zhuān)為注重隱私的辦公套件用戶而優(yōu)化,他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰(shuí)共享他們創(chuàng)建的內(nèi)容。
  • 功能豐富: LibreOffice 提供了一系列界面選項(xiàng),以適應(yīng)不同的用戶習(xí)慣,從傳統(tǒng)到現(xiàn)代,并通過(guò)優(yōu)化桌 面上的可用空間,最大限度地利用不同的屏幕尺寸,只需點(diǎn)擊一兩次即可實(shí)現(xiàn)最多的功能。
  • 完全互操作性: LibreOffice 基于 LibreOffice 技術(shù)引擎,可提供更好的用戶體驗(yàn),并生成基于兩種可用 ISO 標(biāo)準(zhǔn)的相同且完全可互操作的文檔:開(kāi)放文檔格式 (ODT、ODS 和 ODP) 和專(zhuān)有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
  • 企業(yè)級(jí)支持: TDF 強(qiáng)烈推薦生態(tài)系統(tǒng)合作伙伴提供的 LibreOffice Enterprise 系列應(yīng)用程序,適用于桌面、移動(dòng)和云,具有廣泛的專(zhuān)用增值功能和其他優(yōu)勢(shì),例如 SLA。

汽車(chē)生活更多>>

2025年山東大學(xué)齊魯醫(yī)院事業(yè)編招聘啟事 2024年遵義醫(yī)科大學(xué)第二附屬醫(yī)院招聘(非編制)工作人員方案 2024年海口市美蘭區(qū)和平南街道辦事處關(guān)于擬招聘公益性崗位工作人員的公告(2人) 2024年湖北鐵道運(yùn)輸職業(yè)學(xué)院(武漢鐵路技師學(xué)院)專(zhuān)項(xiàng)招聘工作人員公告(4人) 2024年中國(guó)中醫(yī)科學(xué)院廣安門(mén)醫(yī)院招聘公告 價(jià)格下探至25萬(wàn)元以內(nèi)?比亞迪夏前景展望 7月豪華中級(jí)車(chē)終端銷(xiāo)量:奔馳C級(jí)月銷(xiāo)13838輛領(lǐng)跑 官方一口價(jià)低至7.99萬(wàn)元起 途岳新銳要和新能源搶市場(chǎng) 并入上汽大眾銷(xiāo)售網(wǎng)絡(luò) 斯柯達(dá)在中國(guó)還有希望嗎 10.99萬(wàn)元起,全系518km續(xù)航,東風(fēng)風(fēng)神L7 EV有點(diǎn)給力! 預(yù)售11.98萬(wàn)元起,最高650km續(xù)航+激光雷達(dá),AION RT來(lái)了 評(píng)凱迪拉克全新XT5:價(jià)格殺紅眼的同時(shí),還不忘“玩豪華”? 主打就是聽(tīng)勸!2025款比亞迪漢全面升級(jí),僅售16.58萬(wàn)元起 2024年鷹潭市月湖區(qū)部分區(qū)直事業(yè)單位選調(diào)工作人員公告 2024年撫州市資溪縣事業(yè)單位引進(jìn)高素質(zhì)人才公告 2024年南昌市第一醫(yī)院臨床護(hù)士及部分技師崗位招聘公告 2024年南昌市勞動(dòng)保障事務(wù)代理中心招聘工作人員公告 2024年吉安市青原區(qū)人民醫(yī)院(總醫(yī)院) 招聘公告 2024年南昌經(jīng)濟(jì)技術(shù)開(kāi)區(qū)人民醫(yī)院耳鼻喉科醫(yī)生招聘公告 2024年江西中醫(yī)藥大學(xué)高層次人才招聘公告 2024年吉安市永豐縣某單位招聘派遣員工公告 增程車(chē)型升級(jí)智慧新藍(lán)鯨3.0,長(zhǎng)安啟源全新A07真心版將于18日上市 10月18日上市!增程/純電可選,配置升級(jí),長(zhǎng)安啟源A07真香版 車(chē)長(zhǎng)4988毫米,配2.0T+8AT,降至14.78萬(wàn),家用可以看這款B級(jí)車(chē) 配33英寸中控屏,237馬力,降至21.97萬(wàn),家用可看這款豪華B級(jí)車(chē) 奧運(yùn)選手黃雅瓊成問(wèn)界新M7 Pro車(chē)主,新車(chē)究竟有何吸引力? 配置升級(jí)價(jià)格更香 2025款深藍(lán)SL03上市 售11.99-14.69萬(wàn) 無(wú)懼國(guó)境線復(fù)雜路況考驗(yàn) 問(wèn)界新M7國(guó)慶期間持續(xù)熱銷(xiāo) 奇瑞艾瑞澤8高能版新車(chē)上市 12.99萬(wàn)起 新增瑪瑙紅配色 雷克薩斯 RX 銷(xiāo)量大跌,低至 33 萬(wàn)且新增 2.0T+8AT,是否值的入?
主站蜘蛛池模板: 成人做爰视频www网站小优视频| 天天摸天天碰天天添| 亚洲毛片不卡av在线播放一区| 无码人妻一区、二区、三区免费视频| 白丝喷水一区| 国产vr一区二区在线观看| 亚洲中文字幕日产无码| 四虎成人精品无码永久在线 | 高清无码爆乳潮喷在线观看| 未满十八18禁止免费无码网站| 欧美毛片无码又大又粗黑寡妇| 久久久无码人妻精品一区| 国产真实露脸乱子伦原著| 天堂网www在线资源网| 搡老女人老妇女老熟妇| 男人添女人囗交做爰视频| 久久丫精品国产| 国产成人亚洲综合无码8| 国产情侣2020免费视频| 在线观看无码av网站永久| 久久久久久久香蕉国产30分钟| 尤物国产天| 国产成人一区二区三区免费视频| 久久精品人人做人人综合试看| av无码a在线观看| 久久久久成人精品无码| 十八岁以下禁止观看黄下载链接 | 久久国产劲爆∧v内射-百度| 免费大片黄国产在线观看| 久久婷婷日日澡天天添| 2021国产精品午夜久久| 成人午夜免费无码区| 又黄又爽又色又刺激的视频| 午夜神马影院| 亚洲一卡2卡三卡| 91影视永久| 天堂岛国av无码免费无禁网站| 国产精品妇女一二三区| 欧美videos另类极品| 国产a∨国片精品白丝美女视频| 国产蝌蚪视频在线观看|