九九热视频在线观看,樱花草在线社区www中文,亚洲国产激情五月色丁香小说,天堂中文最新版,中文字幕一区二区三区日韩精品


 

清華學(xué)霸與AI比做高考壓軸題,誰會贏?
發(fā)布時間:2025-05-28 17:49:50 文章來源:第一財經(jīng)
2025文化強國建設(shè)高峰論壇構(gòu)建中國哲學(xué)社會科學(xué)自主知識體系論壇27日在廣東深圳舉辦。來自有關(guān)黨政部門、高等院校、科研單位、智庫機構(gòu)的負

去年,“9.11和9.9誰大?”這一簡單的數(shù)學(xué)題曾難倒了多家大模型。到了今年,大模型的理科能力提升如何?

今日網(wǎng)易有道發(fā)布了一則視頻,6位清華姚班學(xué)生與AI比賽做高考壓軸題。清華姚班為圖靈獎得主姚期智院士創(chuàng)辦,匯聚了數(shù)學(xué)、物理、信息學(xué)競賽金牌得主。

姚班學(xué)生和AI競速的兩道題分別為2023年高考數(shù)學(xué)全國一卷壓軸題和2021年高考物理江蘇卷壓軸題。姚班學(xué)生在10分鐘內(nèi)完成了作答,僅有1位同學(xué)做錯了題目,AI答疑筆則在輸入確認后幾秒就開始輸出步驟,并答對了題目。

對于AI的回答,一位姚班學(xué)生認為AI做題思路與其一致,步驟更加清晰,相較于傳統(tǒng)的答案更有利于學(xué)生理解解題思路。

可以對比的是,去年高考結(jié)束后,有機構(gòu)讓包括GPT-4o、豆包、文心4.0在內(nèi)的9家大模型嘗試河南的高考卷,并以河南的分?jǐn)?shù)線評判,最終有4家大模型在文科高考中達到河南的一本線,但沒有大模型的理科分?jǐn)?shù)達到河南省一本線。

有道相關(guān)負責(zé)人對記者表示,今年以來AI進展迅速,尤其是DeepSeek-R1帶來了推理模型大爆發(fā),而大模型推理能力和交互能力在教育場景的適配性非常高,能夠逐步解決個性化教學(xué)和答疑的需求,而且提供的指導(dǎo)和答疑質(zhì)量越來越高,所以選擇與高考頂尖學(xué)霸進行同題測試,用一種直接明了的方式向大眾展示AI大模型能力的提升。

在題型選擇上,主要基于難度和認知度的考量,上述負責(zé)人表示,“因為大家對高考的難度都是有概念的,尤其是這種高難度的理科壓軸題,容易引起關(guān)注,也能直觀展示效果。”

上述人士透露,前段時間還做了北京最新高考二模(題庫數(shù)據(jù)里沒有的新題)的挑戰(zhàn)。AI答題后由老師進行批改,分?jǐn)?shù)為697分(總分750分),達到“清北”水平。“畢竟去年AI集體做24年高考題的時候理科幾乎全軍覆滅。”

過去一年時間,不少大模型公司將數(shù)學(xué)能力作為大模型的能力體現(xiàn)。OpenAI在介紹OpenAI o3-mini時表示,OpenAI o3?mini 的高推理能力在 FrontierMath 上的表現(xiàn)優(yōu)于其前輩。在 FrontierMath 上,當(dāng)被要求使用 Python 工具時,具有高推理能力的 o3?mini 首次嘗試即可解決超過 32% 的問題,其中包括超過 28% 的挑戰(zhàn)性 (T3) 問題。FrontierMath是由Epoch AI聯(lián)合60余位全世界的數(shù)學(xué)家共同推出了全新的數(shù)學(xué)基準(zhǔn),其原創(chuàng)的數(shù)學(xué)問題對于專業(yè)數(shù)學(xué)家而言仍需數(shù)小時甚至數(shù)日解決。不過,OpenAI公布的成績后續(xù)曾遭到質(zhì)疑。

此前谷歌宣布推出了基于強化學(xué)習(xí)的數(shù)學(xué)推理系統(tǒng) AlphaProof,以及幾何求解系統(tǒng)的改進版 AlphaGeometry 2。谷歌表示這兩款系統(tǒng)共同解決了2024年國際數(shù)學(xué)奧林匹克(IMO) 六道題目中的四道,首次達到了與銀牌得主相當(dāng)?shù)乃健?/p>

今年4月29日,阿里巴巴發(fā)布新一代通義千問模型Qwen3。據(jù)了解,在奧數(shù)水平的AIME25測評中,千問3斬獲81.5分,刷新開源紀(jì)錄。

艾媒咨詢發(fā)布的《2024年人工智能+教育行業(yè)發(fā)展研究報告》指出,2023至2027年在線教育市場的AI貢獻率預(yù)計從7%提升至16%左右。

關(guān)鍵詞:

最近更新

熱門推薦HOT

  • 百余家醫(yī)械企業(yè)齊聚云南彌渡 共拓國際醫(yī)療新市場
    百余家醫(yī)械企業(yè)齊聚云南彌渡 共

    樣本采集設(shè)備、血液凈化設(shè)備、急救監(jiān)護設(shè)備……26日,117家國內(nèi)外醫(yī)療器械設(shè)備和耗材研發(fā)、生產(chǎn)、經(jīng)營企業(yè)齊聚云南省大理白族自治州彌渡縣

  • 夏季護膚做好防曬是關(guān)鍵 專家教你如何選擇防曬霜
    夏季護膚做好防曬是關(guān)鍵 專家教

    進入夏季,紫外線逐漸增強,防護不當(dāng)就會對皮膚造成損傷。專家指出,夏季保護皮膚,做好防曬是關(guān)鍵。專家介紹,日常生活中,防曬分物理防曬

  • 如何判斷自己是干皮還是油皮?超詳細的科學(xué)護膚教程來了
    如何判斷自己是干皮還是油皮?超

    想要科學(xué)護膚,首先要了解自己的皮膚類型。怎么判斷自己的皮膚是干性、油性、中性還是混合性?對于不同類型的皮膚,又該怎樣清潔和護膚?一

  • 雨后轉(zhuǎn)晴別大意!關(guān)鍵時刻“挪床”能保命
    雨后轉(zhuǎn)晴別大意!關(guān)鍵時刻“挪床

    昨日(5月24日)南方的強降雨過程進入尾聲范圍收縮到華南一帶強度也有所減弱預(yù)計本周末除廣西、廣東、云南等地部分地區(qū)有中到大雨或暴雨外全

  • 揭開防曬化妝品的“迷霧” “防護”還是“防曬”?
    揭開防曬化妝品的“迷霧” “防

    每周質(zhì)量報告丨揭開防曬化妝品的迷霧 防護還是防曬?炎炎夏日來臨,防曬化妝品迎來銷售高峰。不少商家打出防護+修復(fù)的宣傳口號,聲稱產(chǎn)品

  • 第二十七屆國際藥材節(jié)在河北安國開幕
    第二十七屆國際藥材節(jié)在河北安國

    25日,第二十七屆國際藥材節(jié)暨2025中國·安國藥材醫(yī)藥保健品交流會(以下簡稱藥交會)在河北省安國市開幕,吸引千余家中醫(yī)藥企業(yè)、萬余名國內(nèi)

  • 如何保護皮膚健康?專家來支招
    如何保護皮膚健康?專家來支招

    大油皮不需要保濕補水?面膜天天敷,皮膚水當(dāng)當(dāng)?陰天不用防曬,或者防曬霜涂一次管用一天?如何保護皮膚健康備受民眾關(guān)注。上海市皮膚病醫(yī)

  • 孩子“被困”手機怎么辦?家長如何跟青春期孩子相處?專家支招
    孩子“被困”手機怎么辦?家長如

    中學(xué)教師:孩子們和父母在一起的時間比較少,所以就從手機上尋找這種陪伴。因為手機上有很多社交平臺,可以滿足孩子這方面的一個需求。家長

  • 中國專家創(chuàng)新建立“體系化SEEG技術(shù)” 助癲癇診療從“經(jīng)驗依賴”邁向“智能精準(zhǔn)”
    中國專家創(chuàng)新建立“體系化SEEG技

    記者25日獲悉,中國專家領(lǐng)銜團隊經(jīng)過二十年的臨床實踐與技術(shù)迭代,將從法國引入的SEEG概念創(chuàng)新結(jié)合腦機接口技術(shù),建立體系化SEEG技術(shù),實現(xiàn)

  • 轎運大馬力新品正式發(fā)布!東風(fēng)商用車全國巡展火熱啟程 護航高效物流
    轎運大馬力新品正式發(fā)布!東風(fēng)商

    風(fēng)馳西南啟新程,擎動轎運新勢能。5月21日,東風(fēng)商用車 "風(fēng)起擎動

猜你喜歡LOVE