【環球新要聞】斯坦福2023 AI指數報告出爐!中國霸榜AI頂會,中科院論文發表量世界第一
這份報告顯示,中國在AI頂會論文上表現世界居首,然而引用量卻低于美國。另外,AI論文發表量世界前十的機構中,中國占了9席,紛紛趕超MIT。
(相關資料圖)
編者按:本文來自微信公眾號 新智元(ID:AI_era),編輯:桃子,創業邦經授權轉載
近日,斯坦福發布了2023年AI指數報告。值得注意的是,斯坦福AI指數報告列出了「AI論文發表量」世界前十的機構,9所全部來自中國,紛紛趕超MIT。
它們分別是:中國科學院、清華大學、中國科學院大學、上海交通大學、浙江大學、哈爾濱工業大學、北京航空航天大學、電子科技大學、北京大學、以及MIT。
今年的報告主要分為八大節:研究與發展,技術表現,人工智能技術倫理,經濟,教育,政策和治理,多樣性,以及公眾觀點。
以下內容提取了報告幾項要點。
中美論文合作全球居首
從2010年-2021年,盡管AI論文跨國合作的步伐已經放緩,但是自2010年以來,美國和中國的人工智能研究合作數量增加了大約4倍,比中國和英國合作總數多2.5倍。
然而,從2020年-2021年,中美合作的總數僅增長了2.1%,是自2010年以來的最小同比增長率。
此外,人工智能論文的總數自2010年以來翻了一番以上。從2010年的20萬篇增長到2021年的近50萬篇(49601)。
就AI論文發表的類型來看, 2021 年,所有已發表的AI論文中有60%是期刊文章,17%是會議論文,13%來自存儲庫。
雖然在過去12年中期刊和儲存庫論文分別增長了3倍和26.6倍,但會議論文的數量自2019年以來有所下降。
模式識別、機器學習和計算機視覺依舊是人工智能領域研究的熱門話題。
中國在期刊、會議和儲存庫論文總量方面依舊處于領先地位。
美國在人工智能會議和儲存庫引用方面仍然領先,但這些領先優勢正被慢慢削弱。盡管如此,世界上大多數的大型語言模型和多模態模型(2022年54%)是由美國機構產生的。
中國霸榜AI頂會,但引用量低于美國
AI期刊論文的發表,中國始終保持領先地位,2021年為39.8%,其次是歐盟和英國(15.1%),然后是美國(10.0%)。
自2010年以來,中國人工智能期刊論文被引頻次占比逐步上升,歐盟、英國、美國均有所下降。中國、歐盟和英國、美國占全球總引用量的65.7%。
那么,世界頂會論文發表的情況又如何?
2021年,中國以26.15%的比例在全球AI頂會發表的論文數所占份額最大,而歐盟和英國以20.29%緊隨其后,美國以17.23%位居第三。
從頂會論文引用量來看,中國雖然高產,但引用量相較于美國來說較低。美國頂會論文引用量23.9%,中國為22.02%。
從側面可以看出,中國論文發表數量最多,但質量不如美國高。
在AI論文儲存庫提交方面,美國在世界居首,23.48%。中國最低,11.87%。
中國9所機構,AI論文發表趕超MIT
2021年,發表論文總量世界前十機構中,中國占了9所,不同機構發表的論文總數如下圖,MIT位列第十,發表論文1745。
就計算機視覺領域(CV)來看,中國的十所機構位居世界前十,它們分別是,中國科學院、上海交通大學、中國科學院大學、清華大學、浙江大學、北京航空航天大學、武漢大學、北京理工大學、哈爾濱工業大學,以及天津大學。
在自然語言處理(NLP)領域,就有所不同了。
世界前十的機構/公司有:中國科學院、卡內基梅隆大學、微軟、清華大學、卡內基梅隆大學-澳大利亞分校、谷歌、北京大學、中國科學院大學、阿里、亞馬遜。
語音識別領域排名如下:
工業界領先學術界
在2022年發布的重要人工智能機器學習系統中,語言系統占最多,有23個,是多模態系統數量的6倍。
在論文產量上,工業界領先于學術界。
直到2014年,大多數重要的模型都是由學術界發布的。從那時起,工業界便逆襲翻身。到2022年,32個重要的機器學習模型都誕生在工業界,而學術界僅有3個。
由此可見,與非營利組織和學術界相比,構建最先進的人工智能系統越來越需要大量的數據、計算機能力和資金資源,而行業參與者固然有更多的資金資源去做這件事情。
2022年,美國產生了數量最多的重要機器學習系統,有16個,其次是英國(8個)和中國(3個)。
此外,自2002年以來,就創建的重要機器學習系統總數而言,美國已經超過了英國和歐盟、中國
再來看做出這些重要AI系統背后研究者國分布,美國有最多的研究者,285人,是英國的2倍多,是中國的近6倍。
LLM越來越大,算力越貴
大型語言和多模態模型,有時稱為基礎模型,是當前一種新興且日益流行的AI模型類型,它在大量數據上進行訓練并適用于各種下游應用程序。
ChatGPT、DALL-E 2和MakeA-Video等大型語言和多模態模型已經展示了令人印象深刻的功能,并開始在現實世界中廣泛部署。
通過對這些模型作者的國家隸屬關系進行了分析,這些研究人員中的大多數來自美國機構(54.2%)。
斯坦福AI指數報告還列出了大型語言和多模態模型發布的時間表。
大型語言模型正變得越來越大,也越來越昂貴。
第一個大型語言模型GPT-2于2019年發布,有15億參數,訓練成本約50000美元。谷歌PaLM是2022年推出的大型語言模型之一,有5400億參數,成本高達800萬美元。
從參數和訓練成本來看,PalM比GPT-2大360倍,成本高出160倍。
不僅僅是 PalM,從整體上看,大型語言和多模態模型變得越來越大和昂貴。
例如,DeepMind于2022年5月推出的大型語言模型Chinchilla估計耗資210萬美元,而BLOOM的訓練大約耗資230 萬美元。
隨著時間的推移,GAN在人臉生成方面的進展,最后一個圖像由Diffusion-GAN生成,這一模型在STL-10上取得了最新的SOTA。
去年,隨著OpenAI的DALL-E 2、Stability AI的Stable Diffusion、Midjourney、Meta的Make-AScene,以及谷歌的 Imagen等模型的發布,文本到圖像生成模型逐漸走進大眾視野。
如下,輸入相同的提示,「一只熊貓在溫暖的巴黎夜晚彈鋼琴」,分別由DALL-E 2、Stable Diffusion和Midjourney這三個可公開訪問的 AI 文本到圖像系統生成的圖像。
在最近發布的所有文本到圖像生成模型中,谷歌的Imagen在COCO基準測試中表現最好。
今年,創建Imagen的谷歌研究人員還發布了一個更難的文本到圖像基準測試 DrawBench,旨在挑戰功能越來越強大的文本到圖像模型。
此外,報告還介紹了當前生成式AI模型存在一些偏見,比如給DELLE-2提示CEO時,每個人似乎都采取了交叉雙臂自信的姿勢。
在Midjourney中,當提示生成「有影響力的人」時,它會生成4張看起來年長的白人男性圖像。
完整報告內容請參見:
https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index_Report_2023.pdf
關鍵詞:
責任編輯:hnmd004
- 【環球新要聞】斯坦福2023 AI指數報告出爐2023-04-05
- 施工船入場!山東半島南U1海上風電項目正式2023-04-05
- 大唐5.5GW風電機組集采!東方電氣、明陽、2023-04-05
- 金風、遠景、明陽、運達、海裝、中車等多家2023-04-05
- 天天即時看!新增風電400MW!貴州興仁市發2023-04-05
- 環球新消息丨風電每日報 | 3分鐘·縱覽風2023-04-05
- 中電科回應員工疑痛批領導安排加班:核實清2023-04-05
- 巴菲特旗下伯克希爾聘請銀行安排日元債券發2023-04-05
- 海南警方:中國國際消費品博覽會期間實行危2023-04-05
- 另眼看盛會丨何茂林:二十大報告提出加快建2023-04-05
- 每日精選:清明公益短片:倡導文明祭祀 共2023-04-05
- 周鴻祎離婚分割90億股權,三六零回應市場“2023-04-05
- 發揮香港離岸人民幣樞紐作用,助力人民幣國2023-04-05
- Omdia:預計2023年大尺寸顯示面板出貨量呈2023-04-05
- 探親、祭祖、踏青,全國鐵路中短途客流集中2023-04-05
- 四月來臨,茅臺機場99元便可去貴陽,這些特2023-04-05
- 最新快訊!今日游戲msvcp140.dll丟失的解決2023-04-05
- 每日快報!美國銀行:上周客戶撤離美股規模2023-04-05
- 首批因AI失業的人:AI繪畫引入工作流程,有2023-04-05
- 世界訊息:2022年OLED智能手機報告:面板出2023-04-05
- 中國網絡視聽用戶達10億,成第一大互聯網應2023-04-05
- 消息稱麥肯錫逐步停止破產咨詢服務 全球快2023-04-05
- 21家公司被徹底拉黑!2023年3月國網黑名單2023-04-05
- 歐盟能源安全格局的破與立|今日熱文2023-04-05
- 今日要聞!川藏兩地間再添500千伏輸電線路2023-04-05
- 歐盟-美國能源理事會召開部長級會議2023-04-05
- 2022年我國太陽能資源為偏大年景2023-04-05
- 只有一天的清明檔2023-04-05
- 實時:拼多多的800萬個“敵人”2023-04-05
- 智氪VIP(限時免費)|數字經濟下一熱點板2023-04-05