微資訊!如何讓人工智能「不作惡」,為此我們和清華大學教授聊了4個小時
ChatGPT的熱浪席卷全球,當人們在討論AI有多強大的同時,也會關注AI的“可怕之處”——一方面源于技術本身,人工智能會出現“幻覺”,就是我們所說的“一本正經的胡說八道”。另外一方面,源于人類的“濫用”——侵犯知識產權、傳播虛假信息、違規使用數據等等。如何讓人類與AI更和諧美好地共處,是擺在我們面前越來越嚴峻且復雜的問題。本期為《AIGC未來指北》系列內容第三期,我們和清華的教授聊了將近4個小時,請他分享了人工智能治理中,關于弱勢群體保護、知識產權、及數據治理等最受關注的幾個問題,下文為對話精華內容整理。
劃重點
● 保護自身辨別能力不足的弱勢群體,研發AI產品的平臺要做好“守門人”的工作,一方面在產品上標注“識別標記”,如數字水印等,另外一方面,要讓產品使用軌跡可追溯,責任能落實到人。
(資料圖片僅供參考)
●對待新技術的發展,敏捷治理的思路是,在可控范圍內容讓“領先用戶”先順暢地進來,去體驗;同時在公測階段就考慮到“治理的邊界性問題”。
●近日,美歐達成了“人工智能促進公共利益行政協議”,值得注意的是,美歐雙方此次在AI領域的合作并不以數據共享為前提,雙方在數據流通上仍有所保留。“數據不動,聯合建模”,有可能成為未來各國在數據領域合作的新范式。
01 破解“克林格里奇困境”,要靠更敏捷的治理思路
Q1:如何降低利用 AI 傳播虛假信息和敏感信息的風險?一旦出現虛假信息如何鑒別,并降低對大眾的影響?
梁正:《互聯網信息服務深度合成管理規定》已經2022年11月3日國家互聯網信息辦公室2022年第21次室務會議審議通過,并自2023年1月10日起施行。另外,《互聯網信息服務算法推薦管理規定》已經2021年11月16日國家互聯網信息辦公室2021年第20次室務會議審議通過,并自2022年3月1日起施行。當前國內算法治理的框架已較為清晰,[1]但人工智能產業發展尚在早期,相關規定怎樣去落實,也還有很多問題需要解決。在人工智能,特別是機器學習領域,最典型的特征是不存在放之四海而皆準的通用解決方案。針對AI傳播虛假信息這件事,要分層來看:
①目前ChatGPT只是在公測階段,大家使用它,大部分也都是娛樂性的聊天,它的回應到底有多靠譜,可能并沒有太多人去認真追究,頂多會調侃一句”它在一本正經地胡說八道“。
②未來,當ChatGPT真正被使用到專用場景的時候,比如法律服務、金融服務的時候,真實性、嚴謹性問題就變得特別重要。
③但是,往往在非專用場景下,大家不太關注它的嚴謹性和真實性,警惕性放松,更容易被AI迷惑。這時候怎么辦?我認為還是要把責任歸因到具體的人。首先是使用者,使用了AI的人,應該選擇標識出來,這樣,看到AI生成內容的人,就可以選擇相信或者不相信。
另外,對一些老年人、未成年人,自身的辨別能力不足,這時候,不僅僅是使用者,也要對服務的提供方(平臺方),提出具體的要求,從我的平臺生成的內容,是需要有明確的標識的,平臺要做好“守門人”的工作。就好像現在的互聯網電商平臺,我們把“打假”的責任也給到了平臺方,指望用戶去打假是不現實的。
既然平臺提供了自動化的服務,就有義務去幫助用戶鑒別和防范。之前網信辦強調“要壓實互聯網主體責任”,這句話落實的一個點就是,當大平臺“手中有矛”的時候,更要落實自己的責任。我們看到國外大公司對這點十分看重,我們能注意到,當有新的技術誕生的時候,其實并不需要出臺一個專門的規定去約束這種新技術或新產品。因為國外的法律體系中,如果某個公司的產品出現問題,這個公司肯定是第一責任人。
Q2:從AI公司的角度來講,如何把好第一道關?
梁正:對公司來講,最佳解決方案是在產品上標注“識別標記”,數字水印可能是其中一個解決方案,還可以有其它的辦法,核心是對平臺產生的內容做標注:首先可以識別這條內容是AI生成的、并不是人類創作的;另外,可以識別這條內容是在哪個平臺生成的,由哪個用戶生成并傳播出去的。這樣,有清晰的追溯鏈條,就能更清晰地定義責任人。我們看到OpenAI實際上已經在這樣做了,推出了AI識別的工具,所謂的“用魔法打敗魔法”。
OpenAI針對內容的識別并作出判斷,圖源:網絡
Q3、新技術發展初期,如何破解“科林格里奇困境”?監管政策如何在確保新技術發展空間的同時,有效降低風險?
梁正:科林格里奇困境是指,在新技術發展的初期,當問題還沒出現時,你無法預見它會帶來怎樣的問題,但是問題出現以后再去解決又太晚。歷次我們經歷新技術的爆發,都會碰到這個問題。
我們現在的解決辦法應該聚焦在“對新技術有沒有更敏捷的治理思路”?新技術在實驗和推廣過程中,可以先控制在可控的范圍內,不要一下子大范圍鋪開,比如金融領域已經在采用的沙箱監管、自動駕駛領域的先行實驗區。以前我們很少首先考慮到商業價值,一般更先講到“新技術到底有什么危害”。但敏捷治理的思路是,應該讓所謂的“領先用戶”先順暢地進來,去體驗和探索,然后不斷迭代。就像小米剛剛開始推MIUI的時候,也是先有一批種子用戶,讓用戶參與到產品開發設計中來,這個思路可以被推廣到新興技術的治理上,也就是國外現在講到的負責任的創新。
其次,之前的所謂的公測階段,更多是從產品體驗、底層代碼等角度考慮,其實應該在公測階段就加入“治理的邊界性問題”,也就是同時進行治理規則的實驗,這種治理不應該只是自上而下的,而是更大程度上是由業界首先意識到,并提出治理的需求和方案,后來才有監管者監督。業界要有主動治理的意識,變成企業社會責任的一部分。
現在我們又處于一輪新技術發展的初期階段,產品設計上要有價值觀的嵌入,如果不考慮這個因素,它帶來的問題可能很大程度上要靠事后的規制,這是很難從根本上解決問題的。因為規則不是從某個個體的角度就能識別出來,必須在應用的過程中才能識別出來,應當盡量避免造成大面積的傷害之后才能定位到相關問題上。
Q4:在新技術誕生之時,國外有沒有成熟的治理經驗可以借鑒?
梁正:由于法律體系的不同,在英美法系國家,不需要法律有具體的規定,法官的判例就可以作為判罰依據,特別是在新興領域,大量的法律積累就是來源于新的問題出現之后,法官怎么判,宣判以后又可以作為其他法官來判刑的依據。最終積累很多案例之后,會找到一個共識,那么就會寫入法條,甚至最后形成法典。我們國家是大陸法系,采用的是成文法,習慣在法律規定中窮盡可能的情境,這其實在新興技術治理上很難做到。對新技術領域用判例去解決,更加敏捷靈活。在美國,如果有用戶認為自己的利益受損,就有權基于相關法律、包括憲法賦予的權利去起訴。所以美國的公司,對于推出新的技術、產品十分謹慎,因為一旦出現重大失誤,即使沒有相關的法律法規推出,只要基于憲法去提起訴訟,最終這家公司因為推出新產品不謹慎而犯下的某個失誤,就有可能給自己造成滅頂之災。
02 AIGC內容的知識產權之爭
Q5:利用AI生成內容是“高科技剽竊”嗎?
梁正:圍繞AIGC的版權界定問題,一直是爭論焦點,目前業界也很難有清晰的答案。本質上來講,界定是不是剽竊的唯一標準應當是生成新內容后新信息的含量。不同國家關于著作權的法律規定當中,新穎性、創造性都是構成實體要求的基本條件。目前來看AIGC只能發現關聯性,并不能發現因果性,所以可能并不能無中生有,創造嚴格意義上的新內容。但是未來是否量變會引起更大的質變,目前尚很難判定。
引發爭議的AIGC作品,《太空歌劇院》圖源:網絡
從產業發展的角度來看,如果把AI生成內容的著作權給了使用者,有利于使用者創作優質內容,比如新聞、文學藝術創作,可以繁榮創意和創作,激勵創作者,這個創作者是人,基本假定人是創意的來源。但如果大量內容都界定給使用者,對于優質工具的提供者而言激勵不足,也會影響到此類工具開發者的積極性。
雖然目前在立法上,還沒有明文規定,但是業界還是有一定的共識:比如,在科學研究領域,本來研究成果是為了人類共享,所以對于之前研究的引用,即使是借用了AI,一般標明署名和出處,可追溯就好;而基于商業目的的創作,把別人的作品打散重組,比如說小說、文學作品,肯定是不受歡迎的,如果沒有標注或聲明,是有侵權嫌疑的。
03 探索人工智能領域“數據合作”新范式
Q6:隨著AI產業的發展,數據資源變得無比重要,近日,美國與歐盟達成了一項號稱“關乎互聯網未來”的人工智能合作協議,這對我們的數據治理有什么啟示?
梁正:2023年2月,美歐達成了“人工智能促進公共利益行政協議”,擬在預測極端天氣和應對氣候變化、應急響應、醫保事業、電網運行,以及農業發展等五大重點領域帶來公共利益。值得注意的是,美歐雙方此次在AI領域的合作并不以數據共享為前提,雙方在數據流通上仍有所保留。
這件事涉及的領域更大一些,我們一直討論的ChatGPT所使用的底層數據,其實更多的是互聯網領域公共、公開的數據。而美國與歐美達成合作協議所講的數據,則可能來源于公共部門和社會領域,涉及到公共安全、個人隱私等,它與公開數據不同,但這個合作模式對未來的數據治理提供了很大的啟示。
關于數據的流動,從技術發展的角度來講,大家最希望能有一個共享的數據池,在上面去做訓練肯定效果最好,但是這里涉及到數據安全、隱私、版權、產權等各種復雜的問題。即使美歐在數據問題上經過這么長時間談判,也并不能做到“共享數據池”
美歐現在達成的“聯合建模”模式可能是未來的可以考慮的解決方式之一。過去大家的想法是要“讓數據動”,但數據一動就會帶來一系列問題,如匿名化的問題、數據安全的問題等等。其實從公司的角度來講,真正要做到匿名化是做不到的,怎么辦?現在的方向就是往多方可信安全計算、聯邦學習等方向去做。聯邦學習的模式,可以讓數據不動,只要最后共同建模,得到分析結果,就能解決很大的問題。比如在自動駕駛領域,各個國家都很難去分享交通數據,但是中國的自動駕駛汽車,如何在美國、歐洲安全地行駛?如果用這個模式,不必非要拿到數據,而是通過建模拿到分析結果就可以使用。
當然,目前這只是一個可能方向,也涉及到技術實現的問題,比如數據量超級巨大,模型如何部署,這方面也需要逐漸達成共識。歐洲目前在推工業數據空間,有100多個相關的公司企業參與其中,比如西門子這樣的企業。歐洲的思路是建立一個沒有流動障礙的統一的、安全的數據空間,大家都可以把自己的數據放到數據空間中,有點類似于數字銀行,也是思路之一。
這個思路在工業領域實施相對更容易,雖然也有類似于產業安全等敏感問題,但個人隱私等方面涉及相對較少。在工業領域,主要關心的是誰用了我的數據,怎么使用的,這個要可追溯,放到數據空間中,意味著數據可以放心流動和使用,后臺都會有軌跡記錄。
美國的解決思路類似于基礎公共設施的分層,美國政府開放了大概2000多個高質量數據集,都是基于政府掌握的公共數據。這些數據都是清洗好后再向社會去開放。所以現在去回溯ChatGPT的高質量數據基礎,肯定也是基于這樣一個更堅實的數據資源。
我國近年來一直在推廣數據交易所,這種思路可能更適合大宗、同質化的交易。是不是也可以嘗試一下,和數字協議、區塊鏈等新技術相結合,借鑒歐美等國家數據治理的經驗,獲得一些啟發?比如上述合作模式完全有可能成為未來的數據合作新范式,現在有一種觀點,人工智能到了ChatGPT的出現,才真正進入大規模產業化、工程化實施的階段。這個時候一定會有專業的數據服務商出現,不再是以場內交易方式出現,而更多是提供專業化的服務。
Q7:中國發展自己的AI產業,對數據的需求也會日益增加,如何應對國際的競爭與合作?
梁正:中國也有自己的大模型,雖然現在表現還沒那么優異。大模型的訓練目前確實面臨著數據共享、數據安全、隱私保護等各種難題。從大環境來看,也迫切要求我國在國際合作中進行一系列思路上的轉變。一方面,我國的數字平臺企業要爭取走向國際,拓展出更加廣闊的發展空間;另一方面,從國家的層面而言,仍然要探討如何融入全球創新網絡,以更加開放的態度尋求國際間的科技合作與交流。而美歐此次合作恰恰提供了數字領域國際合作的一種可參考方案——在各國強調數字主權的大背景下,在數據不流動的前提下通過多方可信安全計算、聯邦學習等方式實現對數據價值的共同發掘和利用。
關鍵詞:
責任編輯:hnmd004
- 微資訊!如何讓人工智能「不作惡」,為此我2023-03-07
- 住建部部長:今年計劃改造5萬個以上老舊小2023-03-07
- 第二批4只北證50指數基金獲批,萬家、博時2023-03-07
- 市監總局局長:今年要在數字經濟等重點領域2023-03-07
- 環球微頭條丨人大代表張伯禮:建議用人工智2023-03-07
- 今日播報!旭輝控股集團:2023年2月合同銷售2023-03-07
- 【世界熱聞】2023蘇州工業園區翡翠幼兒園保2023-03-07
- 請注意!因配合市政道路建設,武漢武昌區這2023-03-07
- 外地人能不能去申請太原生活補貼?_全球看2023-03-07
- 環球熱消息:堅決懲治網暴“按鍵傷人”,檢2023-03-07
- 【播資訊】全國人大代表丁奎嶺:建議國家改2023-03-07
- 全國人大代表蔣卓慶:優化完善金融監管體制2023-03-07
- 溫樞剛委員:推動高溫氣冷堆技術持續創新2023-03-07
- 最高法:堅決制止大數據殺熟 天天觀熱點2023-03-07
- 韓國央行行長:三季度開始韓國經濟或出現反2023-03-07
- 全球首例風漁融合設計獲權威認證2023-03-07
- 年供1.45億度電!陜西最大山地光伏電站并網2023-03-07
- 梵音瑜伽成被執行人|當前通訊2023-03-07
- 【全球報資訊】韓國政府將向強征勞工受害方2023-03-07
- 山東:“十四五”期間化肥用量將繼續保持零2023-03-07
- 年供1.45億度電!陜西最大山地光伏電站并網2023-03-07
- 全國碳市場交易價格行情日報【2023年3月6日】2023-03-07
- 2023年2月能源價格月報!2023-03-07
- 全球首例風漁融合設計獲權威認證2023-03-07
- Libresse薇爾#月經不隱藏#新敘事:這一次,2023-03-07
- 水果刺客,收割了誰?2023-03-07
- 化神是什么意思?化神臨月令什么意思?2023-03-07
- 劉三刀是什么意思?王者榮耀里面的劉三刀是2023-03-07
- 戴戒指打保齡球是什么意思?打保齡球的隱性2023-03-07
- 政協委員何超瓊:我是大灣區人 手足之情時2023-03-07