公共數據授權運營的法律邊界與合規之道
作者:張丹 孫建玲 2024-08-20公共數據的授權運營被視為推動公共數據資源開發與應用的關鍵策略。2022年12月,中共中央、國務院發布《關于構建數據基礎制度更好發揮數據要素作用的意見》(以下簡稱“《數據二十條》”)明確提出要建立公共數據確權授權機制。目前全國各地也在緊鑼密鼓的制定公共數據授權運營相關政策、建立地方數據管理機構、構建公共數據開發平臺、積極探索公共數據應用創新,初步掀起了公共數據授權運營的熱潮。
公共數據授權運營在全國各地迅速開展同時,數據產品掛牌交易也在各地數據交易所開展的如火如荼。在為國企客戶提供數據產品掛牌法律服務時,我們常會面臨的問題是國企擬掛牌的數據集或數據產品是否屬于公共數據的范疇?在數據授權開發環節是否需要遵守公共數據授權運營的相關規定?公共數據的授權運營是否可能違法?公共數據產品登記權人是否具有相應權屬?
雖然公共數據授權運營政策頻出,但對于公共數據到底指哪些數據以及公共數據如何合規運營業內仍在持續討論。本文第一部分旨在著重從國家政策、地方政策以及學術討論三個層面出發,對公共數據的界定模式以及現狀進行梳理。通過對不同層面政策文件中關于公共數據定義的研究,分析其中的共性與差異,從而揭示公共數據界定的核心要素和潛在趨勢。同時,參考學術界對于公共數據范疇的理論探討,進一步豐富和完善對公共數據的理解。本文第二部分旨在著重分析在促進數據開發利用、激活數據要素的過程中,公共數據如何授權運營以及授權運營的合規要點,以期形成完整的公共數據授權運營合規邊界。
(一)公共數據的法律界定
1. 國家政策層面對公共數據的界定
我國公共數據開發利用經歷了三個階段,分別是共享、開放、授權運營。近二十年來,從“政府信息公開”到“政府數據開放”,我國政務數據開放、共享相關制度建設取得了長足進步。[1]公共數據最初指政府數據、政務數據,其內涵呈現出公共機構主體和行政職權行為“雙要素”屬性。[2]
2020年4月,《中共中央、國務院關于構建更加完善的要素市場化配置體制機制的意見》明確將數據作為與土地、勞動力、資本、技術等并列的生產要素。2021年3月,《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》(以下簡稱“《十四五規劃》”)首次提出“開展政府數據授權運營試點,鼓勵第三方深化對公共數據的挖掘利用”。隨著數據在國家發展戰略層面被確認為生產要素,開展數據授權運營試點等政策的頒布,有關國家政策中存在“政府數據” 、“政府部門數據” 、“公共數據” 、“公共機構數據” 、“公共信息數據”等多種概念。
我們梳理了國家層面關于公共數據開放、開發利用、授權運營的重要政策中關于公共數據的表述(如下表),以初步窺探國家層面政策中對公共數據的界定。

通過梳理,我們能夠清晰地發現,在以促進數據開發利用、激活數據要素的價值為導向的國家層面政策文件體系當中,同時運用“政府數據”和“公共數據”這兩個概念的情況是較為常見的。然而,此類政策文件既沒有清晰明確地界定政府數據、公共數據的內涵,也沒有對政府數據和公共數據進行有效的區分,這就可能導致在實際執行過程中出現理解和操作上的偏差。
直到 2022 年出臺的《數據二十條》,才第一次給出了公共數據的概念。但遺憾的是,這次給出的概念也并未進行詳細的闡釋和細化,僅僅是進行了簡單的歸納,指出各級黨政機關、企事業單位在依法履行自身職責或者提供公共服務的過程中所產生的數據,屬于公共數據的范疇。《數據二十條》雖然給出了公共數據的初步定義,但由于不夠詳盡,在具體的應用場景中,可能還需要進一步的解釋和補充,以增強其可操作性和指導性。
2. 地方政府視角中的公共數據范圍
雖然國家層面對于公共數據尚無統一明確細化的界定,但在頂層政策支持的背景下,自2020年至今全國各省、市紛紛制定公共數據授權運營政策,積極探索公共數據授權運營模式,開展公共數據有序合規授權運營。
我們梳理了北京、上海、浙江、深圳等多地公共數據授權運營政策法規中對公共數據的定義(如下表),以期能夠從各地方政策的視角來識別和理解公共數據的范疇。

在各地的公共數據相關政策中,對于公共數據的定義總體呈現出趨同性,主要通過“主體要件+行為要件”的模式加以界定:其一,在收集和產生數據的主體方面,著重強調為國家機關、經授權具備管理公共事務職能的組織,或者是提供公共服務的組織;其二,在行為層面,突出數據是在依法履行職責或者提供公共服務的過程中被收集和產生的。
主體要件方面,雖然大多數省市將國家機關和法律法規授權的組織納入公共數據的主體范圍,但對事業單位和提供基礎公共服務的組織是否包含在內,各地區的規定有所不同。具體差異如下:
北京:規定公共數據的主體要件主要包括國家機關和依法獲得授權、具有管理公共事務職能的組織。
上海與浙江:通過具體列舉的方式,明確將供水、供電、供氣、公共交通等提供基礎公共服務的組織納入公共數據的主體范圍。
四川與深圳:對提供公共服務的組織的界定最為廣泛,不僅包括供水、供電、供氣、公共交通等組織,還擴展到了醫療、教育、通信、文化旅游、體育、環境保護、衛生健康、社會福利等領域的其他公共服務組織。
山東與江蘇:沒有采用列舉的方式,而是采用了更為概括性的表述,將具有公共服務職能的企事業單位統一納入公共數據的主體范圍,沒有具體限定服務的類型。
這些差異反映了各地區在界定公共數據主體時的不同側重點和考慮因素。一些地區傾向于具體明確地列舉包含的公共服務企業類型,而另一些地區則采用更廣泛的概括性描述,以適應不斷變化和發展的公共服務需求。這種多樣性有助于各地區根據自身的實際情況和需求,靈活地管理和利用公共數據資源。
3.學術界對公共數據的邊界的討論
隨著《數據二十條》的出臺以及全國多地相繼出臺針對公共數據開發利用的政策法規,學術界圍繞公共數據的討論熱度也持續升高。當前學術領域中有關公共數據的研究主要涵蓋以下幾個方面,重點圍繞如何更好地開發利用公共數據資源展開:其一,聚焦于公共數據自身的研究,涵蓋公共數據的概念、權屬、性質等內容。其二,針對公共數據開放利用的問題、路徑以及機制展開研究。其三,對地方公共數據治理和立法進行比較或實證方面的研究。[3]
除前面所述國家及地方政策中采用的“主體要件+行為要件”界定模式外(即公共機構產生模式),學術界對于公共數據界定幾種常見的模式有公共財政資金支持模式、公共用途模式、公共利益相關性模式、綜合模式。
(1) 公共財政資金支持模式
公共財政資金支持模式強調數據的產生或收集是由公共資金資助的。比如,由政府科研經費支持的科研項目所產生的數據。
在該種模式之中,不管是從主體的角度出發,還是依據相關的行為要件來考量,資金來源是否全部或者部分源自公共財政,這一點都屬于十分重要的判斷標準。[4]例如,當我們判斷某個項目或活動所產生的數據是否屬于公共數據時,首先需要審視的就是其資金的來源情況。如果資金全部或者有一部分是由公共財政提供的,那么這就為將其產生的數據認定為公共數據提供了重要的依據和線索。又如,對于某些企業的運營數據,如果其在發展過程中接受了公共財政的支持,那么在判斷這些數據的性質時,資金來源這一因素就具有關鍵的影響力,可能會促使其被歸類為公共數據。
(2) 公共用途模式
公共用途模式下,只要數據用于公共目的,如制定公共政策、提供公共服務等,就被定義為公共數據。例如,企業為政府提供的用于規劃城市建設的地理信息數據。有專家持有此種觀點,認為公共數據不一定是公共部門生產或持有的數據,而應是公眾必須要用又無法自給的數據,即公共品數據。具體來說,不能簡單依據數據生產者的公共屬性來界定公共數據,私人部門生產的數據也可能是公共品,隨著社會發展和數字化轉型,一些原本不屬于公共品的數據,如酒店報價數據、點評數據等,可能會變成公眾所必需的數據而成為公共品。[5]
(3) 公共利益相關性模式
公共利益相關性模式通常強調數據與公共利益之間的緊密聯系。在這種模式下,公共數據被定義為那些對公共利益具有直接或間接影響、與公共事務密切相關的數據。這些數據的獲取、使用、管理和共享會對社會整體或特定群體的公共利益產生顯著作用。
如有專家提出,公共數據不但涵蓋公共機構數據和公共服務企業數據,還包含社會數據中與公共利益具有相關性的部分,并且認為公共數據的核心特質在于數據的“公共性”或者“公共利益相關性”。[6]還有專家嘗試把在公共領域或空間中產生的、涉及公共利益的數據也歸入公共數據的范疇。例如,有觀點認為平臺數據既能夠被視作個人所有、平臺所有,也能被視為個人與平臺共有,還可以被認定為是互聯網空間的公共數據。[7]
(4) 綜合模式
在該模式下,在定義公共數據時,會綜合考量公共機構、公共資金、公共用途、公共利益等多個方面的因素。例如,中國軟件評測中心《公共數據運營模式研究報告》在對公共數據定義時既考慮了公共數據來源主體、又考慮了公共財政資金的支持以及公共利益,將公共數據分成以下五種類型:
① 政務數據,即政務部門依法履職過程中采集、獲取的數據;
② 具有公共職能的企事業單位在提供公共服務和公共管理過程中產生、收集、掌握的各類數據資源,如教育數據、醫療數據、交通數據、社保數據、水電煤氣數據等;
③ 由政府資金資助的專業組織在公共利益領域內收集、獲取的具有公共價值的數據,如基礎科學研究數據;
④ 具有公共管理和服務性質的社會團體掌握的與重大公共利益相關的數據;
⑤ 涉及公共服務領域的其他數據,如社會組織和個人利用公共資源或權力,在提供公共服務過程中收集、產生的涉及公共利益的數據。[8]
4. 公共數據的界定建議
鑒于在國家層面的政策當中,尚未對公共數據給出清晰明確的定義,而學術界針對公共數據的范圍同樣存在諸多爭論,并且呈現出逐漸擴大的態勢。在公共數據授權運營以及后續的公共數據產品掛牌項目中,對于公共數據的認定,我們建議,最適宜的做法是參照各地方政府關于公共數據授權運營的政策,采用“主體資格+行為條件”的雙重標準來界定公共數據。具體來說:
(1) 在數據收集和產生的主體資格上,應重點考慮國家機關、事業單位、依法獲得授權負責公共事務管理職能的機構,以及提供各類公共服務的機構。
(2) 在行為條件上,應明確數據是在依法履行公共事務管理職責或提供公共服務過程中收集和生成的。
這種界定方式有助于確保公共數據的認定既符合法律法規的要求,又能適應不同地方政府的具體實踐和管理需要。
(二)公共數據授權運營的合規邊界
1. 公共數據授權運營的定義

從上表可看出,“公共數據授權運營”概念中有幾個關鍵詞,分別是“授權人”、“被授權人”、“授權的公共數據”、“數據產品或服務”。“授權人”是大數據主管部門或數據提供單位,我們可以理解為公共數據的合法持有人;“被授權人”是符合條件的法人或非法人組織,自然人一般不能成為被授權人,且個別地方的“被授權人”僅包含法人,不包含非法人組織;“授權公共數據”是指被授權人可開發利用的部分公共數據,如特定行業/領域的公共數據;“數據產品或服務”是指利用公共數據加工形成的產品和服務,主要有數據集、數據接口等數據類產品,特定算法加工處理形成的數據模型類產品,數據報告、解決方案等定制類產品,以及其他形態的數據產品和服務。
2. 公共數據運營的歷程
公共數據運營經歷了三個漸進式階段,包括內部利用階段、開放階段和開發利用(商用)階段,具體為:
公共數據內部利用階段:從1993年啟動的“三金工程”到2002年規劃的“兩網一站四庫十二金”,我國各類政務網站、信息系統、數據資源庫經過多年建設,積累了海量公共數據。政務部門基于自身業務與決策需要,梳理、整合業務數據并加以開發利用,在電子化的基礎上實現了內部流程優化、公共服務便捷化。例如,教育部專門成立數據資源服務處,并建立中國高等教育學生信息網(學信網),由相關公司負責運營,開展學籍學歷數據采集、使用、發布審核工作,提供學籍學歷的查詢服務。
公共數據開放階段:隨著信息公開、政府網站建設、在線政務服務的推進,政務部門與平臺、網站運營企業之間建立起較為穩定的信任機制,“管運分離”的數字化建設發展模式逐漸成熟。在公共數據治理成效較好的行業領域和地方,面對企業和社會的普遍需求,政務部門在滿足自身基本利用需要外,開始探索公共數據的社會化利用,以數據開放的方式對外提供數據集或較為基礎的數據服務。例如,交通運輸部基于信息化技術研究項目,建成綜合交通出行服務數據開放、管理與應用的“云出行”平臺,為社會公眾提供綜合交通出行信息服務。
公共數據開發利用階段:不再僅僅局限于簡單的公共數據開放與共享,而是借助繁雜的數據分析及挖掘技術,對公共數據的價值進行深度開掘,進而提煉出更具商業價值的信息和深刻洞察。在此階段,涌現出眾多基于數據的商業模式,像數據交易平臺、數據服務供應商、數據驅動的解決方案提供商等,致力于將數據轉變為能夠量化和評估的資產,并積極探尋數據資產的定價機制以及交易模式。在該階段,政府部門進一步探索將公共數據授權給有能力對數據進行開發利用的法人或非法人組織,以實現公共數據的價值最大化。
3. 公共數據特許經營模式
在公共數據開發利用早期,地方政府曾采用特許經營模式將公共數據授權給第三方。引發業內廣泛關注的案例是2023年11月衡陽市發布的政務數據資源和智慧城市特許經營權出讓項目,衡陽市人民政府宣布出讓該市政務數據資源和智慧城市特許經營權,第三方在拿到授權后向使用者進行收費,該數據資產的掛牌底價為18.02億元,增價幅度為1000萬元。然而,距離公告發布僅僅幾天,該“政務數據第一拍”就被緊急叫停,原因不詳。

我們猜想叫停原因可能有三,一是公共數據特許經營的合法性,《基礎設施和公用事業特許經營管理辦法》等相關特許經營規定中并沒有關于公共數據的特許經營,缺乏法律文件的支撐;二是公共數據定價的合理性,緣何評估為18億,評估依據不確定,如果該項目成功,全國有600多個市,將撬動萬億規模的公共數據授權市場;三是公共數據授權模式尚缺乏上層文件,各地還處在公共數據授權模式的摸索中。
4. 公共數據授權運營模式
雖然衡陽公共數據特許經營授權模式暫停,但是公共數據授權卻不會止步于此,各地開始陸續出臺公共數據授權運營管理辦法。除了下述省級政府部門發布的公共數據授權運營管理規定外,還有寧波、南京、揚州、棗莊、無錫、濟南、金華、青島、長春等市級政府部門發布了公共數據授權運營管理規定。

上述已發布或尚未發布的管理規定中,公共數據授權運營模式有所不同,如江蘇采取“兩級主體、分級授權”模式,兩級主體指運營主體和開發主體,分級授權指設區的市級以上人民政府授權本級數據主管部門試點確定本級運營主體,運營主體再選擇開發主體進行數據開發利用;貴州省采取分級授權模式,授權運營主體由各級人民政府數據主管部門統一授權,開發利用主體由各級政府部門授權;南京市采取公共數據專區授權模式,劃分為綜合領域專區和行業領域專區,分類推進授權運營工作;濟南市采取綜合授權、分領域授權的方式,并探索分級授權。
以揚州市為例,揚州市公共數據授權運營采取“兩級主體、分級授權”模式,市政府授權數據主管部門確定一級運營主體,授權運營期限一般不超過2年。一級運營主體選擇二級開發主體進行數據開發利用,并簽訂授權協議。一級運營主體的主要職責為運營平臺建設、開發利用管理、服務能力支撐、市場生態培育和安全保障。二級開發主體基于應用場景需求,在一級運營主體搭建的授權運營平臺上,開發利用經授權的公共數據,形成數據產品,并向社會提供服務。
5. 公共數據授權運營的合規要點
(1) 被授權主體是否滿足準入要求
一般來說,公共數據授權運營管理規定對被授權主體都有準入要求,以江蘇省為例,開發主體必須符合以下基本條件:
① 遵守國家和本省對公共數據授權運營的有關規定。
② 經營狀況良好,單位及其法定代表人無重大違法記錄,未被列入失信被執行人名單、重大稅收違法案件當事人名單、信用中國“嚴重失信主體名單”。
③ 具備開展公共數據開發利用工作的專業團隊和服務能力。
④ 落實數據安全負責人和管理部門,建立數據管理安全保障制度;近3年未因發生網絡安全或數據安全事件被公開通報。
如果被授權主體未落實數據安全負責人和管理部門,也未建立數據管理安全保障制度,那么就不符合被授權主體的條件。
(2) 授權程序是否合法合規
各地的公共數據授權運營程序有所不同,比如江蘇,運營主體按照準入條件和應用場景選擇開發主體進行數據開發利用,并簽訂授權協議;但在河北,跨領域、跨區域的公共數據須由數據主管部門組織對應用場景、數據安全及運營單位等進行評估,經本級公共數據授權運營協調小組審議同意后,與運營單位簽訂協議,方可開展公共數據運營(此處“運營”指數據產品的研發和運營);單一領域的公共數據須由行業主管部門會同數據主管部門組織進行評估,經本級公共數據授權運營協調小組審議同意后,與運營單位簽訂協議,方可開展公共數據運營,未經公共數據授權運營協調小組同意,任何單位不得與第三方簽訂公共數據運營協議。因此,授權程序應滿足當地的合規要求。
(3) 授權文件是否合法合規
在實踐中,我們遇到部分公共數據產品掛牌登記項目中,公共數據授權文件僅有一頁紙,授權內容過于簡單,這就不太符合公共數據授權運營相關規定中的要求,以江蘇省為例,授權主體與被授權主體之間應簽署《授權協議》,且授權協議應明確各方權利義務、授權范圍、服務期限、服務費用、安全要求、禁止條款、信用承諾、退出機制和違約責任等;且協議有效期限不得超過授權期限,在授權期限屆滿3個月內,應按程序重新申請。
(4) 被授權主體的行為規范是否合法合規
各地均對被授權運營主體提出了行為規范要求,以浙江省為例,被授權主體要在授權運營域內對授權運營的公共數據進行加工處理,形成數據產品和服務,原始數據包不得導出授權運營域;被授權主體所有參與數據加工處理的人員須經實名認證,簽訂保密協議,操作行為應做到有記錄、可審查;被授權主體應使用經抽樣、脫敏后的公共數據進行數據產品和服務的模型訓練與驗證;經公共數據主管部門審核批準后,被授權主體方可將依法合規獲取的社會數據導入授權運營域,與授權運營的公共數據進行融合計算;數據產品和服務不得用于或變相用于未經審批的應用場景等。
6. 總結
希望本文對公共數據范疇的探討能助力大家更準確地判斷其數據的屬性。對于被視為公共數據的數據運營和使用,不僅要遵循《數據安全法》、《個人信息保護法》、《網絡安全法》等一般性的數據保護相關法律規定,而且還應當遵守本文第二部分提及的公共數據授權運營方面更嚴格的合規要點,按照公共數據授權運營政策規定的程序進行授權及運營。
公共數據的授權運營仍處于不斷發展和完善的階段。盡管當前在實踐中還存在諸多問題和爭議,但隨著政策的逐步明晰、實踐經驗的不斷積累以及學術研究的深入推進,我們有理由相信,未來公共數據的授權運營將更加規范、高效,為經濟社會的發展注入強大的動力。在這一進程中,建議大家密切關注政策動態,共同推動公共數據資源的合理開發和有效利用,讓公共數據真正成為促進創新、提升治理能力和服務水平的重要支撐,發揮其作為生產要素的價值。
注釋
[1] 王錫鋅、王融:《公共數據概念的擴張及其檢討》。
[2] 王錫鋅、王融:《公共數據概念的擴張及其檢討》。
[3] 伏羲智庫和清華大學互聯網治理研究中心:《公共數據界定問題研究報告》。
[4] 伏羲智庫和清華大學互聯網治理研究中心:《公共數據界定問題研究報告》。
[5] 朱揚勇:《依照數據用途界定公共數據》。
[6] 劉平、史莉莉、張延新、王松林:《公共數據開放相關法律問題研究》。
[7] 丁曉東:《數據到底屬于誰?——從網絡爬蟲看平臺數據權屬與數據保護》。
[8] 中國軟件評測中心:《公共數據運營模式研究報告》。






