“數據優勢”與數據壟斷問題小議
作者:萬江 2022-12-30作者按:2022年12月19日,《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》發布,提出了20條政策舉措,又被稱為“數據二十條”。這個文件是當下和未來一段時間內中國關于構建數據制度、發展數據產業的重要指導性文件,也指明了中國數據政策的走向。文件中多次提及反壟斷法和競爭問題,顯示反壟斷與競爭政策也是數據政策中的重要組成部分。本文節選自作者《數字經濟與反壟斷法》一書中關于數據壟斷的章節,做了刪改,供讀者諸君討論批評。
企業的數據采集、轉移和使用都可能使其建立“數據優勢”
在數字經濟時代,數據被普遍認為是構成企業市場力量的關鍵要素之一,在某些場景之下,接入和控制關鍵數據本身就會帶來市場力量。如前所述,所有的數據最初都來源于用戶或消費者,企業或數字平臺是初始數據的采集者。誰擁有更多的用戶,就擁有更廣闊的數據采集渠道,相比于那些小企業或市場的新進入者,顯然擁有更多流量的平臺會更具有數據優勢。當然,除了采集第一手數據外,經營者也可以通過其他渠道購買或獲得第三方的數據。在數據的存儲和轉移方面,雖然普遍認為數字經濟的多棲性有助于抵消數據集中帶來的市場優勢,但是數據的轉移是有成本的,因此,數據的轉移成本也會成為評估市場壁壘的重要指標。用戶有時會發現他們很難將一個平臺上的個人數據轉移到另一個競爭性平臺上去。那些具有支配地位的企業甚至會有意抬高轉移成本,從而進一步強化其市場支配力。在數據的使用方面,網絡效應會進一步強化數據帶來的市場優勢。例如,在線搜索引擎會采集和分析用戶點擊、鏈接廣告的數據,這會直接提升自動展示關聯性搜索結果和廣告計算算法的能力,一方面數據的累積基于網絡效應而提升產品品質,另一方面也會提高市場進入的壁壘。美國國會《數字市場調查報告》指出Facebook的數據支配力通過兩種形式的“反饋循環”強化其競爭優勢。第一,基于龐大的用戶,Facebook相比于其競爭對手可以接入和采集更多的用戶數據;第二,Facebook利用這些數據形成更有針對性的用戶經驗,從而吸引更多的用戶并令用戶在其平臺上停留更長的時間。相反,小平臺沒有Facebook這樣的數據能力。這樣的數據優勢長期持續,固化了Facebook的市場地位并令新的社交網絡平臺很難提供有競爭力的用戶體驗。Facebook的數據也可以令其成為守門人,排斥其他企業接入其用戶的數據。
“數據優勢”具有兩面性
2007年以來的數字經濟領域少數幾項經過反壟斷機構審查的并購案件中,絕大部分都涉及并購后的經營者是否會具有反競爭的“數據優勢”問題。在Google/DoubleClick案中,歐盟委員會已經認識到,在線廣告的廣告主可以通過整合用戶的地理位置、時間、興趣、過往購物記錄、搜索偏好等信息精準地錨定受眾。委員會承認合并后的實體將整合Google和DoubleClick兩個公司的數據采集能力,提升其服務品質,“如此的整合,利用用戶的IP地址、cookie ID和鏈接次數等準確地匹配兩個數據庫的記錄,將個人用戶的搜索歷史和網上沖浪軌跡結合起來,比如,合并后的實體可能知道同一個用戶既搜索了A、B、C,又訪問了網頁W、Y、Z,這將提升廣告觸達目標用戶的精確度。”[1]但是,委員會同時認為,用戶仍然可以選擇拒絕定向廣告,這會抵消并購后主體的競爭優勢,而且其競爭對手也可以通過從第三方購買數據或精準投放服務來彌補數據接入上的劣勢,也就是說委員會認為其競爭對手可以通過其他渠道獲得相似的數據和能力。美國FTC實際上也持相似的觀點,在本案的最終審查聲明中,提及有關競爭對手提出的數據整合問題擔憂,FTC認為無論是Google還是DoubleClick的數據都不構成在線廣告市場的必需要素,Google的競爭對手也擁有Google所無法獲得的有價值的數據。由此可見,反壟斷機構對于數據可能帶來市場力量的擔憂是存在的,但由于數據的多棲性和非對手性,認為數據的集中未必會帶來實質性的競爭損害。如此邏輯,在2014年的Facebook/WhatsApp案中被再次重申。2016年,歐盟委員會同樣無條件批準了Microsoft/Yahoo案。核心理由是兩個公司的搜索引擎都落后于Google,因此,更大規模的數據采集會幫助并購后的實體提升其提供更優質服務的能力,有助于給Google帶來更大的競爭壓力。2018年Apple/Shazam案中,盡管歐盟委員會擔心Apple會通過并購獲得Shazam所擁有的包括Apple Music競爭對手的用戶等商業敏感信息,并借此搶奪競爭對手的用戶,損害數字音樂流媒體市場的競爭。然而評估的結果是這項并購帶給Apple的數據增量并不足以對其競爭對手(Apple Music是僅次于Spotify的歐洲第二大數字音樂流媒體服務提供商)造成排擠,不會損害相關市場的競爭。 可見,在數字企業的并購案中,數據集中可能帶來的“數據優勢”的確是反壟斷機構考量的主要問題之一,但至少在2019年之前,全球的反壟斷機構沒有對該領域的合并提出過異議,在數據方面的主要考慮有兩點,其一是數據不具有稀缺性,也即是說數據易于被復制或多渠道采集,其二是數據集中確實可以提升企業的產品和服務能力,但是企業占有和采集的數據規模未必足以嚴重損害競爭,甚至可能促進市場的競爭。然而,2020年12 月,歐盟委員會附條件批準Google/Fitbit合并案,可能會是一個轉折點,在這個案件中監管機構采取了更為嚴厲的態度。歐盟委員會雖然承認兩個公司不處于同一個相關市場,但二者數據的融合會引發橫向協同效果的擔憂。在審查中,歐盟委員會提出了三個方面的擔心,其中兩個與數據有關,一是收購完成后Google將獲得Fitbit用戶的健康和健身數據,這將提升Google在在線個性化廣告上的能力,從而進一步強化Google在在線廣告市場上的支配力;二是Google可能限制Fitbit 原本的API數據接口,進而損害處于初創期的歐洲數字健康市場的競爭和發展。為此Google做出了相應的承諾,即不會將Fitbit的用戶健康數據用于Google 廣告業務,并且會維持Fitbit用戶數據庫的技術隔離,確保不會與Google那些用于廣告業務的數據混同,同時會給予歐洲的用戶同意或拒絕Google將其健康和健身數據用于Google其他業務的選擇權;Google也會繼續允許其他應用軟件通過Fitbit的API接入用戶數據。
數據優勢不等同于市場支配力
數據或數據的累積究竟會不會給企業帶來市場優勢甚至構成市場支配力的核心要素?這個問題要結合數據的特性進行討論。首先,數據是“非對手的”或“多棲性的”,因此,個別經營者很難排斥其他經營者接入相同的數據,也就是說,相同的數據在市場上可以為不同的經營者采集獲得,如此,就無法斷然認定占有或積累大量數據就必然給經營者帶來不可替代的市場優勢,因為其他的經營者也占有或正在積累(即現實替代性)或有渠道占有或積累相同的數據(即潛在替代性)。歐盟委員會在Telefonica UK/Vodafone UK/Everything Everywhere案中,就指出“消費者普遍會將個人數據給到很多市場上的經營者,這類數據通常都被視為一種商品”,由于這類商品的多源性,其價格很難定的很高(即稀缺性不足)。當然,數據的這種特性也不意味著市場上所有的競爭者都可以獲得相同的數據。經營者采集用戶的數據通常都源于用戶使用它的產品或服務,而數字經濟的網絡效應會令既存的大型多邊平臺企業在聚集用戶進而聚集用戶數據上有明顯優勢。市場的新進入者在數據積累上首先面臨的是用戶拓展和積累的問題,然而由于網絡效應和規模效應,導致數據積累的正向反饋循環效應拉大了企業在數據采集放方面的差距。這會導致相比于市場上既存的大型企業,新進入者采集和積累數據的“劣勢鴻溝”仍然是存在的。另外,雖然數據中間商和數據交易市場的發展都有助于提升數據的可獲得性,但是中間商供應的數據質量以及必要的支撐服務往往很難與大型平臺相比,尤其是一些高價值的數據往往很難真正進入數據市場自由流動。 其次,在數字經濟時代,幾乎所有的行業都在進行數字化轉型,企業可采集數據的規模、數量和范圍大大擴展,“數據無所不在”。數據的價值源于數據透傳的信息和認知,而不是數據本身。因此,不同的數據基于不同的機制可以提取出相同的事實認知。例如,通過搜索引擎獲取的特定用戶的搜索內容可以了解到他的音樂偏好,而社交網絡也可以通過他在平臺上分享的信息而形成的個人畫像推斷出他的音樂偏好,二者殊途同歸。同樣,Facebook的社交網絡、Google的搜索引擎和Amazon的電商購物的數據分析都可以用于精準廣告業務,可見不同的數據之間也是有可替代性的。在2019年之前,正是基于這樣的邏輯,類似Google/DoubleClick的合并案在數據融合方面并沒有引起監管機構的真正擔憂。然而,不同數據之間的可替代性依然是個復雜的問題。例如,社交網絡收集的用戶數據的豐富度要遠高于搜索引擎,而搜索引擎采集的數據在確認消費者搜索具體產品或服務方面又更有優勢。通過臺式機或筆記本電腦采集的用戶購物數據也很難完全替代通過移動端采集的用戶購物數據,因為后者還有用戶購物的實時位置數據。在TomTom/Tele Atlas案中,歐盟委員會就認為Tele Atlas作為一個地圖數據庫的供應商積累的數據并不具有導航的用處,和TomTom作為便攜式導航設備供應商擁有的導航數據之間不具有替代性,后者包含更多的細節信息如道路類型、交通信息、轉彎限制信息等。如此來說,對于不同數據之間基于需求替代出發分析可替代性問題還需要個案分析。 再次,普遍認為,大型平臺企業的數據采集規模和范圍具有明顯優勢,并且由于網絡效應引起的數據積累的正反饋循環,這種數據優勢會轉化為不可逆的競爭優勢,從而令市場進入壁壘不斷筑高,形成壟斷。從競爭約束上來看,所有的大型數字經濟企業都有不斷擴大其數據采集規模和范圍的沖動。第一,數據的重要功能是推測和預判,而這些都是基于概率準確性的,通過數據觀察到的行為和結果越多,推測準確的概率就越高,結果就更可靠。為了提升推測的質量,數據的數量積累是必須的;第二,大量的數據尤其是用于推測的數據是有時效的,其價值隨著時間推移會迅速下降。比如,用于分析廣告市場趨勢的歷史數據,相對于反映廣告投放的實時投標數據的價值更小。在搜索方面也是如此,據Google的報告,每天新的搜索占據了15%,意味著搜索算法需要持續的、新的數據喂養。因此,為了數據能夠非常快速地更新,企業也不得不在很短的時間采集到一定體量的數據,提升數據約束。持續地、成規模地數據采集能力會給企業帶來持續的競爭力;第三,并不是所有的數據都用于推測和預判,在更加古典的市場上,數據庫通常都是匯編聯系信息和使用信息,如個人的性別、姓名、地址、生日、工作等信息,這些數據也不會因時間推移而失去價值;第四,相比于數據的數量累計,數據的多樣性和豐富度甚至能帶來更大的競爭優勢,通過不同的產品采集匯集用戶行為和品味的多面信息也是必要的。當今的數字經濟時代已經發展到數字生態化階段,單個大型數字企業提供的產品和服務幾乎可以覆蓋用戶的全面需求,從而也可以更為立體地采集用戶數據,甚至形成用戶的個人畫像,基于這樣的數據庫可以更全面更有深度的提升產品和服務的質量,開發出更具有經濟價值的新產品新服務。 值得注意的是,有學者指出那些用于做推測分析的數據的邊際價值在超過一定數量后會迅速下降,企業擁有的數據體量和企業的競爭優勢之間并不是持續正向關聯的。[2]如前所述,準確地推測和預判需要以龐大的數據積累為前提,但是隨著數據庫規模的擴大,統計上的取樣誤差也會伴隨出現,取樣規模越大誤差越大,預測的準確率反而下降。另外,數字經濟領域存在“長尾效應”,數據庫擴張到一定的規模,就足以覆蓋絕大多數場景,增加的數據大概率在不斷重復相同的場景,這會導致單個信息的邊際價值迅速下降。在Microsoft/Yahoo案中,雖然Google的搜索數據庫相比Yahoo有明顯規模上的優勢,但是歐盟委員會指出,“Microsoft提交的一份用于比較Google和Yahoo的搜索結果相關性算法研究報告表明,Microsoft和Yahoo在最常見的搜索查詢上,整體的結果相關性差別非常小”。 總之,數據的使用并非新的現象,在傳統行業和領域中早已有數據的分析和使用問題,如今,技術的進步和數字經濟無論是從屬性上(如智能手機反饋的實時定位數據)、來源上(如追蹤不同設備上用戶的網頁瀏覽數據)、應用上(如機器決策和機器學習)還是體量上大大擴展了數據的范疇。反壟斷機構已經充分認識到數據在數字和非數字經濟中的關鍵作用。我們要承認,數據產業仍處于嬰兒期,可能今天我們認為具有替代性的不同數據在未來就沒有替代性了,反之亦然,例如在線數據和離線數據,社交數據和搜索數據。因此,數字經濟在發展,關于數字經濟的反壟斷法也在與時俱進。過去的十余年間,涉及數據的競爭分析實踐主要都在經營者集中審查的執法活動中展開,近年來關于數據的其他反壟斷執法活動也越來越多,有關數據的反壟斷分析框架仍在發展建立過程中。
注釋 [1] EU Commission, COMP/M. 4731 - Goggle/DoubleClick, p.96. [2] Autorité de la Concurrence & Bundeskartellamt, Competition Law and Data, 2016, p.47-48.






