1月13日,英國首相斯塔默宣布“人工智能機遇行動計劃”,其中提到創建國家數據圖書館以安全可靠地釋放公共數據的價值,支持人工智能的發展。近期,英國托尼·布萊爾全球變革研究所發布《Governing in the Age of AI》報告,提出建立國家數據圖書館,以解決英國現有數據基礎設施落后的問題,消除數據訪問的系統性障礙,充分釋放數據在驅動AI創新發展中的潛力。當前,英國公共部門數據面臨數據分散、數據訪問成本高、數據安全性不足等突出挑戰。為打破這一困境,國家數據圖書館被視為英國數字化轉型議程的核心支柱。本文通過分析英國在AI創新發展中面臨的數據難題,及報告提出的國家數據圖書館構建路徑,研判全球AI數據治理面臨的挑戰,并為我國規避“數據孤島”與“治理失靈”提出啟示及建議。
英國在AI創新發展中面臨三大數據難題
1.“數據孤島”問題突出,削弱數據使用價值
一是英國政府在部分關鍵領域已具有一定的數據積累,但相關部門數據分散。據英國政府網站2025年1月發布的英國數字政府現狀回顧報告1,英國只有53%的政府部門超過60%的數據已上公共云,63%的國家醫療服務體系和公共機構中少于40%的數據已上公共云。
二是英國政府部門數字化服務程度偏低,數據采集和訪問的門檻較高。據英國數字政府現狀回顧報告,截至2024年,傳統技術仍占英國中央政府部門系統的28%,而47%的中央政府和45%的國家醫療服務體系尚未建立起有效的數字化途徑1。
2.投資不足及成本高企,掣肘創新發展進程
對于現有的數據基礎設施和數字服務系統的技術投資不足,維護成本高。2023年,英國公共部門在技術領域投入約260億英鎊,低于行業基準約30%。該投資缺口帶來了雙重挑戰:一方面,新技術的研發和應用缺乏足夠資金支持,導致創新動力不足;另一方面,現有系統的維護成本卻在不斷攀升,甚至達到新替代方案的3至4倍2。
構建超大型數據庫需較高的成本,托尼·布萊爾全球變革研究所預測,若政府只優先考慮部署10個高影響的用例,初始成本就可能高達2億英鎊。且英國政府在技術領域過度依賴高成本外包,政府在數字化能力方面存在不足,缺乏足夠的內部數字人才和技術能力,這將限制政府在數字改革和創新應用方面的自主性和效率。
3.數據安全性不足,影響公眾信任
英國對數據安全保障不足,數據泄露事件頻發阻礙推進數據共享及流通。2024年,英國國家網絡安全中心報告的全國重大網絡安全事件同比增長超50%,事件嚴重程度提升了3倍。2024年英國國家醫療服務體系(NHS)遭遇網絡攻擊,泄露的數據包括2018年到2024年的患者和捐贈者的全名、地址、捐贈金額、醫療報告(包括獨特的醫院編號和出生日期)以及財務文件。
國家數據圖書館是英國數字化轉型議程的核心支柱
國家數據圖書館將是實現高價值的數據集成,為各部門提供工具、標準和專業知識,以促進安全、負責任的數據共享及開啟新協作機會的中心。盡管構建英國國家數據圖書館初期成本高,但回報潛力巨大。一個全面開發的人工智能數據生態系統可能會帶來20倍的投資回報。據DARE UK預測,2050年更先進的數據訪問方式將帶來相當于每年130億英鎊的經濟效益。通過建立國家數據圖書館,可助力英國成為人工智能驅動創新和經濟增長方面的全球領導者,并成為其重新構想在全球人工智能治理中戰略位置的實踐典范。
1.分階段推進國家數據圖書館建設
按照《Governing in the Age of AI》的設想,英國國家數據圖書館構建可分三階段推進:即刻行動、中期部署和長期規劃。

1、打破數據孤島
采用數據聯邦架構,各部門對其數據保持控制權,同時對敏感數據進行分散控制。部門間數據主權意識可能阻礙共享,需通過法律豁免(如數據控制者賠償機制)和政策激勵(如績效掛鉤資金分配)推動協作。
報告提出的建議:
o 設立跨部門協調委員會,明確數據共享的權責邊界與經濟收益分配。
o 建立一個有明確的部長級監督和跨政府協調的高級領導團隊。
o 以存量數據資源為基礎,啟動核心數據池建設,重點打通跨部門數據接口。
o 預鏈接高價值數據集,如衛生-就業一體化,為公共服務提供人工智能驅動的解決方案。
2、解決成本問題
為確保被快速采用的勢頭,國家數據圖書館必須從一開始就帶來切實的利益。但同時應明確其非盈利定位,其商業模式主要目標是收回開發和運營成本,而非產生利潤。
報告提出的建議:
o 制定分層的數據訪問付費方案,大型企業按從數據中所獲商業價值多付費,學術機構和獨立研究人員則享受折扣。
o 若國家數據圖書館開放授權給外國實體使用,可以引入一種版稅支付機制,借鑒ARIA的海外融資機制,確保國家能夠在公共部門數據的經濟價值中保留相應的利益份額。
o 聚焦于五個與政府任務相關聯的高價值、高影響用例,通過敏捷沖刺開發交付“最小可行產品”,以在支持國家優先事項中展現價值。
3、平衡隱私與安全
出于對國家數據圖書館隱私和安全考慮,需要嚴格的保障措施和明確定義的訪問框架。
報告提出的建議:
o 建立動態風險分層機制,定期更新匿名化標準,并與獨立機構合作審查。
o 采用分級訪問權限(Reader Pass),通過分層訪問系統來平衡安全性和可用性。
o 開發先進的合成數據生成技術,以平衡數據效用與隱私保護。
o 提供更廣泛的可訪問性,同時保證強大的治理和安全標準。
2.推動政策設計等四個領域數字化變革
國家數據圖書館具備推動四個關鍵領域協同變革的潛力:政策設計、公共服務、學術研究以及商業研發(R&D)。這些領域不僅高度依賴高質量數據作為發展的基礎,而且彼此之間存在深度關聯——一個領域的進展往往能夠為其他領域提供新的動力和啟發,從而形成相互促進的正向循環。
在政策設計領域,國家數據圖書館具備實時訪問和分析數據的能力。使政策制定者能夠快速響應社會經濟變化,制定更有效的政策。通過鏈接和分析大量數據,國家數據圖書館可以幫助政策制定者預測未來趨勢,從而提前規劃和應對潛在問題。同時,其透明性框架和數據注冊表可以增加政策制定的透明度,確保公眾對政策制定過程的信任。
在公共服務領域,國家數據圖書館鏈接不同數據集以提供個性化的公共服務。如通過分析個人的健康數據和生活習慣,提供定制化的健康建議和預防措施。此外,國家數據圖書館可自動化數據處理和分析,提高公共服務的效率和降低成本。有利于識別潛在的社會問題,如貧困、健康風險和犯罪熱點,從而實現早期風險預警和干預。
在學術研究領域,國家數據圖書館提供快速訪問大量高質量數據的能力,顯著加速科學研究的進程。國家數據圖書館可以促進不同學科之間的數據共享和合作,整合及提供標準化和高質量的數據,推動跨學科研究的發展。
在商業R&D領域,國家數據圖書館為企業提供快速訪問和使用數據的能力,加速產品和服務的開發和迭代。通過利用國家數據圖書館的數據,企業可以開發出更具創新性和競爭力的產品和服務。并且,國家數據圖書館可以作為一個平臺,促進企業、學術界和政府之間的合作,形成一個支持創新的生態系統。
對我國的啟示
我國在數據治理市場規模持續擴張,政策法規體系正逐步完善。然而,當前仍面臨一些挑戰,如部門間信息系統標準不一,數據分散整合困難,數據分析效能不高。報告建議建立國家數據圖書館推動AI創新發展,并且不要試圖集中所有數據,而是推薦采用數據聯邦架構等方式。這對我國推動高質量數據集建設工作,為AI技術創新和產業應用提供堅實的數據基礎而言具有參考意義。
一是降低大型國家級數據庫的使用門檻。通過集中化元數據目錄,簡化數據發現流程。提供“開箱即用”分析包,降低數據使用壁壘。設立專業服務臺,使用戶能夠有效地讀取和處理數據集。
二是平衡數據效用和安全性。在充分發揮數據價值的同時,必須加強隱私保護和合規管理,確保數據的使用符合法律法規,避免因安全問題影響數據的共享和應用。
三是解決數據庫運營成本問題。通過合理規劃商業模式和資源配置,可以有效降低開發和維護成本,確保數據庫在經濟上具備可持續性,為國家數據治理和人工智能發展提供堅實基礎。