美國聯邦政府用 ChatGPT 追查2000億美元醫療補助詐欺
美國衛生及公共服務部在全美50個州部署 ChatGPT 等 AI 工具,分析多年醫療補助審計資料,目標鎖定每年估計高達1000至2000億美元的浪費、詐欺與不當支出。AERO 計畫引發關於 AI 準確性、正當程序,以及聯邦政府是否以 AI 作為政治武器的深刻爭議。
在華盛頓特區的一棟聯邦辦公大樓裡,美國衛生官員正將一款消費者聊天機器人,轉化為美國公共政策史上最具影響力的審計工具之一。衛生及公共服務部(HHS)正在使用 ChatGPT——數百萬美國人用來撰寫電郵和整理資料的同一款產品——掃描全美50個州超過五年的醫療補助(Medicaid)審計資料,搜尋官員估計每年高達1000億至2000億美元的浪費、詐欺與不當支出。
這項計畫正式名稱為「審計執法與風險監督」(Audit Enforcement and Risk Oversight,AERO)倡議,於2026年5月21日由 HHS 財務資源助理部長 Gustav Chiarello 宣布。這是美國聯邦政府史上最大規模的商業 AI 部署之一,也是爭議最大的一次。
AERO 如何運作
AERO 的範圍刻意設計得極為廣泛。計畫針對每年接受超過100萬美元聯邦資金的所有機構——這個門檻涵蓋的不僅是各州醫療補助計畫,還包括研究機構、成癮治療機構、托兒服務網絡,以及數百個共同構成美國龐大醫療與社會服務體系的聯邦補貼計畫。
AI 工具(包括現成的 ChatGPT 以及輔助的大型語言模型)負責分析「單一審計」(Single Audit)報告——即聯邦法律要求各州和受助機構每年提交的標準化財務報告。系統會尋找長期不合規的模式:反覆出現的缺陷、重大管控漏洞,以及受助機構儘管已收到聯邦調查結論卻「持續未能改善」的問題。
當系統標記異常後,人類分析師會在執法行動啟動前進行複查。至少在理論上是如此。
問題的規模
要理解 AERO 的存在邏輯,首先要了解美國醫療支出的驚人規模。Medicaid 每年向全美50個州撥付約9000億美元,服務超過8000萬低收入美國人。聯邦對這筆支出的監管,歷來依賴一套由各州審計師、年度報告和定期聯邦審查構成的拼湊機制——這套系統是為前數位時代設計的,早已跟不上現代醫療帳務的複雜程度。
獨立估算顯示,Medicaid 每年浪費、詐欺與不當支付的規模,約佔總支出的10%至22%——這正是 HHS 官員引用「1000億至2000億美元」數字的依據。即便只追回其中一部分,也將是美國政府史上規模最大的財政收回行動之一。
爭議:準確性、問責制與政治化
儘管潛在影響深遠,AERO 已引發醫療政策研究者、各州官員與公民自由倡導者的尖銳批評,這些批評可歸納為三個層面。
準確性問題。 以通用商業語言模型分析複雜政府財務文件,在如此規模下前所未有。批評者指出,ChatGPT 等模型可能產生「幻覺」——以充滿自信的語氣輸出事實錯誤的結論——而醫療帳務代碼的模糊性、各州特有的會計慣例,以及跨越多年的審計軌跡,恰恰製造了最容易產生 AI 錯誤、且最難被發現的條件。一位聯邦醫療分析師告訴《波士頓環球報》:「這些不是簡單的文件。一款現成聊天機器人能可靠地在一份400頁的州級 Medicaid 審計報告中找出詐欺,這種說法需要非凡的證據支撐。」
正當程序問題。 HHS 擁有相當嚴苛的執法權:可以暫停撥款、追回已發放資金,極端情況下甚至可以完全終止聯邦補助。批評者認為,若 AI 錯誤標記了某州的審計記錄,而舉證責任落在被標記的州身上,整個程序實際上顛覆了聯邦政府與各州資助關係中歷來遵循的「合規推定」原則。
政治化問題。 最尖銳的批評也許指向 AERO 最積極執法行動的地理分佈。川普政府在 AERO 宣布前後,向明尼蘇達州扣押了數億美元、向加州扣押了逾10億美元的 Medicaid 資金——兩者皆為民主黨執政州,且與本屆政府有過公開衝突。批評者認為這絕非巧合。行政部門官員則以客觀的審計不合規記錄為由反駁。
HHS 的立場
Chiarello 對計畫的目標與限制一向直言不諱。他表示,AERO 是為了識別傳統審計管道遺漏的長期不合規問題,而非取代人類判斷——而是讓人類判斷得以規模化。那些在被標記後積極配合改正的受助機構,將在 HHS 找到願意合作的夥伴;不配合的,將面臨後果。
在 AI 準確性問題上,HHS 官員強調,AERO 的輸出結果在做出執法決定前,都會經過人類分析師的複核。系統負責提出可疑對象,人來做最終決定。
計畫的發布也得到高層政治背書——副總統 JD Vance 曾公開呼籲利用 AI 推動聯邦監管現代化,CMS 局長 Mehmet Oz 則直接向各州 Medicaid 主任發出不合規後果警告。
AI 進入政府的範本
無論 AERO 的是非功過如何評判,這個計畫代表著美國聯邦政府使用商業 AI 工具方式的一個重要轉折點。過去的政府 AI 部署,通常涉及客製化系統、漫長的採購流程,以及範圍狹窄、定義明確的使用場景。AERO 截然不同:它由政治任命官員拍板,以消費者產品為工具,在美國公共衛生財政的全部複雜性中展開,時間線以週計算而非年計算。
這種速度既是 AERO 的賣點——傳統政府採購可能需要數年才能完成 AERO 在數月內達成的事——也是其最大的風險。在高風險情境下大規模部署、缺乏充分領域驗證的 AI 系統,會產生系統性錯誤,而在 Medicaid 執法中的系統性錯誤,將波及最弱勢的美國民眾。
AERO 是 AI 驅動政府效能的範本,還是「快速行動於複雜系統的意外代價」的警示錄,或許只有在多年之後才能得到答案:AI 的錯誤率有多高?那些遭到錯誤標記並提出申訴的機構命運如何?當演算法的錯誤令一家診所失去聯邦資助,誰來負責?
工具已經就位。答案,還在書寫之中。