政策

美國聯邦政府用 ChatGPT 追查2000億美元醫療補助詐欺

美國衛生及公共服務部在全美50個州部署 ChatGPT 等 AI 工具，分析多年醫療補助審計資料，目標鎖定每年估計高達1000至2000億美元的浪費、詐欺與不當支出。AERO 計畫引發關於 AI 準確性、正當程序，以及聯邦政府是否以 AI 作為政治武器的深刻爭議。

1 小時前 1 分鐘閱讀

在華盛頓特區的一棟聯邦辦公大樓裡，美國衛生官員正將一款消費者聊天機器人，轉化為美國公共政策史上最具影響力的審計工具之一。衛生及公共服務部（HHS）正在使用 ChatGPT——數百萬美國人用來撰寫電郵和整理資料的同一款產品——掃描全美50個州超過五年的醫療補助（Medicaid）審計資料，搜尋官員估計每年高達1000億至2000億美元的浪費、詐欺與不當支出。

這項計畫正式名稱為「審計執法與風險監督」（Audit Enforcement and Risk Oversight，AERO）倡議，於2026年5月21日由 HHS 財務資源助理部長 Gustav Chiarello 宣布。這是美國聯邦政府史上最大規模的商業 AI 部署之一，也是爭議最大的一次。

AERO 如何運作

AERO 的範圍刻意設計得極為廣泛。計畫針對每年接受超過100萬美元聯邦資金的所有機構——這個門檻涵蓋的不僅是各州醫療補助計畫，還包括研究機構、成癮治療機構、托兒服務網絡，以及數百個共同構成美國龐大醫療與社會服務體系的聯邦補貼計畫。

AI 工具（包括現成的 ChatGPT 以及輔助的大型語言模型）負責分析「單一審計」（Single Audit）報告——即聯邦法律要求各州和受助機構每年提交的標準化財務報告。系統會尋找長期不合規的模式：反覆出現的缺陷、重大管控漏洞，以及受助機構儘管已收到聯邦調查結論卻「持續未能改善」的問題。

當系統標記異常後，人類分析師會在執法行動啟動前進行複查。至少在理論上是如此。

問題的規模

要理解 AERO 的存在邏輯，首先要了解美國醫療支出的驚人規模。Medicaid 每年向全美50個州撥付約9000億美元，服務超過8000萬低收入美國人。聯邦對這筆支出的監管，歷來依賴一套由各州審計師、年度報告和定期聯邦審查構成的拼湊機制——這套系統是為前數位時代設計的，早已跟不上現代醫療帳務的複雜程度。

獨立估算顯示，Medicaid 每年浪費、詐欺與不當支付的規模，約佔總支出的10%至22%——這正是 HHS 官員引用「1000億至2000億美元」數字的依據。即便只追回其中一部分，也將是美國政府史上規模最大的財政收回行動之一。

爭議：準確性、問責制與政治化

儘管潛在影響深遠，AERO 已引發醫療政策研究者、各州官員與公民自由倡導者的尖銳批評，這些批評可歸納為三個層面。

準確性問題。 以通用商業語言模型分析複雜政府財務文件，在如此規模下前所未有。批評者指出，ChatGPT 等模型可能產生「幻覺」——以充滿自信的語氣輸出事實錯誤的結論——而醫療帳務代碼的模糊性、各州特有的會計慣例，以及跨越多年的審計軌跡，恰恰製造了最容易產生 AI 錯誤、且最難被發現的條件。一位聯邦醫療分析師告訴《波士頓環球報》：「這些不是簡單的文件。一款現成聊天機器人能可靠地在一份400頁的州級 Medicaid 審計報告中找出詐欺，這種說法需要非凡的證據支撐。」

正當程序問題。 HHS 擁有相當嚴苛的執法權：可以暫停撥款、追回已發放資金，極端情況下甚至可以完全終止聯邦補助。批評者認為，若 AI 錯誤標記了某州的審計記錄，而舉證責任落在被標記的州身上，整個程序實際上顛覆了聯邦政府與各州資助關係中歷來遵循的「合規推定」原則。

政治化問題。 最尖銳的批評也許指向 AERO 最積極執法行動的地理分佈。川普政府在 AERO 宣布前後，向明尼蘇達州扣押了數億美元、向加州扣押了逾10億美元的 Medicaid 資金——兩者皆為民主黨執政州，且與本屆政府有過公開衝突。批評者認為這絕非巧合。行政部門官員則以客觀的審計不合規記錄為由反駁。

HHS 的立場

Chiarello 對計畫的目標與限制一向直言不諱。他表示，AERO 是為了識別傳統審計管道遺漏的長期不合規問題，而非取代人類判斷——而是讓人類判斷得以規模化。那些在被標記後積極配合改正的受助機構，將在 HHS 找到願意合作的夥伴；不配合的，將面臨後果。

在 AI 準確性問題上，HHS 官員強調，AERO 的輸出結果在做出執法決定前，都會經過人類分析師的複核。系統負責提出可疑對象，人來做最終決定。

計畫的發布也得到高層政治背書——副總統 JD Vance 曾公開呼籲利用 AI 推動聯邦監管現代化，CMS 局長 Mehmet Oz 則直接向各州 Medicaid 主任發出不合規後果警告。

AI 進入政府的範本

無論 AERO 的是非功過如何評判，這個計畫代表著美國聯邦政府使用商業 AI 工具方式的一個重要轉折點。過去的政府 AI 部署，通常涉及客製化系統、漫長的採購流程，以及範圍狹窄、定義明確的使用場景。AERO 截然不同：它由政治任命官員拍板，以消費者產品為工具，在美國公共衛生財政的全部複雜性中展開，時間線以週計算而非年計算。

這種速度既是 AERO 的賣點——傳統政府採購可能需要數年才能完成 AERO 在數月內達成的事——也是其最大的風險。在高風險情境下大規模部署、缺乏充分領域驗證的 AI 系統，會產生系統性錯誤，而在 Medicaid 執法中的系統性錯誤，將波及最弱勢的美國民眾。

AERO 是 AI 驅動政府效能的範本，還是「快速行動於複雜系統的意外代價」的警示錄，或許只有在多年之後才能得到答案：AI 的錯誤率有多高？那些遭到錯誤標記並提出申訴的機構命運如何？當演算法的錯誤令一家診所失去聯邦資助，誰來負責？

工具已經就位。答案，還在書寫之中。

資料來源

醫療政策醫療補助 ChatGPT 政府AI 詐欺偵測政策