2026/08/09 –, RB102
Google 推出 Gemma 4 的時候附了 model card 和 safety benchmark,但那些數字是 Google 自己測的。如果你用 OWASP LLM Top 10 的標準,從攻擊者視角重新掃一遍,結果會一樣嗎?
這場議程分享我們在 NVIDIA DGX Spark GB10 和 Mac mini M4(MLX)上對 Gemma 4 26B 進行紅隊掃描的完整過程與結果。我們用 OpenClaw 攻擊鏈逐項測試 OWASP LLM Top 10 的風險項目,包括 Prompt Injection(LLM01:7 項測試通過 5 項)、Visual Prompt Injection(3 項測試確認 2 項弱點),以及其他類別的實測數據。
你會看到的不是理論分析,而是一份有具體 pass/fail 的成績單。我們會拆解每一項測試的攻擊手法、Gemma 4 的實際反應、以及哪些弱點可以用 NemoClaw Guardrail 補強。
這場的目標不是說 Gemma 4 不安全,而是讓每一個用開源模型的開發者知道:model card 上沒寫的風險,你要自己測。我們會開源測試腳本,讓你對任何開源 LLM 跑同樣的弱掃流程。
Fngi 專注於 AI 安全治理與 LLM 紅隊測試。曾任多家台灣機構 CISO,同時擔任 GDG Taipei Organizer 及台灣金融研訓院 AI 安全講師。擁有超過十年資安與全端工程經驗。