ChatGPT、Claude、Gemini三大生態系並行,N8N、Zapier等自動化工具持續演進,俗稱「小龍蝦」的OpenClaw掀起一波「安裝又棄養」的風潮,每隔幾週就有新名詞需要重新認識。
企業與個人投入大量時間在工具的選擇與切換之間,效率卻未必隨之提升,工作者往往還沒搞清楚自己要解決什麼問題,就已經陷入工具焦慮的循環。
本集未來城市邀請Aiworks校長黃琇琳,從模型選擇、功能應用到資安風險,分析知識工作者真正需要建立的AI實戰思維。
未來城市Podcast EP.126
▹ 未來主持人:未來城市頻道資深總監 陳芳毓
▹ 未來大來賓:Aiworks校長 黃琇琳
▹ 訪談精華:
主持人問(以下簡稱問):您曾說AI Agent可以讓工作者從「搬磚的人」變成「指揮官」。但很多人用了AI之後,只是從一個工具搬到另一個工具,要轉換為「指揮官」的關鍵是什麼?
黃琇琳(以下簡稱黃):搬磚者和指揮官最大的差異,在於是否清楚認識自己的工作流程。
早期,大家習慣用對話視窗跟ChatGPT一來一回,把AI當助理,分配一些單點任務給它,這種模式本質上還是工具思維。
指揮官的思維則是:先定方向,再讓AI跑完整的流程,真正賦予它責任去執行一段任務。
這個轉變需要使用者先自問:這個工作任務的目標是什麼?期望的產出標準是什麼?流程裡有哪些關鍵步驟?有了這份認知,才能清楚定義每個階段的輸入內容、預期產出與中間的處理邏輯。
這些是讓AI真正跑起來、而非每次靠對話推進的前提。
問:ChatGPT、Claude、Gemini三大語言模型及其週邊服務各有什麼定位?不同類型的工作者該怎麼挑選適合的模型?
黃:三大宇宙各有各的所長,沒有絕對的優劣,端看要解決的問題是什麼。
- ChatGPT:對準最廣泛的消費族群,走通用型知識平台路線,上手容易,也串接Notion、Google Workspace等常用App,各種類型的知識工作者都能快速使用。
- Claude:在工程師社群大受歡迎,架構能力是核心強項,給定一個產品概念,就能完整生成一套軟體服務或網站。Claude Cowork已可直接操作本機資料夾,工具串接能力持續延伸。
- Gemini:強項是與Google Workspace的深度整合,跨軟硬體的生態系是其他兩者難以複製的。NotebookLM的多元輸入與影音、簡報輸出能力,也是它目前最具代表性的殺手級應用。
實際上,同一個工作者跨用兩個生態系很常見。
更值得關注的新趨勢是:微軟的Copilot最近推出了深度研究模組,用Claude做深度研究,再用OpenAI的模型做交叉檢核,透過不同模型相互驗證來降低幻覺風險。
AI Works內部也有類似做法,對準確性要求高的任務,會再丟給另一個Agent確認正確性。
問:現在很多AI平台都有「深度研究」(Deep Research)功能,它和平常對話式查資料有什麼本質上的差別?適合用在哪類任務?
黃:很多人查資料時,還是沿用Google關鍵字搜尋的慣性思維,結果拿到的是高度片段、缺乏全貌的資訊。「深度研究」的邏輯不一樣,更像是一位有能力的研究員:給它一個研究目標,它會先思考要從哪些視角切入,包含研究對象、資料來源的類型、比較的維度、輸出的格式,接著才開始執行。
這是「慢想」,而不是「快思」。
啟動深度研究時,模型會先羅列幾條待釐清的方向並逐一推進,確認之後才開始大量搜尋,資料來源的廣度與資訊整合的深度,都遠超一般對話模式。
這種功能特別適合需要洞察力的任務,例如競品分析、市場調查或定價策略研究。使用時仍要記得給足背景、任務與限制,有些模型版本還會主動反問釐清,這些都能拉高準確性。
問:ChatGPT的Project、Claude的Skill都是常用的AI功能,在實際工作中能解決什麼問題?
黃:Project是一種分類管理機制。你可以在ChatGPT裡開一個專案,設定知識庫,可以直接連結Google Workspace或上傳檔案,再寫好System Prompt,也就是系統層級的提示詞,告訴AI期待的產出方向與口吻。
這樣一來,在這個專案裡的所有對話,AI都會自動帶入預先設定的脈絡,不需要每次重新複製貼上。對內容工作者而言,管理不同通路的貼文風格或不同品牌的行銷素材,Project是很自然的解法。
Skill則更像是一份可被重複呼叫的SOP。AI本身有原生的技能,例如呼叫Python做數據分析,或生成PDF檔案;但你也可以把自己工作中重複的流程寫成客製化Skill。
以名片整理為例,以名片整理為例,我習慣一次拍攝多張名片,將這套流程訓練成Skill後,模型能自動辨識單張照片內的多張名片、完成欄位解析、寫入Google Drive指定資料夾,再同步至CRM系統。
寫成Skill之後,模型每次只需在適當時機從工具箱取出對應工具,既省去每次現場試錯的成本,也不會因為堆疊指令而塞爆Context Window。
需要特別提醒的是,網路上流通的第三方Skill中,有一定比例內嵌惡意指令,會驅使模型下載有問題的軟體。使用前務必逐字審閱內容,不能只憑名稱與描述判斷。
問:在安全性上,使用AI Agent時有哪些容易被忽略的風險?
黃:個人使用層面,最重要的習慣是「先預覽後執行」。AI的能力愈來愈強,可以直接在電腦上操作資料夾、刪除檔案,每一個授權提示都值得認真看,不要因為覺得煩就一路按Yes。
刪除類的操作要特別謹慎,如果是複雜任務,建議給AI一個乾淨的沙盒環境,只連接授權存取的資料來源,降低意外風險。
企業使用層面,有幾件事更不容忽視。
首先是「零訓練」設定,也就是餵入模型的資料,要確認不會被用於後續的模型訓練。
ChatGPT的預設是開啟的,要手動關掉;Claude同樣需要確認;Gemini個人版沒有辦法調整,企業版的預設則是關閉的。
其次是資料有沒有被送出去到外部雲端廠商。
以OpenClaw為例,不少使用者誤以為模型運算發生在本機的Mac Mini上,實際上資訊依然是往外送到外部AI模型,包含健保卡等個人敏感資料都有人直接餵進去。先不論個人的資安風險,在企業場景裡,這樣的操作在個資法規上有相當大的法律風險。
問:N8N、Zapier這類自動化工具還有價值嗎?AI Agent能力愈來愈強,會不會直接取代它們?
黃:自動化工具和AI Agent適合解決的問題類型不同,不會單純被取代。
自動化工具的核心優勢是穩定性,規則設定好之後,每次執行結果完全一致,成本也相對可控,部分RPA工具甚至跑完不需要付費。AI Agent每次執行前需要先推理、判斷要呼叫哪個Skill,成本結構不一樣,也有機率帶來些微的結果差異。
高頻、穩定、規則清晰的任務,交給自動化工具仍然是最好的選擇。
AI Agent適合插入那些以前自動化無法處理的高變動環節,例如訂單與發票之間出現異常時,有很多種除錯可能,就很適合讓AI介入判斷原因。
更完整的做法是讓AI擔任指揮官,在前端判斷情境,決定要啟動哪一段自動化流程,兩者分工互補,整體可以處理的範圍就會拉得更廣。
問:三大AI生態系各有擁護者,跨平台又有磨合成本。面對工具焦慮,該怎麼決定用哪個工具?有沒有一套簡單的選擇原則?
黃:解決工具焦慮的方法,不是學更多工具。回歸到自身的工作與生活,先釐清有沒有真正待解決的問題,有的話再去評估哪個工具最適合接入;若只是好奇試用,也無妨,但請先確認安全性風險再動手。
三大語言模型各有強項,沒有絕對最優解,適合在不同情境搭配使用。
對OpenClaw這類整合型工具也是一樣的邏輯,它24小時待命、Skill豐富、體驗流暢,但授權愈多、風險愈高,要不要用,取決於自身需求,以及願意承擔多少資安風險。
聽懂未來:關於學習AI時代的新工具,我還想知道更多⋯
未來城市給你更多知識補充包!
- 不會寫程式也能開發APP?Vibe Coding是神技還是話術?
- 前LINE總經理為何學Vibe Coding?只看報告不動手,AI時代會失去決策手感
- Agentic AI(代理式AI)是什麼?為何它是企業AI落地、解決缺工的最後一哩路?
想聽更多未來城市Podcast節目?
- 首播時間:隔週六播出。
- 頻道搜尋:天下雜誌Podcast頻道「聽天下」,或關注未來城市網站「未來城市Podcast」系列內容。





