文章重點
- Gemini推出預設影片生成模板,用戶無需專業提示詞即可生成商業級短影片,大幅降低AI影片創作門檻
- Android應用自動化功能讓Gemini直接操控手機App:一句話叫外賣、訂雜貨、叫車,從對話式AI躍升為行動式AI
- AI原創音樂功能可從文字、圖片甚至影片生成配樂,挑戰傳統音樂產業的創作模式和版權框架
- 3月23日Gemini全面整合Google Marketing Platform,AI生成廣告素材將直接進入全球最大數位廣告系統
- Google正從「搜索引擎公司」全面轉型為「AI原生平台公司」,三月更新是這一轉型的集中體現
影片模板:讓AI影片從「技術展示」走向「實用工具」
Gemini此次推出的預設影片生成模板(Pre-designed Video Generation Templates),解決了AI影片生成領域長期存在的一個痛點:普通用戶不知道怎麼寫出好的提示詞。過去一年,無論是OpenAI的Sora還是Google自家的Veo,AI影片生成的技術能力已經令人驚嘆,但實際使用率遠低於預期。核心原因就在於,生成一段品質可用的影片需要精心設計的提示詞、風格指定、鏡頭語言描述,這本質上是一項專業技能。
模板的出現徹底改變了這個等式。Google預設了數十種常見場景的影片模板——產品展示、社交媒體廣告、活動預告、教育教學、新聞簡報等。用戶只需選擇模板、填入基本資訊(產品名稱、關鍵賣點、品牌色調),Gemini就會自動生成帶有專業構圖、流暢轉場和適當節奏的短影片。這對於香港數量龐大的中小企而言意義重大——一個開淘寶店或者做Instagram行銷的小商家,現在可以在五分鐘內製作出過去需要外包給製作公司、花費數千元的廣告影片。
但模板策略也有其隱憂。當所有人都使用相同的模板生成影片時,內容的同質化問題將迅速浮現。就像Canva的模板讓每個初創公司的簡報都長得差不多一樣,Gemini的影片模板可能導致社交媒體上充斥著風格雷同的AI廣告,反而降低用戶的注意力和信任度。這是Google後續需要通過不斷豐富模板庫和提供更多個性化選項來解決的挑戰。
Android App自動化:手機操控方式的典範轉移
Gemini的Android應用自動化功能,可能是三月更新中最具革命性的一項。簡單來說,用戶可以對Gemini說「幫我在Foodpanda訂一份去年常點的那家泰國菜」或者「用Uber叫一輛車去中環IFC」,Gemini會自動打開對應的App、完成瀏覽、選擇、下單等一系列操作。第一批支援的場景包括外賣訂餐、雜貨採購和叫車服務。
這項功能的技術實現依賴Gemini對Android系統的深度整合。通過Android的無障礙服務(Accessibility Services)API和全新的App Actions框架,Gemini可以「看到」每個App的介面元素、理解其功能、並像真人用戶一樣進行點擊、滑動和輸入操作。這不是簡單的API調用——它是一個AI代理在模擬人類使用手機的完整行為。
從產品設計的角度看,App自動化功能代表了人機互動的一次根本性轉變。過去二十年,我們一直在適應手機的操作邏輯——學習每個App的介面、記住功能按鈕的位置、按照App設計者的思路完成操作。App自動化將這個關係反轉過來:不再是人類適應機器,而是機器理解人類的意圖並自主完成操作。
App自動化的安全機制
Google為防止誤操作設置了多層確認機制:涉及付款的操作必須經過用戶明確授權,敏感個人資訊的存取需要二次驗證,且所有自動化操作都會留下完整的操作日誌供用戶事後查閱。Gemini不會在未經允許的情況下完成任何交易。
對於香港用戶而言,App自動化的實用價值取決於本地App的支援程度。目前公佈的合作夥伴以美國App為主,但Google已確認正在與亞太區主要服務商洽談合作。如果Foodpanda、Deliveroo、HKTaxi等香港常用App能夠加入支援行列,這項功能將極大簡化都市人的日常生活操作。
AI原創音樂:從配樂工具到創作引擎
Gemini新增的原創音樂功能允許用戶從多種輸入源生成音樂:可以用文字描述想要的風格和氛圍(「一段適合日落海灘的輕鬆爵士」)、上傳一張圖片讓AI根據視覺氛圍譜曲、甚至直接為一段影片自動生成匹配的背景配樂。這是Google在音樂AI領域繼MusicLM和MusicFX之後的最新進展,品質已經達到了可用於商業項目的水準。
技術層面,這項功能最令人印象深刻的是「影片轉音樂」的能力。Gemini能夠分析影片的視覺節奏——鏡頭切換的頻率、場景的明暗變化、人物動作的速度——然後生成與這些視覺元素同步的音樂。這意味著自媒體創作者不再需要花費大量時間在影片庫中搜索合適的背景音樂,也不用擔心版權問題。
但音樂產業的反應不容樂觀。香港音樂人協會和國際唱片業協會(IFPI)已多次對AI音樂生成表達關切,核心問題在於:如果AI音樂是通過學習現有音樂作品訓練出來的,那麼生成的「原創」音樂是否侵犯了訓練數據中音樂人的版權?Google表示其訓練數據已獲得合法授權,但具體授權範圍和分潤機制仍然不透明。
Google Marketing Platform整合:AI廣告的規模化時刻
3月23日,Gemini將全面整合進入Google Marketing Platform(GMP),這是全球最大的數位廣告投放平台之一。整合後,廣告主可以直接使用Gemini生成廣告文案、圖片和影片素材,並通過GMP的精準投放系統自動觸達目標受眾。這標誌著AI生成內容(AIGC)正式進入全球數位廣告的主流生產鏈。
對於香港的數位行銷行業而言,這次整合的影響將是深遠的。目前香港的數位廣告市場規模約為80億港元,其中Google廣告佔比超過40%。當AI可以在幾秒鐘內生成數十個版本的廣告素材,並通過A/B測試自動優化時,傳統廣告公司的「創意-製作-投放」工作流程將被根本性重構。那些主要靠大量產出標準化廣告素材為生的中小型廣告代理商,將面臨AI替代的直接威脅。
值得關注的是,GMP整合還將帶來廣告個性化的新層次。過去的程序化廣告主要根據用戶畫像選擇預製的廣告素材,但Gemini整合後,系統將能夠為每一個受眾群體甚至每一位用戶動態生成定制化的廣告內容。這種「千人千面」的廣告生成能力,將徹底改變廣告主對「創意」的定義——從製作一個完美的廣告,變成設計一套能夠自動衍生無數變體的創意系統。
「Gemini與Google Marketing Platform的整合不是技術升級,而是廣告產業的結構性重組。當AI能在幾秒鐘內完成過去需要一個團隊一週的工作,廣告公司的價值必須從『製作能力』轉向『策略洞察』。」——香港數碼營銷協會主席
Google的全場景AI策略:從搜索到生活的全面覆蓋
將影片模板、App自動化、AI音樂創作和廣告平台整合放在一起看,Gemini三月更新的真正意圖就非常清晰了:Google正在將AI從一個對話框擴展到用戶數位生活的每一個場景。早上起床,Gemini幫你叫車上班;工作中,它幫你製作簡報和廣告素材;創作時,它幫你生成影片配樂;投放廣告時,它幫你優化素材和受眾。這是一個「AI無處不在」的產品願景。
這個策略與Apple的Siri重塑計劃形成直接競爭。Apple在2025年宣佈將大幅強化Siri的AI能力,目標也是讓Siri能夠操控手機上的所有App。但Apple的進度明顯落後於Google——截至2026年3月,新版Siri的App操控功能仍在有限測試中,而Gemini已經開始向用戶推送。在AI手機助理的賽道上,Google首次取得了對Apple的實質性領先。
然而,全場景AI也帶來了前所未有的隱私風險。當一個AI同時知道你的飲食習慣(外賣記錄)、出行模式(叫車記錄)、工作內容(文件和簡報)和消費偏好(購物記錄)時,它對你的了解可能超過你最親密的家人。Google如何在提供便利的同時保護用戶隱私,將決定Gemini能否真正成為用戶信賴的全場景AI助理。
與競爭對手的差異化分析
Gemini三月更新的獨特之處,在於它同時覆蓋了內容創作(影片、音樂)、日常操作(App自動化)和商業應用(廣告平台)三個維度。相較之下,OpenAI的產品策略更專注於對話和推理能力的深度,微軟Copilot聚焦於辦公生產力場景,而Meta的AI佈局則圍繞社交媒體生態。Google的「廣度優先」策略在短期內會分散資源,但長期來看,它在建構一個覆蓋用戶完整數位生活的AI生態系統。
對於開發者社區而言,Gemini三月更新也釋放了重要信號。App自動化功能意味著第三方開發者需要開始為「AI操控」而非「人類操控」來優化自己的App介面和工作流程。那些率先適配Gemini自動化框架的App將在用戶體驗上獲得顯著優勢,而拒絕適配的App則可能被Gemini的推薦系統邊緣化。這是Google用AI能力重塑Android生態權力格局的又一步棋。
香港創作者和企業的行動建議
對於香港的內容創作者而言,Gemini的影片模板和音樂功能降低了創作的技術門檻,但同時也意味著競爭門檻的降低。當每個人都能輕鬆製作影片時,差異化將更加依賴於創意構思、個人風格和與受眾的情感連結,而非製作技術本身。短期內建議學習如何高效使用這些新工具,中期則需思考如何在AI輔助創作的大潮中保持獨特性。
對於香港企業的行銷團隊,3月23日的GMP整合是一個需要提前準備的節點。建議在整合上線前完成以下準備:盤點現有的廣告素材生產流程,識別哪些環節可以由AI替代;與廣告代理商討論AI時代的合作模式調整;培訓內部團隊使用Gemini生成素材的技巧;制定AI生成內容的品質審核標準和品牌一致性檢查清單。
最關鍵的一點是:不要把這些功能僅僅當作效率工具來看待。Gemini三月更新的本質是Google在重新定義人與數位服務之間的互動方式——從「用戶主動操作App」到「AI代理自主完成任務」。理解這個範式轉移,比學會使用任何具體功能都更加重要。那些率先適應這種新互動模式的企業和創作者,將在接下來的市場競爭中佔據先機。