從這裡開始行動 - 讓AI影片成果快速上手,效率提升又能兼顧美感與一致性
- 上傳高解析度、主體明確的圖片作為素材,每張至少1080p。
高品質輸入會直接提升AI影片生成的細節與視覺吸引力[1][3]。
- 撰寫具體描述且包含動作、情境的提示詞,字數控制在50字以內。
簡明扼要又具體能幫助AI更準確理解需求,減少試錯次數[2]。
- 每次調整設定後立即產出短片(建議5秒內)進行預覽測試。
短時長能快速檢查效果並微調參數,加快反覆修正速度[2]。
- 實驗不同創意設置(如低至高),每輪至少嘗試三種變化再比對選用。
`創意自由度`會影響成品風格,多版本可找出最貼近需求的表現[2]。
想看成果?試用連結和短片截圖先行
運用 AI 來優化自己的工作流程,這件事好像一直都在說,但今天就真的動手打造一個 YouTube Shorts 生成工具了。嗯,其實也沒那麼厲害啦,只是想偷懶而已。每次做短影片都要重複那些無聊的步驟,誰受得了?所以這篇會講一下怎麼從零開始弄一個自動化的 Shorts 應用程式——包括我怎麼在 Manus 上寫提示語給它生出 Python 程式碼,那段過程說起來有點囉唆,不過等下還是得提一下。唉,我剛才還差點忘記順便介紹前端部分,用 Windsurf 加 Streamlit 把腳本包裝成網頁應用,讓人可以隨意操作。不過如果你只想先看結果、根本不關心細節,那也行,有連結可以直接去瞄一眼;另外,也放了幾張產出的短影片截圖,這樣比較直觀。
再來就是 Manus 怎麼拿來處理影片生成邏輯了。我第一個丟進去的提示語長這樣:
> _produce a python script for automation of youtube shorts. the video itself (1080 x 1920 pixels or a 9:16 aspect ratio) is a centered image which will be passed as input._【注意事項】,
噢對,其實看到那堆英文有點煩躁,但又不能不用。不過總之嘛,重點就是指示它要產生一支能自動化 YouTube Shorts 製作流程的 Python 腳本——設定好的尺寸(1080 x 1920 像素,也就是所謂9:16比例),然後主畫面中央是一張圖片、輸入檔案自己決定。我那時還分神去查了一下其他人的範例,再拉回正題後才發現其實這種腳本很快就能跑起來。雖然只是小工具,但卻省掉好多繁瑣步驟。有些細節晚點再說,大概就是這樣吧。
再來就是 Manus 怎麼拿來處理影片生成邏輯了。我第一個丟進去的提示語長這樣:
> _produce a python script for automation of youtube shorts. the video itself (1080 x 1920 pixels or a 9:16 aspect ratio) is a centered image which will be passed as input._【注意事項】,
噢對,其實看到那堆英文有點煩躁,但又不能不用。不過總之嘛,重點就是指示它要產生一支能自動化 YouTube Shorts 製作流程的 Python 腳本——設定好的尺寸(1080 x 1920 像素,也就是所謂9:16比例),然後主畫面中央是一張圖片、輸入檔案自己決定。我那時還分神去查了一下其他人的範例,再拉回正題後才發現其實這種腳本很快就能跑起來。雖然只是小工具,但卻省掉好多繁瑣步驟。有些細節晚點再說,大概就是這樣吧。
一開始怎麼下Prompt才讓AI懂你要什麼?
背景就是會直接用一個實心色塊啦,這顏色是從你給的那張圖裡面、最明顯的那種主要色調挖出來的——我有點好奇怎麼抓,但沒空深究。然後,圖像本身也會被加上一層陰影(這招很常見吧),所以看起來就有點立體、有浮出背景的感覺。嗯,有時候想一想,這種效果真的必要嗎?不過設計師好像都堅持要做。
至於那些所謂「輸入項目」,全部都能讓使用者自己調整設定喔。對,就是每個參數都可以改,不用硬碰硬地寫死在程式裡頭。啊差點岔題,重點是這些參數啊,都要放成全域變數才行,千萬別寫到什麼環境變數上面去,不知道為什麼有人老是搞混。唉,我自己以前也弄錯過啦。
最後提醒一下——中心圖像,其實就是你拿來用的那個正方形比例影像,格式嘛……呃,好像快講太細了。不過總之就是這樣啦,別再問細節了,可以嗎?
至於那些所謂「輸入項目」,全部都能讓使用者自己調整設定喔。對,就是每個參數都可以改,不用硬碰硬地寫死在程式裡頭。啊差點岔題,重點是這些參數啊,都要放成全域變數才行,千萬別寫到什麼環境變數上面去,不知道為什麼有人老是搞混。唉,我自己以前也弄錯過啦。
最後提醒一下——中心圖像,其實就是你拿來用的那個正方形比例影像,格式嘛……呃,好像快講太細了。不過總之就是這樣啦,別再問細節了,可以嗎?

Python自動化腳本,參數設計全放哪裡
我那天搞完影片,檔案格式一堆亂七八糟的要求,什麼 png 或 .jpg 格式啦,然後背景音訊又只能收 .wav、.mp3。結果還得再設定一下那個背景音訊的起止時間,你懂嗎?這樣才會決定最後影片到底多長。啊,我差點忘記主題了。
總之,等工作都完成以後,我就讓 Manus 幫我生成了一份 readme 的說明文件。他裡面有解釋腳本在幹嘛,也有把參數列出來——對了,好像還特別提到輸出內容跟怎麼跑腳本的步驟。我記得安裝套件時還一直跳警告,有夠煩,不過細節基本都有被記錄下來,其實也滿完整的啦。
我進 Visual Studio Code,那個介面看久會有點頭暈欸,但沒辦法,只好硬著頭皮加裝那些 Python 函式庫。唉,幸好裝完之後程式就能跑起來了,不然真的不知道該怎麼辦,好累。
總之,等工作都完成以後,我就讓 Manus 幫我生成了一份 readme 的說明文件。他裡面有解釋腳本在幹嘛,也有把參數列出來——對了,好像還特別提到輸出內容跟怎麼跑腳本的步驟。我記得安裝套件時還一直跳警告,有夠煩,不過細節基本都有被記錄下來,其實也滿完整的啦。
我進 Visual Studio Code,那個介面看久會有點頭暈欸,但沒辦法,只好硬著頭皮加裝那些 Python 函式庫。唉,幸好裝完之後程式就能跑起來了,不然真的不知道該怎麼辦,好累。
把README外包給Manus,有搞頭嗎?
我每次看到 Manus 在那裡自動、不厭其煩地修正自己的方案,好像永遠停不下來,直到完全對應到一開始的需求時,我都會忍不住覺得這種「執著」有點可愛。唉,機器人怎麼比我還堅持啊?不過也只能佩服。
## 與 Manus 合作新增波形視覺效果
欸…說真的,每次回頭看那些跟它合作做出來的影片,其實成果還行啦,不算差。不過嘛,總覺得哪裡可以再更有趣一點、抓住人眼球一點,你懂那種感覺嗎?嗯,有時候靈感就是突然冒出來,比如這次——腦中閃現:「要是加個波形視覺效果呢?」讓音樂用畫面流動起來,看起來就不只是影像配樂,而是整體連成一氣。話說,我前陣子才在想晚餐要吃什麼……啊扯遠了,拉回主題。
既然心血來潮,就只好煩一下 Manus 了,所以我們為了這個功能多溝通了幾輪。我最早丟給它的請求內容,大致上長這樣:
> _我有兩個額外需求與影像產生工作負載相關:_
> _你可以生成波形動畫並將其加入影片(請讓它水平對齊圖片,但位置在圖片下方)嗎?_
有沒有發現,我要求還挺細。就怕最後跑出奇怪的位置,只能反覆盯著螢幕碎碎念「到底行不行啊」。但至少現在看,它會乖乖根據我的需求慢慢調整——雖然偶爾還是需要提醒幾句。不曉得是不是因為太專注,有時候自己都沒注意時間已經很晚了。
## 與 Manus 合作新增波形視覺效果
欸…說真的,每次回頭看那些跟它合作做出來的影片,其實成果還行啦,不算差。不過嘛,總覺得哪裡可以再更有趣一點、抓住人眼球一點,你懂那種感覺嗎?嗯,有時候靈感就是突然冒出來,比如這次——腦中閃現:「要是加個波形視覺效果呢?」讓音樂用畫面流動起來,看起來就不只是影像配樂,而是整體連成一氣。話說,我前陣子才在想晚餐要吃什麼……啊扯遠了,拉回主題。
既然心血來潮,就只好煩一下 Manus 了,所以我們為了這個功能多溝通了幾輪。我最早丟給它的請求內容,大致上長這樣:
> _我有兩個額外需求與影像產生工作負載相關:_
> _你可以生成波形動畫並將其加入影片(請讓它水平對齊圖片,但位置在圖片下方)嗎?_
有沒有發現,我要求還挺細。就怕最後跑出奇怪的位置,只能反覆盯著螢幕碎碎念「到底行不行啊」。但至少現在看,它會乖乖根據我的需求慢慢調整——雖然偶爾還是需要提醒幾句。不曉得是不是因為太專注,有時候自己都沒注意時間已經很晚了。

影像生成美感,為何加上3D陰影與主色背景
唉,說到這個背景啊,其實我一直覺得單一色塊有點……太無聊了吧?總之現在要加個參數,好讓使用者自己選啦——到底要繼續用目前那種純色背景,還是乾脆直接把圖片拿來做模糊處理,用它當背景,但又能維持原圖本身的樣貌沒變。嗯,我自己也很想早點有這功能,不然老看著同一色調會麻木欸。有時候在做設計的時候,一直盯著純色真的很煩,有沒有共鳴?
而且你看,Manus之前第一次試的時候,不知怎地就已經先弄出波形視覺化功能了,連腳本裡面都自作主張多塞了一堆波形相關的參數設定。奇怪,本來我下次才打算提這事,他卻好像心電感應到似的偷跑一步,有點嚇到。嘛,先拉回正題。我在想,也許搞不好他自己也等不及,所以才預先都寫進去了。真不曉得該哭還是該笑……總之需求就是:參數給我加上去,讓背景可以選擇要不要用圖模糊,而不是只能維持單一純色;然後原圖必須完整留著。
而且你看,Manus之前第一次試的時候,不知怎地就已經先弄出波形視覺化功能了,連腳本裡面都自作主張多塞了一堆波形相關的參數設定。奇怪,本來我下次才打算提這事,他卻好像心電感應到似的偷跑一步,有點嚇到。嘛,先拉回正題。我在想,也許搞不好他自己也等不及,所以才預先都寫進去了。真不曉得該哭還是該笑……總之需求就是:參數給我加上去,讓背景可以選擇要不要用圖模糊,而不是只能維持單一純色;然後原圖必須完整留著。
波形動畫亂入:功能需求的折衝現場記錄
本來還以為那個波形圖會有點變化,結果它就是死板地一直畫三角形。怎麼講呢,換了幾首歌、幾段音檔,全是三角形,不管怎麼弄都一樣,好像卡住不動腦。嗯,我試著再塞給它幾個額外提示,它才終於願意改變一下路線——開始出現比較貼近實際音訊起伏的波形,而不是只會生成三角形這種死規格。唉,有時候真的很想敲螢幕問「你到底懂沒?」可算搞定了。好啦,總之這部分差不多到此告一段落,影片腳本和 Manus 層也就停在這裡。我就轉頭跑去處理 Windsurf,那時主要是在 Streamlit 上寫前端網頁應用。
## 使用 Windsurf 編寫 Streamlit 應用
其實我對 Manus 跟 Windsurf 有不少地方還挺欣賞的啦,但心裡也是有點鬱悶,他們偶爾又太「聽話」……呃,離題了。Windsurf 那邊我特地故意提高難度,就是想看看它能不能跟上我的節奏:
> _閱讀本專案既有腳本並回報其功能_
欸,其實幸虧 Manus 加註解加得很勤快,不然 Windsurf 可能光看程式碼就要迷路了。有這些註解之後,大體上他們理解功能還算順利吧。不過,我中間又忍不住分神想,到底誰會耐心把整份代碼讀完?現實中大概沒多少人吧。但反正這次是讓 AI 來讀,所以無所謂,就照劇本走下去囉。
## 使用 Windsurf 編寫 Streamlit 應用
其實我對 Manus 跟 Windsurf 有不少地方還挺欣賞的啦,但心裡也是有點鬱悶,他們偶爾又太「聽話」……呃,離題了。Windsurf 那邊我特地故意提高難度,就是想看看它能不能跟上我的節奏:
> _閱讀本專案既有腳本並回報其功能_
欸,其實幸虧 Manus 加註解加得很勤快,不然 Windsurf 可能光看程式碼就要迷路了。有這些註解之後,大體上他們理解功能還算順利吧。不過,我中間又忍不住分神想,到底誰會耐心把整份代碼讀完?現實中大概沒多少人吧。但反正這次是讓 AI 來讀,所以無所謂,就照劇本走下去囉。

Windsurf讀懂Manus寫的註解,到底靠什麼?
如果硬要說下一步嘛……唉,有時候也會想偷懶不動,但根據我對這段程式碼的理解,其實最合理的做法,應該就是用 Streamlit 做一個網頁應用。欸,剛剛講到邏輯性?嗯,是啦,不過現有那些全域變數,其實就擺明是在提醒我要設計輸入欄位給使用者填。想到這裡又想喝杯咖啡。
所以,如果我把那些變數搬進介面裡,大家就能自己玩自訂影片生成選項——講白點,就是他們想怎麼調整都行啊,沒什麼門檻。不知道你聽過 Manus 沒,反正 Windsurf 也搞了一個表現頗佳的 Streamlit 應用,有時候會拿來比較下,雖然比起來還是有些細節不同。
說到這又岔題了,我自己要加功能或改東西時,大多數時候都會再開一個新對話視窗,好像強迫症發作一樣。回頭想一下——其實,在 Windsurf 或 Cursor 之類工具上,每弄一次新功能,我都堅持獨立分開討論,那種感覺,比什麼都安心吧。好啦,又扯遠了……
所以,如果我把那些變數搬進介面裡,大家就能自己玩自訂影片生成選項——講白點,就是他們想怎麼調整都行啊,沒什麼門檻。不知道你聽過 Manus 沒,反正 Windsurf 也搞了一個表現頗佳的 Streamlit 應用,有時候會拿來比較下,雖然比起來還是有些細節不同。
說到這又岔題了,我自己要加功能或改東西時,大多數時候都會再開一個新對話視窗,好像強迫症發作一樣。回頭想一下——其實,在 Windsurf 或 Cursor 之類工具上,每弄一次新功能,我都堅持獨立分開討論,那種感覺,比什麼都安心吧。好啦,又扯遠了……
Streamlit介面客製,UI變化實驗筆記本
如果你真的有興趣的話,其實,跟Windsurf那邊聊來聊去,大部分時間都在討論那些輸入欄位到底要怎麼排才順眼,有時又糾結滑桿是不是乾脆換成普通的文字欄位。唉,這種細節搞到最後總是很煩人,不過也不得不面對。然後我自己反而會開始想別的,譬如說午餐到底要吃什麼,好啦還是回來繼續專案的話題。
和Manus還有Windsurf一起弄這個專案,嗯,說實話也讓我明白幾件蠻關鍵的事——就是和AI代理一起協同開發,到底會遇到什麼鬼東西。其實一開始想得太簡單了,我以為只要概念清楚、起步正確應該就沒問題。但誰知道後面總是不斷地調整,每次覺得快完成了,就偏偏那最後10%最麻煩,要一直打掉重練。
啊對了差點忘記,那個什麼滑桿的事,到底該不該改成標準文字欄位?其實心裡還是猶豫,但感覺大家都想趕快定下來。我自己有時會忍不住抱怨,不過畢竟開發本來就這樣吧?大概吧。
和Manus還有Windsurf一起弄這個專案,嗯,說實話也讓我明白幾件蠻關鍵的事——就是和AI代理一起協同開發,到底會遇到什麼鬼東西。其實一開始想得太簡單了,我以為只要概念清楚、起步正確應該就沒問題。但誰知道後面總是不斷地調整,每次覺得快完成了,就偏偏那最後10%最麻煩,要一直打掉重練。
啊對了差點忘記,那個什麼滑桿的事,到底該不該改成標準文字欄位?其實心裡還是猶豫,但感覺大家都想趕快定下來。我自己有時會忍不住抱怨,不過畢竟開發本來就這樣吧?大概吧。

AIGC協作反覆修正:心法、踩坑、偶爾犯蠢也正常吧
給出具體回饋這點,唔……有時候真的很難耶。像是你如果只是空泛地說「請改進」,大家都一臉茫然,到底要怎麼改?所以最好還是把例子丟出來,然後明白告訴 Manus 跟 Windsurf 你到底想要什麼樣的內容。嗯,不過我偶爾會分心去想,「咦,他們會不會覺得這樣太囉嗦?」但事實上,沒有人喜歡猜測需求,好吧,拉回來重點就是──越明確越好,別讓對方胡亂揣摩。
欸,再講到逐步構建喔,其實每次加一個新功能,比一口氣全部砍掉重練來得理智多了。有時候急著求快反而容易搞砸。就是說,如果每次只針對特定部份修改,不僅比較能掌握整個流程,而且遇到問題也好處理。我之前就常犯,一下子大改結果 bug 滿天飛,痛苦死了,所以現在學乖了,就慢慢來吧,大概比較安全。
最後那個測試與驗證啊,有夠重要。每當系統裡動了一根毛,都要記得跑一下原本的 Python 腳本和 Streamlit 應用程式。不然你以為自己沒弄壞東西,結果用戶都快氣瘋了才發現哪裡不通。嗯……有時候我自己都懶,但真的偷不得懶,每做完一次變更就趕緊確認新功能是不是如預期在運作,很煩,但必要啦。
欸,再講到逐步構建喔,其實每次加一個新功能,比一口氣全部砍掉重練來得理智多了。有時候急著求快反而容易搞砸。就是說,如果每次只針對特定部份修改,不僅比較能掌握整個流程,而且遇到問題也好處理。我之前就常犯,一下子大改結果 bug 滿天飛,痛苦死了,所以現在學乖了,就慢慢來吧,大概比較安全。
最後那個測試與驗證啊,有夠重要。每當系統裡動了一根毛,都要記得跑一下原本的 Python 腳本和 Streamlit 應用程式。不然你以為自己沒弄壞東西,結果用戶都快氣瘋了才發現哪裡不通。嗯……有時候我自己都懶,但真的偷不得懶,每做完一次變更就趕緊確認新功能是不是如預期在運作,很煩,但必要啦。
功能總結清單,其實這就是YouTube Shorts工廠
**文件紀錄徹底**:Manus,後來還有Winsurf,欸,其實這兩個工具真的幫我省事不少,尤其是不用自己手打README那件事,我已經不太記得上次苦惱格式問題是什麼時候了。說起來,不只是節省時間啦,把說明文件自動產生這功能意外地讓我比較能掌握程式的即時狀態,就像有東西隨手筆記著一樣。話又說回來,有時覺得它們的風格挺一致,有點枯燥?但至少不會漏掉細節。嗯,好吧,我離題了,總之搞懂新寫出來的程式碼內容這點,它們真有幫到。
6. **版本控制是你的朋友**:目前講真的,AI生成代碼造成專案大亂套的情形我還沒碰過,大概算運氣好?可是人就是會怕失控啦,每當要輸入新的提示前,我都還是乖乖把現有進度存進版本庫才安心——Windsurf那邊也都有「回溯」和「棄用變更」可選,用起來其實滿方便,但每次想到那些正在測試的小改動可能一下就弄丟……唉,只好繼續偏執地相信,本機硬塞一份備份最妥當。不然萬一哪天系統抽風、自己手殘搞砸,要復原可麻煩死了。
6. **版本控制是你的朋友**:目前講真的,AI生成代碼造成專案大亂套的情形我還沒碰過,大概算運氣好?可是人就是會怕失控啦,每當要輸入新的提示前,我都還是乖乖把現有進度存進版本庫才安心——Windsurf那邊也都有「回溯」和「棄用變更」可選,用起來其實滿方便,但每次想到那些正在測試的小改動可能一下就弄丟……唉,只好繼續偏執地相信,本機硬塞一份備份最妥當。不然萬一哪天系統抽風、自己手殘搞砸,要復原可麻煩死了。
<pre><code class="language-yaml">## 最終功能集
- 產生YouTube Shorts風格影片
- 用戶需提供一張圖片及一段音訊來製作影片
- 提供音訊裁切、影像參數、圖片格式設定以及波形視覺化等多種深度自訂功能