602

想看的影片太多,時間太少,AI能怎麼幫忙呢?
本文記錄自動化生成YT影片文字稿的實作,最後只需將文字稿丟給chatGPT整理即可快速獲得影片重點。
這篇文章記錄了我在 Windows 11 的 WSL(Windows Subsystem for Linux)中使用 Ubuntu 環境,設置並執行一個 Bash 腳本的過程。這個腳本的功能是從 YouTube 影片中提取字幕或音頻轉錄,並生成摘要。腳本參考自 wiwikuan/myScripts 的 GitHub 專案。
背景
- 作業系統:Windows 11,搭配 WSL 上的 Ubuntu。
- 目標:執行一個 Bash 腳本(script.sh),從 YouTube 影片提取字幕或轉錄音頻,並生成摘要。
- WSL 可以直接存取 Windows 檔案系統,Windows 的 D: 在 WSL 中映射為 /mnt/d
腳本功能概述
腳本的流程如下:
- 檢查輸入:需要提供 YouTube 影片 ID。
- 提取字幕:依序嘗試下載英文(en)、繁體中文(zh-TW)、中文(zh)字幕。
- 若無字幕:下載音頻並用 whisper 轉錄。
- 生成摘要:用 ollama(搭配 llama3 模型)生成轉錄內容的摘要。
- 輸出:生成 <影片ID>.txt(字幕或轉錄)和 <影片ID>-summary.txt(摘要)。
設置環境
1. 安裝 WSL 和 Ubuntu
在 Windows 11 上:
- 執行 wsl –install 安裝 WSL。
- 從 Microsoft Store 安裝 Ubuntu。
- 設置使用者名稱(例如 testUser)和密碼,進入 Bash 環境。
2. 安裝依賴工具
腳本需要以下工具:
- yt-dlp:下載 YouTube 字幕或音頻。
- whisper:將音頻轉錄為文字。
- ollama:生成摘要。
- ffmpeg:whisper 的音頻處理依賴。
安裝步驟
1.更新系統:
sudo apt update && sudo apt upgrade -y
2.安裝 ffmpeg:
sudo apt install ffmpeg -y
3.安裝 yt-dlp 和 whisper(使用 pipx):
sudo apt install pipx -y
pipx install yt-dlp
pipx install git+https://github.com/openai/whisper.git
4.安裝 ollama:
curl -fsSL https://ollama.com/install.sh | sh
ollama pull llama3
5.更新 PATH:
pipx ensurepath
關閉並重新打開終端機,確認 PATH:
echo $PATH
放置與執行腳本
1. 將腳本放到 /home/testUser
手動創建腳本:
1.進入目錄:
cd /home/testUser
2.創建檔案:
nano script.sh
3.貼上程式碼(從 wiwikuan/myScripts 參考的腳本)。
4.保存退出:Ctrl+O,Enter,Ctrl+X。
5.賦予執行權限:
chmod +x script.sh
2. 執行腳本
./script.sh <YouTube影片ID>
例如:
./script.sh dQw4w9WgXcQ
探索更多來自 雖然沒準備什麼資料 的內容
訂閱即可透過電子郵件收到最新文章。