深度學習
深度學習用多層神經網路模擬大腦,讓機器自己學特徵。
1. 基本深度神經網路(DNN, Deep Neural Network)
- 什麼是?
- 最基礎的深度網路,多層神經元(像大腦細胞)疊起來,能學複雜模式。
- 輸入 → 隱藏層(好幾層)→ 輸出。
- 適合場景:
- 結構化數據的預測:
- 像用表格資料(GDP、失業率、CPI)預測經濟週期。
- 例子:輸入 10 個經濟指標,輸出「成長」或「衰退」。
- 簡單分類或回歸:
- 分類:判斷客戶是否會買東西(是/否)。
- 回歸:預測房價。
- 結構化數據的預測:
- 為什麼用?
- 比傳統機器學習(如線性回歸)更能抓非線性關係。
- 資料量中等(幾千到幾萬筆)就夠。
- 工具:PyTorch 的 nn.Linear 或 TensorFlow 的 Dense 層。
- 例子:用 DNN 分析台灣經濟數據,預測下一季 GDP 成長率。
2. 卷積神經網路(CNN, Convolutional Neural Network)
- 什麼是?
- 專為圖片或空間數據設計,用「卷積」(Convolution)抓局部特徵(如邊緣、形狀)。
- 結構:卷積層 → 池化層 → 全連接層。
- 適合場景:
- 圖片處理:
- 辨識照片裡的東西(像貓狗分類)。
- 例子:分析工廠產品照片,找瑕疵。
- 空間數據:
- 地圖數據(像交通流量熱圖)。
- 例子:用大巨蛋觀眾分布圖預測人潮。
- 時間序列視覺化:
- 把經濟數據轉成圖(像折線圖),用 CNN 找趨勢。
- 圖片處理:
- 為什麼用?
- 擅長抓局部模式,減少參數(比 DNN 效率高)。
- 適合高維數據(像圖片像素)。
- 工具:PyTorch 的 nn.Conv2d 或 TensorFlow 的 Conv2D。
- 例子:用 CNN 分析台灣股市 K 線圖,預測漲跌。
3. 循環神經網路(RNN, Recurrent Neural Network)及變種(LSTM、GRU)
- 什麼是?
- 專為序列數據設計,能記住前面的資訊(有「記憶力」)。
- 變種像 LSTM(長短期記憶)和 GRU(門控循環單元)解決長期依賴問題。
- 適合場景:
- 時間序列預測:
- 預測下個月失業率、出口額。
- 例子:用過去 10 年 GDP 預測未來。
- 自然語言處理(NLP):
- 分析財經新聞,判斷市場情緒(正面/負面)。
- 例子:從 X 上的貼文預測經濟信心。
- 連續數據:
- 感測器數據(像工廠機器溫度)。
- 時間序列預測:
- 為什麼用?
- 能處理順序(像昨天影響今天)。
- LSTM/GRU 能記住長時間的模式。
- 工具:PyTorch 的 nn.LSTM 或 TensorFlow 的 LSTM。
- 例子:用 LSTM 分析台灣每季出口數據,預測經濟週期。
4. Transformer
- 什麼是?
- 最新的深度網路,用「注意力機制」(Attention)取代 RNN,效率更高。
- 結構:Encoder-Decoder,多頭注意力(Multi-Head Attention)。
- 適合場景:
- 超長序列數據:
- 處理幾年經濟數據(像 1000 筆時間點)。
- 例子:用 20 年進出口資料預測趨勢。
- 自然語言處理:
- 翻譯財經報告、生成經濟分析。
- 例子:把英文經濟新聞翻成中文。
- 多模態數據:
- 結合文字、數字、圖片(像財報 + 股市圖)。
- 超長序列數據:
- 為什麼用?
- 比 RNN 快,能同時看全部數據(平行處理)。
- 適合超大資料和複雜任務。
- 工具:PyTorch 的 nn.Transformer 或 Hugging Face 的預訓練模型(像 BERT)。
- 例子:用 Transformer 分析 X 上的經濟討論和股市數據,預測市場情緒。
5. 場景對照表
場景 | 推薦網路 | 原因 |
---|---|---|
表格數據(GDP、CPI) | DNN | 簡單、非線性、易訓練 |
圖片(K 線圖、地圖) | CNN | 抓空間特徵、高維數據 |
時間序列(出口、失業率) | RNN/LSTM | 處理順序、記住歷史 |
超長序列或文字(新聞分析) | Transformer | 高效、長距離依賴、NLP |
6. 跟你需求的關係
- 計算相關係數:
- 不直接用深度學習,傳統方法(如皮sie爾森 + 聚類)更快。
- 但如果資料超多(像 100 個特徵),可以用 DNN 或 Autoencoder 降維後再算。
- 台灣經濟週期:
- DNN:適合簡單預測(像用 10 個指標判斷週期)。
- LSTM:適合時間序列(像用過去 5 年數據預測)。
- Transformer:如果加新聞或超長數據才用。
7. 結論
- DNN:簡單結構化數據(經濟表格)。
- CNN:圖片或空間數據(股市圖、地圖)。
- RNN/LSTM:時間序列(經濟趨勢)。
- Transformer:大數據或文字(新聞分析)。
- 你的需求:如果只是經濟週期,DNN 或 LSTM 夠用;若資料少,傳統機器學習更好。