深度學習

深度學習用多層神經網路模擬大腦,讓機器自己學特徵。

1. 基本深度神經網路(DNN, Deep Neural Network)

  • 什麼是?
    • 最基礎的深度網路,多層神經元(像大腦細胞)疊起來,能學複雜模式。
    • 輸入 → 隱藏層(好幾層)→ 輸出。
  • 適合場景
    • 結構化數據的預測
      • 像用表格資料(GDP、失業率、CPI)預測經濟週期。
      • 例子:輸入 10 個經濟指標,輸出「成長」或「衰退」。
    • 簡單分類或回歸
      • 分類:判斷客戶是否會買東西(是/否)。
      • 回歸:預測房價。
  • 為什麼用?
    • 比傳統機器學習(如線性回歸)更能抓非線性關係。
    • 資料量中等(幾千到幾萬筆)就夠。
  • 工具:PyTorch 的 nn.Linear 或 TensorFlow 的 Dense 層。
  • 例子:用 DNN 分析台灣經濟數據,預測下一季 GDP 成長率。

2. 卷積神經網路(CNN, Convolutional Neural Network)

  • 什麼是?
    • 專為圖片或空間數據設計,用「卷積」(Convolution)抓局部特徵(如邊緣、形狀)。
    • 結構:卷積層 → 池化層 → 全連接層。
  • 適合場景
    • 圖片處理
      • 辨識照片裡的東西(像貓狗分類)。
      • 例子:分析工廠產品照片,找瑕疵。
    • 空間數據
      • 地圖數據(像交通流量熱圖)。
      • 例子:用大巨蛋觀眾分布圖預測人潮。
    • 時間序列視覺化
      • 把經濟數據轉成圖(像折線圖),用 CNN 找趨勢。
  • 為什麼用?
    • 擅長抓局部模式,減少參數(比 DNN 效率高)。
    • 適合高維數據(像圖片像素)。
  • 工具:PyTorch 的 nn.Conv2d 或 TensorFlow 的 Conv2D。
  • 例子:用 CNN 分析台灣股市 K 線圖,預測漲跌。

3. 循環神經網路(RNN, Recurrent Neural Network)及變種(LSTM、GRU)

  • 什麼是?
    • 專為序列數據設計,能記住前面的資訊(有「記憶力」)。
    • 變種像 LSTM(長短期記憶)和 GRU(門控循環單元)解決長期依賴問題。
  • 適合場景
    • 時間序列預測
      • 預測下個月失業率、出口額。
      • 例子:用過去 10 年 GDP 預測未來。
    • 自然語言處理(NLP)
      • 分析財經新聞,判斷市場情緒(正面/負面)。
      • 例子:從 X 上的貼文預測經濟信心。
    • 連續數據
      • 感測器數據(像工廠機器溫度)。
  • 為什麼用?
    • 能處理順序(像昨天影響今天)。
    • LSTM/GRU 能記住長時間的模式。
  • 工具:PyTorch 的 nn.LSTM 或 TensorFlow 的 LSTM。
  • 例子:用 LSTM 分析台灣每季出口數據,預測經濟週期。

4. Transformer

  • 什麼是?
    • 最新的深度網路,用「注意力機制」(Attention)取代 RNN,效率更高。
    • 結構:Encoder-Decoder,多頭注意力(Multi-Head Attention)。
  • 適合場景
    • 超長序列數據
      • 處理幾年經濟數據(像 1000 筆時間點)。
      • 例子:用 20 年進出口資料預測趨勢。
    • 自然語言處理
      • 翻譯財經報告、生成經濟分析。
      • 例子:把英文經濟新聞翻成中文。
    • 多模態數據
      • 結合文字、數字、圖片(像財報 + 股市圖)。
  • 為什麼用?
    • 比 RNN 快,能同時看全部數據(平行處理)。
    • 適合超大資料和複雜任務。
  • 工具:PyTorch 的 nn.Transformer 或 Hugging Face 的預訓練模型(像 BERT)。
  • 例子:用 Transformer 分析 X 上的經濟討論和股市數據,預測市場情緒。

5. 場景對照表

場景推薦網路原因
表格數據(GDP、CPI)DNN簡單、非線性、易訓練
圖片(K 線圖、地圖)CNN抓空間特徵、高維數據
時間序列(出口、失業率)RNN/LSTM處理順序、記住歷史
超長序列或文字(新聞分析)Transformer高效、長距離依賴、NLP

6. 跟你需求的關係

  • 計算相關係數
    • 不直接用深度學習,傳統方法(如皮sie爾森 + 聚類)更快。
    • 但如果資料超多(像 100 個特徵),可以用 DNN 或 Autoencoder 降維後再算。
  • 台灣經濟週期
    • DNN:適合簡單預測(像用 10 個指標判斷週期)。
    • LSTM:適合時間序列(像用過去 5 年數據預測)。
    • Transformer:如果加新聞或超長數據才用。

7. 結論

  • DNN:簡單結構化數據(經濟表格)。
  • CNN:圖片或空間數據(股市圖、地圖)。
  • RNN/LSTM:時間序列(經濟趨勢)。
  • Transformer:大數據或文字(新聞分析)。
  • 你的需求:如果只是經濟週期,DNNLSTM 夠用;若資料少,傳統機器學習更好。