如何自己架設DeepSeek

Table of Contents

安裝Ollama

前往 Ollama 官網，依照你的作業系統進行選擇、安裝。

ollama run deepseek-r1:xxxb

ollama rm deepseek-r1:xxxb

如下的指令，

ollama run deepseek-r1:32b

32b 代表 320 億（32,000,000,000）個參數，

不同的 LLM（大型語言模型）需要不同的記憶體大小來運行，具體取決於：

模型的精度（Precision）
- FP16（16-bit 浮點數）：每個參數約 2 bytes
- INT8（8-bit 量化）：每個參數約 1 byte
- 其他更進階的量化技術（如 4-bit）可以進一步降低記憶體需求。
模型的結構（架構）
- Mixture of Experts（MoE）等架構可能降低運行需求。

模型大小	FP16 需求（標準運行）	INT8 需求（量化）	4-bit 需求（進階量化）
1.5B	約 3GB VRAM	約 1.5GB VRAM	約 1GB VRAM
7B	約 14GB VRAM	約 7GB VRAM	約 4GB VRAM
8B	約 16GB VRAM	約 8GB VRAM	約 5GB VRAM
14B	約 28GB VRAM	約 14GB VRAM	約 7GB VRAM
30B	約 64GB VRAM	約 32GB VRAM	約 16GB VRAM
70B	約 140GB VRAM	約 70GB VRAM	約 35GB VRAM