happy-llm — DataWhale 手刻 LLM 中文教學

2026-04-27

DataWhale 出的中文教學，從零手刻一個小型語言模型，適合想理解 LLM 底層運作的人。刻出來的是小模型，跑起來還是會被現成大模型壓著打，而且對顯卡要求不低。

實務上的分流邏輯很值得記住：大多數情況先試 RAG，它最能解決知識儲備不足的問題；如果 RAG 還是無法讓模型按你想要的「口吻」或「格式」回答，才考慮搭配 LoRA 微調。兩者可以並用。

[Links]