happy-llm — DataWhale 手刻 LLM 中文教學
DataWhale 出的中文教學,從零手刻一個小型語言模型,適合想理解 LLM 底層運作的人。刻出來的是小模型,跑起來還是會被現成大模型壓著打,而且對顯卡要求不低。
實務上的分流邏輯很值得記住:大多數情況先試 RAG,它最能解決知識儲備不足的問題;如果 RAG 還是無法讓模型按你想要的「口吻」或「格式」回答,才考慮搭配 LoRA 微調。兩者可以並用。
[Links]
DataWhale 出的中文教學,從零手刻一個小型語言模型,適合想理解 LLM 底層運作的人。刻出來的是小模型,跑起來還是會被現成大模型壓著打,而且對顯卡要求不低。
實務上的分流邏輯很值得記住:大多數情況先試 RAG,它最能解決知識儲備不足的問題;如果 RAG 還是無法讓模型按你想要的「口吻」或「格式」回答,才考慮搭配 LoRA 微調。兩者可以並用。