LLM竟然這麼靠近——使用llama模型建立大模型本機系統

作者:范煜
出版社:深智
出版日期:2025年03月19日
ISBN:9786267569634
$ 327.00
收藏

簡介

✴︎ 感知機架構,包括前饋網路與反向傳播演算法

✴︎ Sigmoid、ReLU啟動函數與Adam、RMSProp最佳化方法

✴︎ Transformer模型組成與自注意力機制運作原理

✴︎ BERT、GPT等預訓練模型與大型語言模型訓練方法

✴︎ 詞嵌入技術講解,結合Word2Vec、標記嵌入及位置編碼方法

✴︎ LoRA與PEFT微調技術,並涵蓋LLM.int8()量化技術

✴︎ Gradio工具應用介紹,支援互動式推理與多輪對話開發

✴︎ 量化技術分析,包括NF4、BitsAndBytes與QLoRA模型應用

✴︎ 模型評估方法,涵蓋困惑度、BLEU、ROUGE與HellaSwag指標

✴︎ 中文語料處理,涵蓋預訓練語料準備與AutoTokenizer應用

✴︎ 推理加速技術分析,包含DeepSpeed、FSDP與GPTQ高效實現

✴︎ 向量資料庫應用,講解PGVector安裝及詞向量檢索範例


書評
(0)
寫書評
暫無書評