Llama-Factory 简介二，脚本详解 LLaMA-Factory/src/train_bash.py LLaMA-Factory/src/llmtuner/train/pt/workfl_

examples/│├── pretrain.sh: 基于 LoRA 进行增量预训练│├── sft.sh: 基于 LoRA 进行指令监督│├── reward.sh: 基于 LoRA 进行奖励模型训练│├── ppo.sh: 基于 LoRA 进行 PPO 训练│├── dpo.sh: 基于 LoRA 进行 DPO 训练│├── orpo.sh: 基于 LoRA 进行ORPO 训练│├── pre

abcd51685168

192人浏览 · 2024-06-30 06:00:00

abcd51685168 · 2024-06-30 06:00:00 发布

examples/
├── lora_single_gpu/
│ ├── pretrain.sh: 基于 LoRA 进行增量预训练
│ ├── sft.sh: 基于 LoRA 进行指令监督微调
│ ├── reward.sh: 基于 LoRA 进行奖励模型训练
│ ├── ppo.sh: 基于 LoRA 进行 PPO 训练
│ ├── dpo.sh: 基于 LoRA 进行 DPO 训练
│ ├── orpo.sh: 基于 LoRA 进行 ORPO 训练
│ ├── prepare.sh: 保存预处理后的数据集
│ └── predict.sh: 基于 LoRA 进行批量预测并计算 BLEU 和 ROUGE 分数
├── qlora_single_gpu/
│ ├── bitsandbytes.sh: 基于 QLoRA 微调 4/8 比特 BNB 模型
│ ├── gptq.sh: 基于 QLoRA 微调 4/8 比特 GPTQ 模型
│ ├── awq.sh: 基于 QLoRA 微调 4 比特 AWQ 模型
│ └── aqlm.sh: 基于 QLoRA 微调 2 比特 AQLM 模型
├── lora_multi_gpu/
│ ├── single_node.sh: 使用 Accelerate 进行单节点 LoRA 训练
│ └── multi_node.sh: 使用 Accelerate 进行多节点 LoRA 训练
├── full_multi_gpu/
│ ├── single_node.sh: 使用 DeepSpeed 进行单节点全量训练
│ ├── multi_node.sh: 使用 DeepSpeed 进行多节点全量训练
│ └── predict.sh: 基于全量训练进行批量预测并计算 BLEU 和 ROUGE 分数
├── merge_lora/
│ ├── merge.sh: 将 LoRA 权重合并到预训练模型中
│ └── quantize.sh: 使用 AutoGPTQ 量化微调后的模型
├── inference/
│ ├── cli_demo.sh: 启动 LoRA 模型的命令行推理接口
│ ├── api_demo.sh: 启动 LoRA 模型的 OpenAI 风格 API
│ ├── web_demo.sh: 启动 LoRA 模型的浏览器推理接口
│ └── evaluate.sh: 在 MMLU/CMMLU/C-Eval 数据集上评测 LoRA 模型
└── extras/
├── galore/
│ └── sft.sh: 使用 GaLore 训练模型
├── badam/
│ └── sft.sh: 使用 BAdam 训练模型
├── loraplus/
│ └── sft.sh: 使用 LoRA+ 训练模型
├── llama_pro/
│ ├── expand.sh: 扩展模型中的层
│ └── sft.sh: 训练扩展后的模型
└── fsdp_qlora/
└── sft.sh: 使用 FSDP+QLoRA 微调量化模型

├── lora_single_gpu/
│ ├── pretrain.sh: 基于 LoRA 进行增量预训练


  
    
     
    
    
     
      #!
      /bin
      /bash
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      CUDA_VISIBLE_DEVICES
      =
      0 python ..
      /..
      /src
      /train_bash.py \
     
    

    
     
    
    
     
          --stage pt \
     
    

    
     
    
    
     
          --do_train \
     
    

    
     
    
    
     
          --model_name_
      or_path meta-llama
      /Llama-
      2-
      7b-hf \
     
    

    
     
    
    
     
          --dataset c
      4_demo \
     
    

    
     
    
    
     
          --dataset_dir ..
      /..
      /
      data \
     
    

    
     
    
    
     
          --finetuning_
      type lora \
     
    

    
     
    
    
     
          --lora_target q_proj,v_proj \
     
    

    
     
    
    
     
          --
      output_dir ..
      /..
      /saves
      /LLaMA
      2-
      7B
      /lora
      /pretrain \
     
    

    
     
    
    
     
          --overwrite_cache \
     
    

    
     
    
    
     
          --overwrite_
      output_dir \
     
    

    
     
    
    
     
          --cutoff_len 
      1024 \
     
    

    
     
    
    
     
          --preprocessing_num_workers 
      16 \
     
    

    
     
    
    
     
          --per_device_train_batch_
      size 
      1 \
     
    

    
     
    
    
     
          --per_device_eval_batch_
      size 
      1 \
     
    

    
     
    
    
     
          --gradient_accumulation_steps 
      8 \
     
    

    
     
    
    
     
          --lr_scheduler_
      type cosine \
     
    

    
     
    
    
     
          --logging_steps 
      10 \
     
    

    
     
    
    
     
          --warmup_steps 
      20 \
     
    

    
     
    
    
     
          --save_steps 
      100 \
     
    

    
     
    
    
     
          --eval_steps 
      100 \
     
    

    
     
    
    
     
          --evaluation_strategy steps \
     
    

    
     
    
    
     
          --load_best_model_
      at_
      end \
     
    

    
     
    
    
     
          --learning_rate 
      5e-
      5 \
     
    

    
     
    
    
     
          --num_train_epochs 
      3.0 \
     
    

    
     
    
    
     
          --max_samples 
      10000 \
     
    

    
     
    
    
     
          --val_
      size 
      0.1 \
     
    

    
     
    
    
     
          --plot_loss \
     
    

    
     
    
    
     
          --fp
      16

LLaMA-Factory/src/train_bash.py


  
    
     
    
    
     
      from llmtuner import run_exp
     
    

    
     
    
    
      
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      def 
      main():
     
    

    
     
    
    
         
      run_exp()
     
    

    
     
    
    
      
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      def 
      _mp_fn(index):
     
    

    
     
    
    
     
          # For xla_spawn (TPUs)
     
    

    
     
    
    
         
      main()
     
    

    
     
    
    
      
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      if __name__ == 
      "__main__":
     
    

    
     
    
    
         
      main()

def run_exp() -> LLaMA-Factory/src/llmtuner/train/tuner.py


  
    
     
    
    
     
      def 
      run_exp(args: 
      Optional[Dict[str, 
      Any]] 
      = None, callbacks: 
      Optional[List[
      "TrainerCallback"]] 
      = None):
     
    

    
     
    
    
     
          model_args, 
      data_args, training_args, finetuning_args, generating_args 
      = 
      get_train_args(args)
     
    

    
     
    
    
     
          callbacks 
      = [LogCallback()] 
      if callbacks 
      is None 
      else callbacks
     
    

    
     
    
    
      
     
    

    
     
    
    
         
      if finetuning_args.stage 
      =
      = 
      "pt":
     
    

    
     
    
    
             
      run_pt(model_args, 
      data_args, training_args, finetuning_args, callbacks)
     
    

    
     
    
    
     
          elif finetuning_args.stage 
      =
      = 
      "sft":
     
    

    
     
    
    
             
      run_sft(model_args, 
      data_args, training_args, finetuning_args, generating_args, callbacks)
     
    

    
     
    
    
     
          elif finetuning_args.stage 
      =
      = 
      "rm":
     
    

    
     
    
    
             
      run_rm(model_args, 
      data_args, training_args, finetuning_args, callbacks)
     
    

    
     
    
    
     
          elif finetuning_args.stage 
      =
      = 
      "ppo":
     
    

    
     
    
    
             
      run_ppo(model_args, 
      data_args, training_args, finetuning_args, generating_args, callbacks)
     
    

    
     
    
    
     
          elif finetuning_args.stage 
      =
      = 
      "dpo":
     
    

    
     
    
    
             
      run_dpo(model_args, 
      data_args, training_args, finetuning_args, callbacks)
     
    

    
     
    
    
     
          elif finetuning_args.stage 
      =
      = 
      "orpo":
     
    

    
     
    
    
             
      run_orpo(model_args, 
      data_args, training_args, finetuning_args, callbacks)
     
    

    
     
    
    
         
      else:
     
    

    
     
    
    
             
      raise ValueError(
      "Unknown task.")
     
    

    
     
    
    
      
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      def export_model(args: 
      Optional[Dict[str, 
      Any]] 
      = None):
     
    

    
     
    
    
     
          model_args, 
      data_args, finetuning_args, _ 
      = 
      get_infer_args(args)
     
    

    
     
    
    
      
     
    

    
     
    
    
         
      if model_args.export_dir 
      is None:
     
    

    
     
    
    
             
      raise ValueError(
      "Please specify `export_dir` to save model.")
     
    

    
     
    
    
      
     
    

    
     
    
    
         
      if model_args.adapter_name_
      or_path 
      is 
      not None 
      and model_args.export_quantization_
      bit 
      is 
      not None:
     
    

    
     
    
    
             
      raise ValueError(
      "Please merge adapters before quantizing the model.")
     
    

    
     
    
    
      
     
    

    
     
    
    
     
          tokenizer 
      = load_tokenizer(model_args)
     
    

    
     
    
    
         
      get_template_
      and_fix_tokenizer(tokenizer, 
      data_args.template)
     
    

    
     
    
    
     
          model 
      = load_model(tokenizer, model_args, finetuning_args)  # must 
      after fixing tokenizer 
      to resize vocab
     
    

    
     
    
    
      
     
    

    
     
    
    
         
      if getattr(model, 
      "quantization_method", None) 
      and model_args.adapter_name_
      or_path 
      is 
      not None:
     
    

    
     
    
    
             
      raise ValueError(
      "Cannot merge adapters to a quantized model.")
     
    

    
     
    
    
      
     
    

    
     
    
    
         
      if 
      not isinstance(model, PreTrainedModel):
     
    

    
     
    
    
             
      raise ValueError(
      "The model is not a `PreTrainedModel`, export aborted.")
     
    

    
     
    
    
      
     
    

    
     
    
    
         
      if getattr(model, 
      "quantization_method", None) 
      is None:  # cannot convert dtype 
      of a quantized model
     
    

    
     
    
    
             
      output_dtype 
      = getattr(model.config, 
      "torch_dtype", torch.float
      16)
     
    

    
     
    
    
     
              setattr(model.config, 
      "torch_dtype", 
      output_dtype)
     
    

    
     
    
    
     
              model 
      = model.
      to(
      output_dtype)
     
    

    
     
    
    
      
     
    

    
     
    
    
     
          model.save_pretrained(
     
    

    
     
    
    
     
              save_directory
      =model_args.export_dir,
     
    

    
     
    
    
     
              max_shard_
      size
      =
      "{}GB".
      format(model_args.export_
      size),
     
    

    
     
    
    
     
              safe_serialization
      =(
      not model_args.export_legacy_
      format),
     
    

    
     
    
    
     
          )
     
    

    
     
    
    
         
      if model_args.export_hub_model_id 
      is 
      not None:
     
    

    
     
    
    
     
              model.push_
      to_hub(
     
    

    
     
    
    
     
                  model_args.export_hub_model_id,
     
    

    
     
    
    
     
                  token
      =model_args.hf_hub_token,
     
    

    
     
    
    
     
                  max_shard_
      size
      =
      "{}GB".
      format(model_args.export_
      size),
     
    

    
     
    
    
     
                  safe_serialization
      =(
      not model_args.export_legacy_
      format),
     
    

    
     
    
    
     
              )
     
    

    
     
    
    
      
     
    

    
     
    
    
     
          try:
     
    

    
     
    
    
     
              tokenizer.padding_side 
      = 
      "left"  # restore padding side
     
    

    
     
    
    
     
              tokenizer.init_kwargs[
      "padding_side"] 
      = 
      "left"
     
    

    
     
    
    
     
              tokenizer.save_pretrained(model_args.export_dir)
     
    

    
     
    
    
             
      if model_args.export_hub_model_id 
      is 
      not None:
     
    

    
     
    
    
     
                  tokenizer.push_
      to_hub(model_args.export_hub_model_id, token
      =model_args.hf_hub_token)
     
    

    
     
    
    
     
          except 
      Exception:
     
    

    
     
    
    
     
              logger.warning(
      "Cannot save tokenizer, please copy the files manually.")
     
    

    
     
    
    
      
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      if __name__ 
      =
      = 
      "__main__":
     
    

    
     
    
    
         
      run_exp()

from typing import TYPE_CHECKING, Any, Dict, List, Optional

import torch
from transformers import PreTrainedModel

from ..data import get_template_and_fix_tokenizer
from ..extras.callbacks import LogCallback
from ..extras.logging import get_logger
from ..hparams import get_infer_args, get_train_args
from ..model import load_model, load_tokenizer
from .dpo import run_dpo
from .orpo import run_orpo
from .ppo import run_ppo
from .pt import run_pt
from .rm import run_rm
from .sft import run_sft

if TYPE_CHECKING:
from transformers import TrainerCallback

logger = get_logger(__name__)

def run_pt() -> LLaMA-Factory/src/llmtuner/train/pt/workflow.py


  
    
     
    
    
     
      def 
      run_pt(
     
    

    
     
    
    
     
          model_args: 
      "ModelArguments",
     
    

    
     
    
    
         
      data_args: 
      "DataArguments",
     
    

    
     
    
    
     
          training_args: 
      "Seq2SeqTrainingArguments",
     
    

    
     
    
    
     
          finetuning_args: 
      "FinetuningArguments",
     
    

    
     
    
    
     
          callbacks: 
      Optional[List[
      "TrainerCallback"]] 
      = None,
     
    

    
     
    
    
     
      ):
     
    

    
     
    
    
     
          tokenizer 
      = load_tokenizer(model_args)
     
    

    
     
    
    
     
          dataset 
      = 
      get_dataset(tokenizer, model_args, 
      data_args, training_args, stage
      =
      "pt")
     
    

    
     
    
    
     
          model 
      = load_model(tokenizer, model_args, finetuning_args, training_args.do_train)
     
    

    
     
    
    
         
      data_collator 
      = DataCollatorForLanguageModeling(tokenizer
      =tokenizer, mlm
      =
      False)
     
    

    
     
    
    
      
     
    

    
     
    
    
     
          # 
      Initialize our Trainer
     
    

    
     
    
    
     
          trainer 
      = CustomTrainer(
     
    

    
     
    
    
     
              model
      =model,
     
    

    
     
    
    
     
              args
      =training_args,
     
    

    
     
    
    
     
              finetuning_args
      =finetuning_args,
     
    

    
     
    
    
     
              tokenizer
      =tokenizer,
     
    

    
     
    
    
             
      data_collator
      =
      data_collator,
     
    

    
     
    
    
     
              callbacks
      =callbacks,
     
    

    
     
    
    
             
      **split_dataset(dataset, 
      data_args, training_args),
     
    

    
     
    
    
     
          )
     
    

    
     
    
    
      
     
    

    
     
    
    
     
          # Training
     
    

    
     
    
    
         
      if training_args.do_train:
     
    

    
     
    
    
     
              train_result 
      = trainer.train(
      resume_
      from_checkpoint
      =training_args.
      resume_
      from_checkpoint)
     
    

    
     
    
    
     
              trainer.save_model()
     
    

    
     
    
    
     
              trainer.log_metrics(
      "train", train_result.metrics)
     
    

    
     
    
    
     
              trainer.save_metrics(
      "train", train_result.metrics)
     
    

    
     
    
    
     
              trainer.save_state()
     
    

    
     
    
    
             
      if trainer.
      is_world_process_
      zero() 
      and finetuning_args.plot_loss:
     
    

    
     
    
    
     
                  plot_loss(training_args.
      output_dir, keys
      =[
      "loss", 
      "eval_loss"])
     
    

    
     
    
    
      
     
    

    
     
    
    
     
          # Evaluation
     
    

    
     
    
    
         
      if training_args.do_eval:
     
    

    
     
    
    
     
              metrics 
      = trainer.
      evaluate(metric_
      key_prefix
      =
      "eval")
     
    

    
     
    
    
     
              try:
     
    

    
     
    
    
     
                  perplexity 
      = math.exp(metrics[
      "eval_loss"])
     
    

    
     
    
    
     
              except OverflowError:
     
    

    
     
    
    
     
                  perplexity 
      = float(
      "inf")
     
    

    
     
    
    
      
     
    

    
     
    
    
     
              metrics[
      "perplexity"] 
      = perplexity
     
    

    
     
    
    
     
              trainer.log_metrics(
      "eval", metrics)
     
    

    
     
    
    
     
              trainer.save_metrics(
      "eval", metrics)
     
    

    
     
    
    
      
     
    

    
     
    
    
     
          # Create model card
     
    

    
     
    
    
     
          create_modelcard_
      and_push(trainer, model_args, 
      data_args, training_args, finetuning_args)


  
    
     
    
    
     
      # Inspired 
      by: https:
      /
      /github.com
      /huggingface
      /transformers
      /blob
      /v
      4.34.1
      /examples
      /pytorch
      /language-modeling
      /
      run_clm.py
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      import math
     
    

    
     
    
    
     
      from typing import 
      TYPE_CHECKING, List, 
      Optional
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      from transformers import DataCollatorForLanguageModeling
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      from ...
      data import 
      get_dataset, split_dataset
     
    

    
     
    
    
     
      from ...extras.ploting import plot_loss
     
    

    
     
    
    
     
      from ...model import load_model, load_tokenizer
     
    

    
     
    
    
     
      from ..utils import create_modelcard_
      and_push
     
    

    
     
    
    
     
      from .trainer import CustomTrainer
     
    

    
     
    
    
      
     
    

    
     
    
    
      
     
    

    
     
    
    
     
      if 
      TYPE_CHECKING:
     
    

    
     
    
    
         
      from transformers import Seq
      2SeqTrainingArguments, TrainerCallback
     
    

    
     
    
    
      
     
    

    
     
    
    
         
      from ...hparams import DataArguments, FinetuningArguments, ModelArguments

train() 方法调用的Transformers包底层train()方法

大模型底层 transformers源码解析之trainer.py-CSDN博客

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git