云服务器免费体验 Firefly 大模型微调工具

sanwei12345

496人浏览 · 2025-05-23 23:34:23

sanwei12345 · 2025-05-23 23:34:23 发布

Firefly 是一个开源的大语言模型训练项目，支持对主流的大模型进行预训练、指令微调和DPO，包括但不限于Qwen2、Yi-1.5、Llama3、Gemma、Qwen1.5、MiniCPM、MiniCPM3、Llama、InternLM、Baichuan、ChatGLM、Yi、Deepseek、Qwen、Orion、Ziya、Xverse、Mistral、Mixtral-8x7B、Zephyr、Vicuna、Bloom等。本项目支持全量参数训练、LoRA、QLoRA高效训练，支持预训练、SFT、DPO。结合了最新的 Deepspeed 技术，简单易用，方便学习，微调训练显存需求小，因此被很多大佬推荐从 Firefly 入手训练模型。

官方项目地址：https://github.com/yangjianxin1/Firefly

现在趋动云上已经配置好该项目环境，可以免费试用

注册链接：https://growthdata.virtaicloud.com/t/xK

登陆后进入项目链接（有详细使用说明）：

https://open.virtaicloud.com/web/project/detail/575337624752263168

read-normal-img

点击右上角运行一下，确定克隆项目到自己空间，点击立即运行，启动开发环境后点右上角进入开发环境。

双击打开左侧的项目介绍文件，按顺序运行代码块即可完成示例演示中的对 Qwen2 1.5b 模型做 Lora 微调训练，来提升模型输出新闻摘要的效果：

read-normal-img

测试用到的 Qwen2-1.5B 模型已下载并放在了云服务器 /gemini/code/fine-tuning-main/Qwen2-1.5B 目录下，默认配置即可满足演示需求，如显存不够用可以根据自己的需求情况再换个大点的实例配置。

测试用到的新闻摘要数据集位于 /gemini/code/fine-tuning-main/data/summary/ 目录下，其中 sum_train_2048.json 是训练数据集，summary_test.jsonl 是测试数据集，训练完成后，可以用测试数据集来评分看看效果。

read-normal-img

具体操作可以参考视频：

undefined

工具调用数据集位于 /gemini/code/fine-tuning-main/data/tools/ 目录下，其中 glaive_toolcall_zh_1k_train.jsonl 是训练数据集，glaive_toolcall_zh_1k_test.jsonl 是测试数据集。

read-normal-img

其他微调任务可以参考这两个示例来整理数据集和修改代码来训练模型。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git