新手小白必看:大模型训练微调【Fine-tuning】详解(上)
一种是用Meta推出的Llama factory;另一种是用Unsloth这款工具;我们来看一下它们的之前的对比情况⬇️⬇️。
新手小白必看:大模型训练微调【Fine-tuning】详解(上)
前两期演示了本地大模型的安装部署与本地知识库的搭建,也就是RAG的一个搭建教程:
然后看到一些朋友留言在问大模型怎样训练的这个问题;
那么本期我们来看一下详细的训练步骤,需要的伙伴可以转发收藏后对照实操起来,有疑惑我们可以在评论区交流
⬇️⬇️
演示之前,我们要明确两件事情:

第一个,就是对于我们大部分人而言,所谓的训练那就是基于别人的预训练模型的基础之上进行的二次微调,以求显著提升应对某个领域或者是某类问题的推理结果输出表现;
它不会是从0到1的过程,因为那一般都是有几个小目标的企业可以干的事。


第二个,就是训练需求按输出类型的划分主要是两类:
一类是生文类模型的训练和微调,比如我们要微调一下开源模型qwen2和llama3;

另一类是生图类模型的训练微调,比如想在Stable Diffusion上运行输出固定的某种风格或者角色的模型。

而用来微调的环境也是两类:
一类自然是本地电脑;

另一类是云端的服务器、可租赁GPU的算力平台。

最后就是当前公认最好用的微调工具和方法,
A.对生文类模型
一种是用Meta推出的Llama factory;
另一种是用Unsloth这款工具;
我们来看一下它们的之前的对比情况⬇️⬇️

B.生图类的模型,公认最好用的是秋葉前辈的模型训练器了**~**

这些都可以作为基础知识记一记哦

但毕竟呀,上手才是王道*;*
所以本期为了小白方便快速上手,生文模型的演示上,我这边避开大家参差不齐的本地环境和工具的甄选,直接在阿里云的服务器上操作训练了~

因为它里面的训练微调区域内置了很多大模型,都不用下载;

我以当前最好用的开源模型qwen2.5微调为例,接下来我们就上实操:

那么第一步,是来准备大模型所需的训练样本数据集:
生文模型的训练样本主要形式是半结构的Json格式、而且内容上得是一问一答:

这里可能有小伙伴会苦恼自己手头没有准备,这里也分享一下我觉得蛮好的两种途径:
一种是去阿里的天池公开数据集,直接下载自己想训练行业的数据,都是算公益免费的:

还有前一段时间很火的弱智吧的数据,或者b站神评论神回复数据,用来训练模型都蛮好的!

第二种是请Ai帮忙收集整理制作~

这里对于手头没有数据的朋友我来演示一下制作步骤,伙伴们可以对照着实操起来!⬇️⬇️
最近我们终于熬到漂亮果降息,大A形式转好,所以这里我就围绕自己的交易体系“聚焦核心,看长做短”来请Ai帮我准备数据集,当然不构成投资建议!

因为前半句是请模型辅助推理如何选核心个股,后半句是要搞清楚买卖时机;
那么对于选股,我选择直接上传段永平老师在雪球上与爱好者们的问答对话:

嗯,是内容挺多的PDF文件,让Kimi帮我精炼总结出35条甄选方法呈现出后,再以一问一答的json格式呈现出来:

好,总结完成后,咱们继续下半句的**“看长做短”**的具体交易法上;
我看上了养家老师和缠中说禅的养家心法以及缠论,让它分别帮我总结15条情绪和技术交易上的入场和出场的合适时机判断⬇️⬇️

这里要注意一个细节,因为我这里没有养家心法和整理好的缠论本地内容文档,所以我开启了kimi****的探索版,就是它的慢思考模式,这样它的推理和总结上更严谨些~

好,分别总结出来了,我再让它帮我把这30条在具体交易时入场与出场时机判断上,我选择让它帮我融合压缩成15条⬇️


这样,一共50条数据集准备好了!
接下来,新建本地TXT文档把这50条数据集复制进来保存一下,文件后缀名修改成json~


为了稳妥起见,我用Cursor打开再看一遍,如果哪里格式有问题,它会直接提示,按Ctrl+i在对话框输入把格式问题修改完善的需求,再保存,这就妥了~

好,第一步数据集准备完成,第二步上手训练!
浏览器搜索阿里云,点开官网,注册登录后点开产品,点击精选产品的人工智能PAI:

如果伙伴们第一次注册使用,旁边会有一个免费试用一次的福利,如果之前就用过其他功能了,这里应该就要充一杯奶茶钱用来训练了~
⚠️这里补充一下:
一般来说,大家数据集不多的情况下,其实没必要选择很大的模型,既费时间和显存;
而我准备的50条数据集就不算很多,选择7b其实都大了,容易造成过拟合的情况;

到时候会发现又需要数据增强和正则化了。
所以用过云服务器的需要钞能力加持的朋友,一杯奶茶钱怕顶不住,得一杯半哈哈~
点击“免费试用”或“管理控制台”进入后,点开快速开始的Model Gallery,找到通义千问2.5-7B-Instruct,点进入后,先看一下模型和训练算法简介:


我们这里微调训练策略要选择的是SFT****,监督微调算法;
哦,还有这个数据集格式要求,是instruction和output的json格式数据集,没毛病,那我们直接点击右上角部署旁边的训练



基于SFT的训练方式,我们直接选择Lora,即低秩矩阵微调;
任务名称可以自行修改,但尽量不要有汉字和特殊符号;
下面的这个最大运行时长就保持默认的0,这样不会因为什么意外中断任务,这也是云服务器训练的好处啊,本地训练可怕一会儿网络波动一会儿要点别的卡出问题。

数据集配置,我们点开后把公共数据集 改为OSS****文件或目录,按照指引,我们第一次训练的话需要设置一个Bucket存储空间,建立按照流程来就行:

建好了后,把我们的Train_data.json文件上传进来,再新建output_model和tensorboard文件夹,因为下面的输出设置会需要:
前者是微调好的训练模型导出位置;
后者是训练过程的内容的保存位置。

搞定后下面会有预览数据内容供我们确认是否准确,验证数据集我们不用准备。

再往下看,实验配置直接跳过不管;
输出配置我们模型名称和描述可动可不动,自己方便记忆就行;

选好输出模型文件夹和tensorboard文件夹;
计算资源配置,我们选择最便宜的GPU就行,足够使用了;

专有网络配置我们不用管;
点开超参数配置,我们可以看到它已经是优化默认显示的参数配置,对小白很友好;
我们也不用动了直接点击训练就可以开始了,不过这些参数的意思我们也还是需要了解一下是啥意思⬇️

最后点击开始训练!
提示环境准备中,下方有“任务日志”和“任务监控”可以实时查看训练过程,右边的指标曲线可以查看损失函数曲线在训练的时候波动变化过程~


好了,5分钟左右就训练结束了,那么就到了最后一步~
我们点击右上角的部署,选择按量计费和普通的GPU常规型配置:

到Web****端应用输入对话来看看情况:

那么跟我以前早期本地部署的qwen回答对比就区别挺大了⬇️⬇️


好了,以上就是云端微调训练大模型的实操演示了,其他的云服务器如谷歌的****Colab虽然好用免费,每天可以白嫖12个小时,但也需要网络环境哦~

零基础入门AI大模型
今天贴心为大家准备好了一系列AI大模型资源,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
有需要的小伙伴,可以点击下方链接免费领取【保证100%免费】
1.学习路线图

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2.视频教程
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。


(都打包成一块的了,不能一一展开,总共300多集)
3.技术文档和电子书
这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
4.LLM面试题和面经合集
这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
5.免费获取
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码或者点击以下链接都可以免费领取【保证100%免费】

更多推荐
所有评论(0)