百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

用LLaMA-Factory对Deepseek大模型进行微调-安装篇

itomcoil 2025-05-14 14:08 14 浏览

前面的文章已经把知识库搭建好了,还通过代码的形式做完了 RAG 的实验。接下来呢,咱们要通过实际操作来完成 Deepseek 的另一种优化办法——微调。

一、环境

因为我这台电脑性能不太好,所以就在 AutoDL 网站上租了一个容器实例,是按量计费的,一个小时两块多,感觉还能接受。选择情况是这样的:

上面是我用的实例配置,你们可以根据自己需要选择不同的配置,不过GPU显存最少要选择24G以上。

  • 开通后的实例
  • 用VsCode连接远程实例,安装SSH扩展,使用实例提供的SSH登录指令和密码进行登录
  • 登录成功后,在终端控制台能看到AutoDL的使用说明
  • 按照使用提示将默认目录切换到/root/autodl-tmp
cd /root/autodl-tmp

二、微调框架Llama-Factory

Llama-Factory 作为一个开源的微调框架,为开发者提供一个简便、高效的工具,以便在现有的预训练模型基础上,快速适应特定任务需求,提升模型表现。它支持多种流行的语言模型,如 LLaMA、BLOOM、Mistral、Baichuan 等。此外,Llama-Factory 配备了用户友好的 LlamaBoard Web 界面,降低了使用门槛,使得即便是没有深厚编程背景的用户,也能轻松进行模型微调和推理操作。

  • 安装Llama-Factory
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
  • 搭建Python环境,由于镜像环境已经安装conda,可以直接使用
conda create -n llama-factory python=3.10
conda activate llama-factory
pip install -e ".[torch,metrics]"
  • 运行Llama-Factory
llamafactory-cli webui

VsCode能直接通过端口转发连接到远程实测的服务,所以选择在浏览器里打开就行,最后看到的Web界面如下:

三、通过HuggingFace下载模型

本次测试使用的是Huggingface上的模型文件,用
DeepSeek-R1-Distill-Qwen-1.5B进行微调,由于网络原因无法访问,我们使用国内的镜像

  • 设置环境
mkdir Hugging-Face  #创建一个文件夹用户存放模型文件
export HF_ENDPOINT=https://hf-mirror.com
export HF_HOME=/root/autodl-tmp/Hugging-Face
pip install -U huggingface_hub
  • 下载模型
huggingface-cli download --resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

以上已经完成微调前所有环境的安装准备工作,接下来就可以Llama-Factory的Web界面进行微调,具体怎么操作等本人试验后,再继续分享!

相关推荐

CentOS7服务器,这样搭建Tensorflow很快!我可以提前去吃饭了

CentOS7搭建Tensorflow框架凡是我相信的,我都做了;凡是我做了的事,都是全身心地投入去做的。WhateverIbelieved,Idid;andwhateverIdid,...

python2.0和python3.0的区别(python2.7和3.7哪个好)

Python3.0是Python语言的一次重大升级,与Python2.x系列存在许多不兼容的改动。以下是两者核心区别的全面总结,按重要性和使用频率排序:一、最关键的破坏性变更特性Pyth...

体验无GIL的自由线程Python:Python 3.13 新特征之一

全局解释器锁(GIL,GlobalInterpreterLock)是Python中备受争议的特性之一。它的主要作用是确保Python是一种线程安全的编程语言,防止多个线程同时访问和修改同一...

Python 3.8异步并发编程指南(python异步调用)

有效的提高程序执行效率的两种方法是异步和并发,Golang,node.js之所以可以有很高执行效率主要是他们的协程和异步并发机制。实际上异步和并发是每一种现代语言都在追求的特性,当然Python也不例...

Python测试框架pytest入门基础(pytest框架搭建)

Pytest简介Pytestisamaturefull-featuredPythontestingtoolthathelpsyouwritebetterprograms.T...

Python学不会来打我(8)字符串string类型深度解析

2025年全球开发者调查显示,90%的Python项目涉及字符串处理,而高效使用字符串可提升代码效率40%。本文系统拆解字符串核心操作,涵盖文本处理、数据清洗、模板生成等八大场景,助你掌握字符串编程精...

windows使用pyenv安装多python版本环境

官方的介绍。pyenvletsyoueasilyswitchbetweenmultipleversionsofPython.It’ssimple,unobtrusive,an...

Python 中 base64 编码与解码(Python 中 base64 编码与解码生成)

base64是经常使用的一种加密方式,在Python中有专门的库支持。本文主要介绍在Python2和Python3中的使用区别:在Python2环境:Python2.7.16(d...

Python项目整洁的秘诀:深入理解__init__.py文件

当你发现项目中import语句越来越混乱时,问题可能出在缺少这个关键文件上作为一名Python开发者,我曾深陷项目结构混乱的困境。直到真正理解了__init__.py文件的价值,我的代码世界才变得井然...

如何把一个Python应用程序装进Docker

准备容器无处不在,但是如何在Docker容器中运行Python应用程序呢?这篇文章将告诉你怎么做!如果您想知道,这些示例需要Python3.x。在深入讨论容器之前,让我们进一步讨论一下我们想要封装的...

python中数值比较大小的8种经典比较方法,不允许你还不知道

在Python中比较数值大小是基础但重要的操作。以下是8种经典比较方法及其应用场景,从基础到进阶的完整指南:1.基础比较运算符Python提供6种基础比较运算符:a,b=5,3...

Python程序员必看3分钟掌握if语句10个神技,第5个99%的人不知道

同事因为写错一个if被开除?全网疯传的Python避坑指南,看完我连夜改了代码!一、新手必踩的3大天坑(附救命代码)技巧1:缩进踩坑事件ifTrue:print("这样写必报错!...

为什么Python里遍历字符串比列表慢?3个底层原因揭秘

用字符串处理文本时,你可能正悄悄浪费性能。在日常Python开发中,我们经常需要遍历字符串和列表。但你是否注意过,当处理海量数据时,遍历字符串的速度明显比列表慢?这背后隐藏着Python设计的深层逻辑...

记录Python3.7.4更新到Python.3.7.8

Python官网Python安装包下载下载文件名称运行后选择升级选项等待安装安装完毕打开IDLE使用Python...

Python3中最常用的5种线程锁你会用吗

前言本章节将继续围绕threading模块讲解,基本上是纯理论偏多。对于日常开发者来讲很少会使用到本章节的内容,但是对框架作者等是必备知识,同时也是高频的面试常见问题。私信小编01即可获取大量Pyth...