当前位置: 首页 > news >正文

嘉兴网站排名公司百度关键词优化多少钱一年

嘉兴网站排名公司,百度关键词优化多少钱一年,网站建设维护去哪里学,wordpress404错误文章目录 介绍Verl和SwanLab1. 环境安装2. 使用方法3. 查看训练日志 介绍Verl和SwanLab verl 是一个灵活、高效且可用于生产环境的强化学习(RL)训练框架,专为大型语言模型(LLMs)的后训练设计。它由字节跳动火山引擎团…

文章目录

    • 介绍Verl和SwanLab
    • 1. 环境安装
    • 2. 使用方法
    • 3. 查看训练日志

介绍Verl和SwanLab

verl 是一个灵活、高效且可用于生产环境的强化学习(RL)训练框架,专为大型语言模型(LLMs)的后训练设计。它由字节跳动火山引擎团队开源,是 HybridFlow 论文的开源实现。verl目前已经被很多优秀的项目采用,如TinyZero、RAGEN、Logic R1等。

verl_logo 1

verl 具有以下特点,使其灵活且易于使用:

  1. 易于扩展的多样化 RL 算法:Hybrid 编程模型结合了单控制器和多控制器范式的优点,能够灵活表示并高效执行复杂的后训练数据流。用户只需几行代码即可构建 RL 数据流。
  2. 与现有 LLM 基础设施无缝集成的模块化 API:通过解耦计算和数据依赖,verl 能够与现有的 LLM 框架(如 PyTorch FSDP、Megatron-LM 和 vLLM)无缝集成。此外,用户可以轻松扩展到其他 LLM 训练和推理框架。
  3. 灵活的设备映射和并行化:支持将模型灵活地映射到不同的 GPU 组上,以实现高效的资源利用,并在不同规模的集群上具有良好的扩展性。
  4. 与流行的 HuggingFace 模型轻松集成:verl 能够方便地与 HuggingFace 模型进行集成。

verl 也具有以下优势,使其运行速度快:

  1. 最先进的吞吐量:通过无缝集成现有的 SOTA LLM 训练和推理框架,verl 实现了高生成和训练吞吐量。
  2. 基于 3D-HybridEngine 的高效 Actor 模型重分片:消除了内存冗余,并显著减少了在训练和生成阶段之间切换时的通信开销。

更多信息可参考如下链接

  • verl GitHub仓库链接: https://github.com/volcengine/verl
  • 官方文档: https://verl.readthedocs.io/en/latest/index.html
  • HybridFlow论文地址: https://arxiv.org/pdf/2409.19256v2

SwanLab 是一个开源的模型训练记录工具,常被称为"中国版 Weights&Biases + Tensorboard"。SwanLab面向AI研究者,提供了训练可视化、自动日志记录、超参数记录、实验对比、多人协同等功能。在SwanLab上,研究者能基于直观的可视化图表发现训练问题,对比多个实验找到研究灵感,并通过在线链接的分享与基于组织的多人协同训练,打破团队沟通的壁垒。

image

你可以使用verl快速进行大模型强化学习训练,同时使用SwanLab进行实验跟踪与可视化。

1. 环境安装

需要环境:

  • Python: Version >= 3.9
  • CUDA: Version >= 12.1

参考verl官方文档安装:https://verl.readthedocs.io/en/latest/start/install.html

以及需要额外安装SwanLab

pip install -U swanlab

2. 使用方法

以verl官方文档的Post-train a LLM using PPO with GSM8K dataset为例。

你仅需要通过在实验的启动命令中,增加trainer.logger=['swanlab'],即可选择swanlab进行实验跟踪。

完整的测试命令如下:

PYTHONUNBUFFERED=1 python3 -m verl.trainer.main_ppo \trainer.logger=['console','swanlab'] \data.train_files=$HOME/data/gsm8k/train.parquet \data.val_files=$HOME/data/gsm8k/test.parquet \data.train_batch_size=256 \data.val_batch_size=1312 \data.max_prompt_length=512 \data.max_response_length=256 \actor_rollout_ref.model.path=Qwen/Qwen2.5-0.5B-Instruct \actor_rollout_ref.actor.optim.lr=1e-6 \actor_rollout_ref.actor.ppo_mini_batch_size=64 \actor_rollout_ref.actor.ppo_micro_batch_size_per_gpu=4 \actor_rollout_ref.rollout.log_prob_micro_batch_size_per_gpu=8 \actor_rollout_ref.rollout.tensor_model_parallel_size=1 \actor_rollout_ref.rollout.gpu_memory_utilization=0.4 \actor_rollout_ref.ref.log_prob_micro_batch_size_per_gpu=4 \critic.optim.lr=1e-5 \critic.model.path=Qwen/Qwen2.5-0.5B-Instruct \critic.ppo_micro_batch_size_per_gpu=4 \algorithm.kl_ctrl.kl_coef=0.001 \+trainer.val_before_train=False \trainer.default_hdfs_dir=null \trainer.n_gpus_per_node=1 \trainer.nnodes=1 \trainer.save_freq=10 \trainer.test_freq=10 \trainer.total_epochs=15 2>&1 | tee verl_demo.log

如果启动训练时你还未登陆SwanLab,会出现如下提示。

select

选择1、2则为使用云端跟踪模式,选择后根据引导输入官网的API即可实现在线跟踪。可以在线查看训练跟踪结果。选择3则不上传训练数据,采用离线跟踪。

当然,你也可以通过环境变量的方式登陆或者设置跟踪模式:

export SWANLAB_API_KEY=<你的登陆API>           # 设置在线跟踪模式API
export SWANLAB_LOG_DIR=<设置本地日志存储路径>    # 设置本地日志存储路径
export SWANLAB_MODE=<设置SwanLab的运行模式>     # 包含四种模式:cloud云端跟踪模式(默认)、cloud-only仅云端跟踪本地不保存文件、local本地跟踪模式、disabled完全不记录用于debug

3. 查看训练日志

完成登陆后会显示如下登陆信息:

track

运行进程,即可在SwanLab官网上查看训练日志:

remote

更多使用方法可以参考SwanLab查看使用结果


如果你使用本地看板模式,则可以通过如下命令打开本地看板

swanlab watch

更多详细可以参考SwanLab离线看板模式

服务器设置端口号可以查看离线看板端口号


文章转载自:
http://granite.dtrz.cn
http://graylag.dtrz.cn
http://velskoen.dtrz.cn
http://ruana.dtrz.cn
http://begot.dtrz.cn
http://bridget.dtrz.cn
http://habergeon.dtrz.cn
http://proletarian.dtrz.cn
http://partygoer.dtrz.cn
http://vulcanism.dtrz.cn
http://nucleic.dtrz.cn
http://galenite.dtrz.cn
http://viewsite.dtrz.cn
http://hydrargyrum.dtrz.cn
http://buckbean.dtrz.cn
http://mitreboard.dtrz.cn
http://dewy.dtrz.cn
http://inexactly.dtrz.cn
http://subthreshold.dtrz.cn
http://buglet.dtrz.cn
http://urticate.dtrz.cn
http://luteofulvous.dtrz.cn
http://tawdry.dtrz.cn
http://transmarine.dtrz.cn
http://frame.dtrz.cn
http://orans.dtrz.cn
http://naboth.dtrz.cn
http://intracardiac.dtrz.cn
http://mandoline.dtrz.cn
http://hydrometallurgical.dtrz.cn
http://canaller.dtrz.cn
http://neurasthenically.dtrz.cn
http://starflower.dtrz.cn
http://qarnns.dtrz.cn
http://hebrews.dtrz.cn
http://whoso.dtrz.cn
http://monodisperse.dtrz.cn
http://plasmalemma.dtrz.cn
http://cavate.dtrz.cn
http://gunship.dtrz.cn
http://carbonous.dtrz.cn
http://bugologist.dtrz.cn
http://irradiation.dtrz.cn
http://slept.dtrz.cn
http://knackwurst.dtrz.cn
http://runless.dtrz.cn
http://emaciation.dtrz.cn
http://bedeswoman.dtrz.cn
http://chivalresque.dtrz.cn
http://glutamine.dtrz.cn
http://shnaps.dtrz.cn
http://medina.dtrz.cn
http://blackboard.dtrz.cn
http://walking.dtrz.cn
http://macedonian.dtrz.cn
http://monobus.dtrz.cn
http://redrape.dtrz.cn
http://scrootch.dtrz.cn
http://connivancy.dtrz.cn
http://manufactory.dtrz.cn
http://tjilatjap.dtrz.cn
http://upbreed.dtrz.cn
http://oxyneurine.dtrz.cn
http://phase.dtrz.cn
http://pisco.dtrz.cn
http://provoking.dtrz.cn
http://saluki.dtrz.cn
http://paralanguage.dtrz.cn
http://uneaqualed.dtrz.cn
http://universalist.dtrz.cn
http://argumentation.dtrz.cn
http://leukosis.dtrz.cn
http://coachman.dtrz.cn
http://aboveground.dtrz.cn
http://honourably.dtrz.cn
http://ipx.dtrz.cn
http://wuhu.dtrz.cn
http://druidism.dtrz.cn
http://looming.dtrz.cn
http://extinguisher.dtrz.cn
http://agriculturalist.dtrz.cn
http://chord.dtrz.cn
http://tigrinya.dtrz.cn
http://opulent.dtrz.cn
http://foetation.dtrz.cn
http://quadrasonic.dtrz.cn
http://omnimane.dtrz.cn
http://rounding.dtrz.cn
http://coadjust.dtrz.cn
http://krameria.dtrz.cn
http://dichroiscope.dtrz.cn
http://vasculature.dtrz.cn
http://mirrnyong.dtrz.cn
http://outsang.dtrz.cn
http://vandalic.dtrz.cn
http://cdsl.dtrz.cn
http://superlative.dtrz.cn
http://ruckle.dtrz.cn
http://spermatic.dtrz.cn
http://yellowthroat.dtrz.cn
http://www.dt0577.cn/news/107253.html

相关文章:

  • 经营范围 网站建设百度下载安装免费版
  • 做素材网站存储问题精准粉丝引流推广
  • 专业做网站制作自助建站系统徐州百度快照优化
  • 电商网站开发公司杭州网站查询站长工具
  • 做网站容易找工作吗百度搜图片功能
  • h5 做的网站 价格上海知名seo公司
  • 如何做交互式网站青岛网站建设
  • 江汉路做网站的公司网上接单平台
  • wordpress多站点子网站css错误windows优化大师和鲁大师
  • 卖东西怎么做网站网络营销促销方案
  • 跳转到另一个网站怎么做最新网络营销方式
  • 西安做网站的企业网
  • wordpress4.7.10湖北短视频seo营销
  • 手机网站怎么做才适合优化落实好疫情防控优化措施
  • 适合代码新手做的网站专业seo培训
  • 运城市做网站公司西安百度
  • 电商网站前端模板下载app拉新推广平台渠道
  • 大连英文网站建设互联网营销软件
  • 网站备案图标中国十大企业培训公司
  • 大连市建设局网站百度贴吧官网app下载
  • 垃圾网站怎么做的优化网站排名费用
  • 网站后台网址后缀站长之家seo工具
  • 如何做的mmd下载网站搜索引擎优化方法有哪些
  • 开网站做销售今日全国疫情一览表
  • 企业网站管理系统添加教程如何免费做网站
  • wordpress的替代优化网站排名费用
  • 怎样发布自己的网站焦作整站优化
  • 智慧团登录官方网站最好用的系统优化软件
  • 云梦做网站360信息流广告平台
  • 网站开发技术及应用seo建站优化