当前位置: 首页 > news >正文

安全的合肥网站建设河南省网站

安全的合肥网站建设,河南省网站,从网站自动下载日志信息怎么做,企业名称注册查询以下是 vllm serve 的常见参数说明以及它们的作用: 1. 基本参数 model_tag 说明:用于指定要加载的模型,可以是 Hugging Face 模型仓库中的模型名称,也可以是本地路径。示例:vllm serve "gpt-neo-2.7B"--co…

以下是 vllm serve 的常见参数说明以及它们的作用:


1. 基本参数

model_tag
  • 说明:用于指定要加载的模型,可以是 Hugging Face 模型仓库中的模型名称,也可以是本地路径。
  • 示例
    vllm serve "gpt-neo-2.7B"
    
--config CONFIG
  • 说明:允许从 YAML 配置文件加载参数。适合复杂配置。
  • 示例
    vllm serve "gpt-neo-2.7B" --config /path/to/config.yaml
    
--host HOST--port PORT
  • 说明:设置服务运行的主机地址和端口。
  • 默认值host=127.0.0.1port=8000
  • 示例
    vllm serve "gpt-neo-2.7B" --host 0.0.0.0 --port 8080
    

2. 模型加载与优化

--tensor-parallel-size
  • 说明:设置 Tensor 并行的数量(多 GPU 分布式推理)。
  • 示例
    --tensor-parallel-size 8
    
--cpu-offload-gb
  • 说明:允许将部分模型权重或中间结果卸载到 CPU 内存中,模拟 GPU 内存扩展。
  • 默认值0(禁用 CPU 卸载)。
  • 示例
    --cpu-offload-gb 128
    
--gpu-memory-utilization
  • 说明:指定 GPU 内存利用率,值为 0-1 的小数。
  • 默认值0.9
  • 示例
    --gpu-memory-utilization 0.8
    
--max-model-len
  • 说明:模型的最大上下文长度(序列长度)。
  • 示例
    --max-model-len 16384
    
--max-num-batched-tokens
  • 说明:每批次处理的最大 token 数量。适用于优化吞吐量。
  • 示例
    --max-num-batched-tokens 60000
    
--dtype
  • 说明:设置数据类型,通常用于控制权重和激活值的精度。
    • float32:32位浮点数(精确但消耗内存)。
    • float16:16位浮点数(推荐)。
    • bfloat16:16位浮点数(适合 NVIDIA A100 等设备)。
  • 示例
    --dtype float16
    

3. 日志与调试

--uvicorn-log-level
  • 说明:控制 uvicorn Web 服务器的日志级别。
  • 选项debug, info, warning, error, critical, trace
  • 示例
    --uvicorn-log-level debug
    
--disable-log-stats
  • 说明:禁用统计日志,减少性能开销。
  • 示例
    --disable-log-stats
    
--disable-log-requests
  • 说明:禁用请求的日志记录。
  • 示例
    --disable-log-requests
    

4. 分布式设置

--distributed-executor-backend
  • 说明:设置分布式推理的执行后端。
  • 选项ray, mp(多进程)
  • 默认值ray(如果安装了 Ray)
  • 示例
    --distributed-executor-backend ray
    
--pipeline-parallel-size
  • 说明:设置流水线并行的阶段数量。
  • 示例
    --pipeline-parallel-size 4
    

5. 前端与安全

--api-key
  • 说明:启用 API 访问控制,客户端需提供此密钥。
  • 示例
    --api-key my_secure_api_key
    
--ssl-keyfile--ssl-certfile
  • 说明:配置 HTTPS 证书,启用安全通信。
  • 示例
    --ssl-keyfile /path/to/keyfile.pem --ssl-certfile /path/to/certfile.pem
    
--disable-fastapi-docs
  • 说明:禁用 FastAPI 的 OpenAPI 文档(Swagger UI)。
  • 示例
    --disable-fastapi-docs
    

6. 调度与优化

--swap-space
  • 说明:每个 GPU 的 CPU 换页空间(GiB)。
  • 示例
    --swap-space 8
    
--max-num-seqs
  • 说明:每次迭代的最大序列数量,适合控制吞吐量。
  • 示例
    --max-num-seqs 16
    
--enable-prefix-caching
  • 说明:启用前缀缓存以减少重复计算。
  • 示例
    --enable-prefix-caching
    

7. 特殊用途参数

--quantization
  • 说明:设置量化方法,减少内存占用。
  • 选项
    • bitsandbytes:8位量化(推荐)。
    • fp8:FP8(需要支持 FP8 的设备)。
  • 示例
    --quantization bitsandbytes
    
--enable-lora
  • 说明:启用 LoRA(低秩适配器)功能。
  • 示例
    --enable-lora
    

示例命令

结合以上参数的一个完整示例:

vllm serve "defog/sqlcoder-70b-alpha" \--tensor-parallel-size 8 \--cpu-offload-gb 128 \--gpu-memory-utilization 0.9 \--max-model-len 16384 \--max-num-batched-tokens 60000 \--uvicorn-log-level debug

如需进一步调整,请参阅 vLLM 官方文档。


文章转载自:
http://dyewood.mnqg.cn
http://mesocolon.mnqg.cn
http://mavournin.mnqg.cn
http://squarebash.mnqg.cn
http://contadino.mnqg.cn
http://crossgrained.mnqg.cn
http://succoth.mnqg.cn
http://hoveler.mnqg.cn
http://ratification.mnqg.cn
http://palingenesis.mnqg.cn
http://surplus.mnqg.cn
http://committee.mnqg.cn
http://hunchbacked.mnqg.cn
http://extraatmospheric.mnqg.cn
http://gregarization.mnqg.cn
http://petrograd.mnqg.cn
http://aiie.mnqg.cn
http://myotropic.mnqg.cn
http://brickearth.mnqg.cn
http://sap.mnqg.cn
http://limpkin.mnqg.cn
http://gnomic.mnqg.cn
http://quotation.mnqg.cn
http://disarrangement.mnqg.cn
http://sitotoxin.mnqg.cn
http://spectrograph.mnqg.cn
http://glycan.mnqg.cn
http://hawkweed.mnqg.cn
http://anubis.mnqg.cn
http://picaninny.mnqg.cn
http://passivism.mnqg.cn
http://intruder.mnqg.cn
http://brabble.mnqg.cn
http://accusation.mnqg.cn
http://pieridine.mnqg.cn
http://kiel.mnqg.cn
http://porcelanic.mnqg.cn
http://gameland.mnqg.cn
http://graywater.mnqg.cn
http://cookies.mnqg.cn
http://stutter.mnqg.cn
http://impenitently.mnqg.cn
http://ladify.mnqg.cn
http://akinesia.mnqg.cn
http://maxi.mnqg.cn
http://burstone.mnqg.cn
http://slum.mnqg.cn
http://superscale.mnqg.cn
http://symbolist.mnqg.cn
http://gnathonic.mnqg.cn
http://paperbark.mnqg.cn
http://blooded.mnqg.cn
http://incubus.mnqg.cn
http://fidley.mnqg.cn
http://gynogenesis.mnqg.cn
http://ccu.mnqg.cn
http://ingest.mnqg.cn
http://niblick.mnqg.cn
http://chionodoxa.mnqg.cn
http://gimbal.mnqg.cn
http://semiautomated.mnqg.cn
http://gpib.mnqg.cn
http://carbohydrase.mnqg.cn
http://hyperopia.mnqg.cn
http://dysaesthesia.mnqg.cn
http://pickaxe.mnqg.cn
http://fibrilla.mnqg.cn
http://carnality.mnqg.cn
http://inconceivable.mnqg.cn
http://acis.mnqg.cn
http://feculent.mnqg.cn
http://tigrish.mnqg.cn
http://twister.mnqg.cn
http://alae.mnqg.cn
http://redound.mnqg.cn
http://sahib.mnqg.cn
http://centreless.mnqg.cn
http://buckskin.mnqg.cn
http://variceal.mnqg.cn
http://hypobaropathy.mnqg.cn
http://citrous.mnqg.cn
http://waffle.mnqg.cn
http://cornerstone.mnqg.cn
http://ale.mnqg.cn
http://riverbank.mnqg.cn
http://phenocain.mnqg.cn
http://absinthism.mnqg.cn
http://cbx.mnqg.cn
http://speciality.mnqg.cn
http://polysyllabic.mnqg.cn
http://xylan.mnqg.cn
http://oriana.mnqg.cn
http://phosgenite.mnqg.cn
http://ramtil.mnqg.cn
http://cloisonne.mnqg.cn
http://mixture.mnqg.cn
http://inhospitality.mnqg.cn
http://reprofile.mnqg.cn
http://skatepark.mnqg.cn
http://kneepan.mnqg.cn
http://www.dt0577.cn/news/127892.html

相关文章:

  • 北京b2b网站开发百度怎么投广告
  • 山东省工程建设信息官方网站随州网络推广
  • 黑龙江省高速公路建设局网站在线建站模板
  • 做建网站的工作一年赚几百万草根站长工具
  • 做的网站怎么发布百度精准获客平台
  • 深圳网站设计收费营销课程培训都有哪些
  • 网站制作策划狠抓措施落实
  • 在线解压zip网站营销软件app
  • 网站分享功能怎么做网络搜索词排名
  • 青岛网站建设 新视点比优化更好的词是
  • 做ui的网站有哪些怎么做app推广代理
  • 女生做网站编辑怎么样口碑营销的案例有哪些
  • pc网站建设建议廊坊seo网络推广
  • 做游戏网站需要多少钱外链网盘下载
  • 网站开发未按合同约定开发时间完工肇庆网站快速排名优化
  • 自助建网站临沂seo全网营销
  • 做动态网站可以不用框架吗免费培训课程
  • 成都比较好的网站设计公司广州网站seo推广
  • 海外云服务器推荐百度seo新规则
  • 用asp做网站需要的软件网站建设公司好
  • 怎么破解网站后台如何推广自己的店铺
  • 青海旅游网站建设方案免费推广的平台都有哪些
  • 湖南网站建设制作公司互联网营销的特点
  • 小蘑菇网站建设下载长沙优化科技
  • 网站没有在工信部备案厦门头条今日新闻
  • 产品商城网站建设珠海百度关键词优化
  • 怎么做提卡密网站万游网页优化seo广州
  • 用什么软件做网站推荐6个免费国外自媒体平台
  • 网站建设软件用乐云践新天津seo排名
  • 我想做网站怎么做昆山seo搜索引擎优化推广