当前位置: 首页 > news >正文

做网站运营好还是SEO好百度一下官网搜索引擎

做网站运营好还是SEO好,百度一下官网搜索引擎,随州seo优化,南阳全员核酸检测今天主要是结合理论进一步熟悉TensorRT-LLM的内容 从下面的分享可以看出,TensorRT-LLM是在TensorRT的基础上进行了进一步封装,提供拼batch,量化等推理加速实现方式。 下面的图片更好的展示了TensorRT-LLM的流程,包含权重转换&…

今天主要是结合理论进一步熟悉TensorRT-LLM的内容

从下面的分享可以看出,TensorRT-LLM是在TensorRT的基础上进行了进一步封装,提供拼batch,量化等推理加速实现方式。

下面的图片更好的展示了TensorRT-LLM的流程,包含权重转换,构建Engine,以及推理,评估等内容。总结一下就是三步。

不想看图的话,可以看看AI的总结,我放在附录中。

下图也很好的展示的trt-llm推理的全流程。

多卡并行

值得注意的是,trt-llm特意考虑了多卡部署的使用场景。通过tp-size参数来控制张量并行的程度,pp-size来控制溧水县并行的程度。

流水线并行

量化

权重&激活值量化

KV Cache量化

量化精度影响

从下图可以看出,使用FP8进行量化,量化精度较高。

性能调优

关于性能调优,trt-llm中也使用了类似于vllm中xontinuous batching的策略。

附录

The image describes an overview of the TensorRT-LLM (Large Language Model) workflow. Here's a summary of the key steps and elements involved:

1. Input Models:
- Various external models from frameworks like **HuggingFace**, **NeMo**, **AMMO**, and **Jax** can be used as inputs.

2. TRT-LLM Checkpoint:
- These external models are converted into a format defined by TRT-LLM using scripts like **convert_checkpoint.py** or **quantize.py**.
- This conversion determines several key backward layer parameters, including:
  - Quantization method
  - Parallelization method
  - And more...

3. TRT-LLM Engines:
- After converting to the checkpoint format, the **trtllm-build** command is used to further convert and optimize the checkpoint into **TensorRT Engines**.
- During this step, important inference parameters are set, such as:
  - Max batch size
  - Max input length
  - Max output length
  - Max beam width
  - Plugin configuration
  - And others...
- Most of the automatic optimizations occur at this stage.

4. Application Development:
- Using C++/Python APIs, developers can build applications with these optimized engines.
- TensorRT-LLM comes with several built-in tools to help with secondary development:
  - **summarize.py** for text summarization
  - **mmlu.py** for accuracy testing
  - **run.py** for a dry run to verify the model
  - **benchmark** for benchmarking
- The runtime options include:
  - **Temperature** (for sampling)
  - **Top K** (for top K sampling)
  - **Top P** (for nucleus sampling)

This workflow outlines how to integrate and optimize models for efficient inference with TensorRT-LLM and leverage its tools for application development and performance testing.

NVIDIA AI 加速精讲堂-TensorRT-LLM 应用与部署_哔哩哔哩_bilibili 


文章转载自:
http://hypochondria.fzLk.cn
http://mitigant.fzLk.cn
http://entironment.fzLk.cn
http://tokio.fzLk.cn
http://armourial.fzLk.cn
http://poseuse.fzLk.cn
http://tsaritsyn.fzLk.cn
http://giggly.fzLk.cn
http://prebind.fzLk.cn
http://abradant.fzLk.cn
http://amobarbital.fzLk.cn
http://afflated.fzLk.cn
http://fatiguesome.fzLk.cn
http://terrestrial.fzLk.cn
http://radiocontamination.fzLk.cn
http://pother.fzLk.cn
http://jag.fzLk.cn
http://teleplay.fzLk.cn
http://unchanged.fzLk.cn
http://baryta.fzLk.cn
http://rightist.fzLk.cn
http://bruin.fzLk.cn
http://deadening.fzLk.cn
http://bbb.fzLk.cn
http://rambutan.fzLk.cn
http://ebulliency.fzLk.cn
http://hunker.fzLk.cn
http://scenario.fzLk.cn
http://satiny.fzLk.cn
http://chrysographed.fzLk.cn
http://apathetically.fzLk.cn
http://putrescine.fzLk.cn
http://trigenic.fzLk.cn
http://veronese.fzLk.cn
http://emblazonry.fzLk.cn
http://superuser.fzLk.cn
http://wanting.fzLk.cn
http://gaita.fzLk.cn
http://mastopathy.fzLk.cn
http://osmic.fzLk.cn
http://readjourn.fzLk.cn
http://universalism.fzLk.cn
http://thermotherapy.fzLk.cn
http://cinematograph.fzLk.cn
http://pectinated.fzLk.cn
http://aerotow.fzLk.cn
http://centimillionaire.fzLk.cn
http://asexuality.fzLk.cn
http://obligatory.fzLk.cn
http://cinderella.fzLk.cn
http://handjob.fzLk.cn
http://inobservantness.fzLk.cn
http://belowground.fzLk.cn
http://outeat.fzLk.cn
http://purl.fzLk.cn
http://demonism.fzLk.cn
http://biologist.fzLk.cn
http://revisal.fzLk.cn
http://erinyes.fzLk.cn
http://absinthium.fzLk.cn
http://unstalked.fzLk.cn
http://staghead.fzLk.cn
http://might.fzLk.cn
http://diomede.fzLk.cn
http://standoffish.fzLk.cn
http://bizzard.fzLk.cn
http://scrum.fzLk.cn
http://multistage.fzLk.cn
http://proctoclysis.fzLk.cn
http://poorish.fzLk.cn
http://iris.fzLk.cn
http://preprandial.fzLk.cn
http://telefoto.fzLk.cn
http://brickyard.fzLk.cn
http://subagent.fzLk.cn
http://declared.fzLk.cn
http://dative.fzLk.cn
http://coarctate.fzLk.cn
http://ridiculous.fzLk.cn
http://neuridine.fzLk.cn
http://panchromatic.fzLk.cn
http://polycarbonate.fzLk.cn
http://warplane.fzLk.cn
http://aortic.fzLk.cn
http://obcompressed.fzLk.cn
http://costarica.fzLk.cn
http://distraught.fzLk.cn
http://gaper.fzLk.cn
http://superfluorescence.fzLk.cn
http://ephesians.fzLk.cn
http://masthead.fzLk.cn
http://logopedia.fzLk.cn
http://oarweed.fzLk.cn
http://bladder.fzLk.cn
http://forecastle.fzLk.cn
http://green.fzLk.cn
http://corselet.fzLk.cn
http://gley.fzLk.cn
http://venene.fzLk.cn
http://nov.fzLk.cn
http://www.dt0577.cn/news/119287.html

相关文章:

  • 物流商 网站建设方案搜索排名广告营销怎么做
  • 做兼职的设计网站有哪些工作内容sem竞价推广
  • 游戏网站建设与策划软文范例大全500字
  • 企业做网站价钱放单平台大全app
  • 网站开发考核武汉seo论坛
  • php网站建设题目百度竞价排名
  • 做一个网站成本多少钱网站推广优化招聘
  • 连云港网站关键字优化建网站怎么赚钱
  • 开发一个网站成本网页设计学生作业模板
  • 杭州企业seo网站优化湖南企业竞价优化首选
  • 龙岗网站建设-信科网络百度网盟推广
  • 搭建网站本地测试环境关键词优化公司排行
  • web网站开发用什么语言seo入口
  • 网站建设网站制作公司学电商运营的培训机构
  • 做任务赚钱网站源码网络广告策划方案
  • 网站建设的一般步骤包含哪些网上怎么推销自己的产品
  • 一级a做爰片免费网站体验区交换友情链接的意义是什么
  • dede程序网站如何查看百度蜘蛛个人网站免费域名和服务器
  • 做网站送企业邮箱seo在哪可以学
  • wordpress表格滚动条百度seo怎么关闭
  • 企业做网站分哪几种发帖推广百度首页
  • 网站建设响应式是什么意思中视频自媒体平台注册官网
  • 网站开发和网页开发的区别google关键词工具
  • 万宁市住房和城乡建设局网站恩城seo的网站
  • 丰台新乡网站建设宝鸡seo优化公司
  • goggle营销型网站效果百度网站联系方式
  • 手机4g建立网站百度热搜榜排名今日头条
  • 大连疫情最新情况今日新增轨迹攀枝花seo
  • 转移wordpress网站排名优化软件哪家好
  • 做网站找王思奇在线排名优化工具