当前位置: 首页 > news >正文

女生化妆品网站建设规划书如何注册域名及网站

女生化妆品网站建设规划书,如何注册域名及网站,网站建设捌金手指专业7,引导企业做网站背景 LlamaFactory 的 LoRA 微调功能非常便捷,微调后的模型,没有直接支持 vllm 推理,故导致推理速度不够快。 LlamaFactory 目前支持通过 VLLM API 进行部署,调用 API 时的响应速度,仍然没有vllm批量推理的速度快。 …

背景

LlamaFactory 的 LoRA 微调功能非常便捷,微调后的模型,没有直接支持 vllm 推理,故导致推理速度不够快。

LlamaFactory 目前支持通过 VLLM API 进行部署,调用 API 时的响应速度,仍然没有vllm批量推理的速度快。

如果模型是通过 LlamaFactory 微调的,为了确保数据集的一致性,建议在推理时也使用 LlamaFactory 提供的封装数据集。

简介

在上述的背景下,我们使用 LlamaFactory 原生数据集,支持 lora的 vllm 批量推理。
完整代码如下:

import json
import os
from typing import Listfrom vllm import LLM, SamplingParams
from vllm.lora.request import LoRARequestfrom llamafactory.data import get_dataset, get_template_and_fix_tokenizer
from llamafactory.extras.constants import IGNORE_INDEX
from llamafactory.hparams import get_train_args
from llamafactory.model import load_tokenizerdef vllm_infer():model_args, data_args, training_args, finetuning_args, generating_args = (get_train_args())tokenizer = load_tokenizer(model_args)["tokenizer"]template = get_template_and_fix_tokenizer(tokenizer, data_args)eval_dataset = get_dataset(template, model_args, data_args, training_args, finetuning_args.stage, tokenizer)["eval_dataset"]prompts = [item["input_ids"] for item in eval_dataset]prompts = tokenizer.batch_decode(prompts, skip_special_tokens=False)labels = [list(filter(lambda x: x != IGNORE_INDEX, item["labels"]))for item in eval_dataset]labels = tokenizer.batch_decode(labels, skip_special_tokens=True)sampling_params = SamplingParams(temperature=generating_args.temperature,top_k=generating_args.top_k,top_p=generating_args.top_p,max_tokens=2048,)if model_args.adapter_name_or_path:if isinstance(model_args.adapter_name_or_path, list):lora_requests = []for i, _lora_path in enumerate(model_args.adapter_name_or_path):lora_requests.append(LoRARequest(f"lora_adapter_{i}", i, lora_path=_lora_path))else:lora_requests = LoRARequest("lora_adapter_0", 0, lora_path=model_args.adapter_name_or_path)enable_lora = Trueelse:lora_requests = Noneenable_lora = Falsellm = LLM(model=model_args.model_name_or_path,trust_remote_code=True,tokenizer=model_args.model_name_or_path,enable_lora=enable_lora,)outputs = llm.generate(prompts, sampling_params, lora_request=lora_requests)if not os.path.exists(training_args.output_dir):os.makedirs(training_args.output_dir, exist_ok=True)output_prediction_file = os.path.join(training_args.output_dir, "generated_predictions.jsonl")with open(output_prediction_file, "w", encoding="utf-8") as writer:res: List[str] = []for text, pred, label in zip(prompts, outputs, labels):res.append(json.dumps({"prompt": text, "predict": pred.outputs[0].text, "label": label},ensure_ascii=False,))writer.write("\n".join(res))

vllm.yaml 示例:

## model
model_name_or_path: qwen/Qwen2.5-7B-Instruct
# adapter_name_or_path: lora模型### method
stage: sft
do_predict: true
finetuning_type: lora### dataset
dataset_dir: 数据集路径
eval_dataset: 数据集
template: qwen
cutoff_len: 1024
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16### output
output_dir: output/
overwrite_output_dir: true### eval
predict_with_generate: true

程序调用:

python vllm_infer.py vllm.yaml

程序运行速度:

Processed prompts: 100%|| 1000/1000 [01:56<00:00,  8.60it/s, est. speed input: 5169.35 toks/s, output: 811.57

总结

本方案在原生 LlamaFactory 数据集的基础上,支持 LoRA 的 vllm 批量推理,能提升了推理效率。

进一步阅读

如果微调模型后,发现使用vllm模型批量效果不太好,可以参考下述文章:

  • 基于 LLamafactory 的异步API高效调用实现与速度对比.https://blog.csdn.net/sjxgghg/article/details/144176645

亲测,LLamafactory 部署 模型,然后使用 Async API 调用后评估效果会好一些。

http://www.qdjiajiao.com/news/10680.html

相关文章:

  • 时尚大气网站百度app关键词优化
  • 宿迁明远建设有限公司网站军事新闻最新24小时
  • 提升网页优化排名公司关键词排名优化
  • 按f12复制代码可以做网站吗推广营销大的公司
  • 蓄电池回收网站建设seo的优化方案
  • 网站群如何做网站关键词排名公司
  • 网站开发的功能需求文档模板服装品牌营销策划方案
  • 怎么找网站啊品牌营销策划方案案例
  • 做网站的为什么不给域名和密码seo指的是
  • 利用软件做许多网站违法吗磁力搜索引擎下载
  • 招聘网站开发需要多长时间最佳bt磁力搜索引擎
  • 网站推广优化技巧大全淘宝站外引流推广方法
  • 网站框架与内容阿里云网站搭建
  • pc网站建设建议成人计算机速成培训班
  • 什么样的网站利于优化做seo是什么意思
  • 网站隐藏网址后缀名长春网站建设模板
  • 怎么搭建一个自己的网站深圳网络推广解决方案
  • 在百度上做公司做网站网站建设方案推广
  • 贵州省安顺市网站建设seo网络优化师
  • 织梦网站会员上传图片网页设计师
  • 网站介绍ppt怎么做如何制作微信小程序
  • 网站全局变量推广业务平台
  • 罗湖区住房和建设网站品牌营销
  • 北京做网站哪家专业重庆优化seo
  • 福州专业网站建设价格营销团队找产品合作
  • 黄岛区做网站的百度我的订单
  • 东莞谢岗网站建设hyein seo是什么牌子
  • 人和马做的视频网站如何做线上营销
  • CMS网站建设优势广告优化
  • 做百度移动网站快速有哪些可以免费推广的平台