huggingface笔记：使用accelerate加速

article2024/11/1 7:37:37/文章来源:https://blog.csdn.net/qq_40206371/article/details/138952975

1 介绍

随着模型规模的增大，并行处理已成为在有限硬件上训练大型模型和提高训练速度的重要策略。
Hugging Face 创建了Accelerate库，帮助用户在任何类型的分布式环境中轻松训练Transformers模型，无论是单机多GPU还是跨多机的多GPU

2 创建Accelerator对象

from accelerate import Accelerator

accelerator = Accelerator()

3 训练对象传递给prepare方法

train_dataloader, eval_dataloader, model, optimizer = accelerator.prepare(
    train_dataloader,
    eval_dataloader, 
    model, 
    optimizer
)

4 反向传播

唯一不同的是把loss.backward()替换成Accelerate的backward

5 总结

绿色的是加上的，红色的是去掉的

6 训练

运行以下命令创建并保存配置文件

accelerate config

然后启动训练：

accelerate launch train.py

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/632308.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

微信公众号自定义分销商城小程序源码系统带完整的安装代码吧以及系统部署搭建教程

系统概述微信公众号自定义分销商城小程序源码系统是一款功能强大的电商解决方案，它集成了商品管理、订单处理、支付接口、分销管理等多种功能。该系统支持自定义界面设计，商家可根据自身需求调整商城的页面布局和风格，打造独特的品牌形象。…

多客开源】游戏陪玩系统,游戏陪玩源码,游戏陪玩语音社交源码运营版游戏陪玩平台源码/tt语音聊天/声优服务/陪玩系统源码开黑/约玩源码

介绍我们针对陪玩app源码市场的发展趋势，整合市面上主流陪玩app应用功能，自主开发了多客陪玩系统源码，并可为客户提供全部原生陪玩源码，进行二次开发，打造适用于线上游戏陪玩、语音聊天、心理咨询、情感陪伴等业务场…

玩转Matlab-Simscape（初级）- 08 - 基于Solidworks、Matlab Simulink、COMSOL的协同仿真（案例实战）

** 玩转Matlab-Simscape（初级）- 08 - 基于Solidworks、Matlab Simulink、COMSOL的协同仿真（案例实战） ** 目录玩转Matlab-Simscape（初级）- 08 - 基于Solidworks、Matlab Simulink、COMSOL的协同仿真&…

RockTree Capital石木资本品牌升级沉浸式“加密朋克风”网站震撼上线

总部位于北京的领先的Web3 原生加密基金与投资机构 RockTree Capital 石木资本，宣布推出全新沉浸式网站，在其中呈现一个未来主义电影风格概念：赛博朋克加密城市。这个前沿互动型城市景观代表着 RockTree Capital 对 Web3 普及以及技术、金融与…

AI预测体彩排3采取878定位大底=23策略+杀断组+杀组选+杀和尾+杀和值012缩水测试5月16日预测第2弹

昨天的87823大底测试第一次测试，已经成功命中! 今天继续测试，仍旧目标为：10期中至少5中期。好了，废话不多说了，直接上结果吧~ 首先，878定位如下： 百位：4,5,6,3,8,1,9,0…

【Unity Shader入门精要第7章】基础纹理（三）

1. 渐变纹理另外一种对于纹理的使用方式是通过渐变纹理为物体提供漫反射光照效果。顾名思义，渐变纹理本身就是一张颜色渐变（可以是连续渐变，也可能是突变）的图片，这个渐变的过程模拟的就是光源从不同的角度照射物体…

Python代码：七、小数化整数

1、题目日常生活中我们会遇到很多小数，但是有的人不喜欢小数，因此会用四舍五入的方式将其去掉。在Python中我们更加简单，可以利用强制类型转换将小数转变成整数，请你试一试。 2、代码 import sysn float(input()) print(int(…

JUnit5超时处理

测试过程中如果某条测试用例执行过程中阻塞，就会发生超时问题： 阻塞其他用例的执行对于某些用例，如果用例执行时间过长，那么本身就是bug 使用场景： 使用JUnit5自带的超时处理，当测试用例执行时间超过执行…

mybatis-plus-ui代码生成器

mybatis-plus-generator-ui 提供交互式的Web UI用于生成兼容mybatis-plus框架的相关功能代码，包括Entity,Mapper,Mapper.xml,Service,Controller等 ，可以自定义模板以及各类输出参数，也可通过SQL查询语句直接生成代码。使用方法引入mave…

邮箱API发信有哪些限制？如何设置API接口？

腾讯云邮箱API与AokSend相比，有哪些优势和特性差异？ 使用邮箱API发信并非毫无限制，如何正确设置API接口并选择合适的服务商，成为企业关注的焦点。接下来，Aok将探讨邮箱API发信的限制、API接口的设置方法，以…

图文并茂：解析Spring Boot Controller返回图片的三种方式

欢迎来到我的博客，代码的世界里，每一行都是一个故事图文并茂：解析Spring Boot Controller返回图片的三种方式前言使用Base64编码返回图片使用byte数组返回图片使用Resource对象返回图片图片格式转换与性能对比前言在互联网的世界里&…

LiveGBS流媒体平台GB/T28181用户手册-国标设备:设备列表、通道列表、流传输模式修改、查看通道播放、设备录像、在线状态、流量统计

LiveGBS流媒体平台GB/T28181用户手册-国标设备:设备列表、通道列表、流传输模式修改、查看通道播放、设备录像、在线状态、流量统计 1、国标设备1.1、设备列表1.1.1、查看通道1.1.2、更新通道1.1.3、编辑1.1.3、导入导出1.1.4、条件检索1.1.5、设备状态记录1.1.6、设备流量统计…