BF16和FP16对比

文章讨论了BF16和FP16两种16位浮点数格式在计算效率和精度上的差异。BF16提供更大的指数范围但牺牲了尾数精度,而FP16则有更高的尾数精度但指数范围较小。这两种格式在GPU和高性能计算中得到应用,如NVIDIA的TPU和英特尔的Nervana处理器。转换过程中的溢出和下溢问题以及精度损失也是关注点。
摘要由CSDN通过智能技术生成

BF16 是对FP32单精度浮点数截断数据,即用8bit 表示指数,7bit 表示小数。
FP16半精度浮点数,用5bit 表示指数,10bit 表示小数
与32位相比,采用BF16/FP16吞吐量可以翻倍,内存需求可以减半。但是这两者精度上差异不一样,BF16 可表示的整数范围更广泛,但是尾数精度较小;FP16 表示整数范围较小,但是尾数精度较高。

IEEE 浮点运算标准的 2008 年修订版引入了半精度 16 位浮点格式(称为 fp16)作为存储格式。各种制造商都采用了 fp16 进行计算,使用 fp32(单精度)和 fp64(双精度)格式规则的明显扩展。例如,NVIDIA P100和V100 GPU和AMD Radeon Instinct MI25 GPU以及为Fujitsu Post-K 百万兆次级计算机提供动力的A64FX Arm处理器支持fp16。

Bfloat16

Fp16 在科学计算中具有有限范围的缺点,其最大正数为 6.55 times 10^4。这导致了另一种 16 位格式的开发,该格式以精度换取范围。bfloat16格式被谷歌在其张量处理单元中使用。英特尔计划在其即将推出的 Nervana 神经网络处理器中支持 bfloat16,最近(2018 年 11 月)发布了一份白皮书,对该格式进行了精确定义。

此表显示了 bfloat16、fp16 和 fp32 的指数和有效位数的位分配,其中归一化数的隐式前导位计入有效数。

Bfloat16 的有效位数比 fp16 少三个位,但指数多三个位。它具有与 fp32 相同的指数大小。因此,从 fp32 转换为 bfloat16 很容易:指数保持不变,有效数从 24 位四舍五入或截断为 8;因此,在转换中不可能溢出和下溢。

另一方面,当我们从 fp32 转换为更窄的 fp16 格式时,溢出和下溢很容易发生,因此需要在转换前开发重新缩放的技术——请参阅我和 Sri Pranesh 最近的 EPrint 将矩阵压缩为半精度,以及求解线性系统的应用。

bfloat16 的缺点是精度较低:基本上是 3 位有效的十进制数字,而 fp16 的精度为 4。下表显示了三种格式的单位舍入 u、最小正(次正规)数 xmin、最小规范化正数 xmin 和最大有限数 xmax。

Harmonic Series 

比较这些不同精度的一个有趣方法是求和调波级数 1 + 1/2 + 1/3 + cdots。序列发散,但是当在浮点运算中以自然顺序求和时,它会收敛,因为部分和增长而加法减少,最终加法足够小,以至于它不会改变部分和。下表显示了不同精度的谐波级数的计算总和,以及在总和变为常数之前添加的项数。

 

 

写文章

热门文章

  • ubuntu中开启、关闭防火墙 70885
  • grep用法详解:grep与正则表达式 64915
  • nginx之location配置 59650
  • http参数中特殊字符处理 56540
  • tortoise svn无法连接到svn服务器,但用浏览器可以连接到svn服务器之解决方法 46312

分类专栏

  • C++ 8篇
  • DOS 5篇
  • XML 7篇
  • IE DOM、IE 内核(COM) 14篇
  • 小语种 1篇
  • Javascript、Js处理引擎 3篇
  • windows操作系统 3篇
  • Linux操作系统 8篇
  • 设计模式 1篇
  • MFC、VC 3篇
  • COM/ATL 1篇
  • PHP 10篇
  • JSP 1篇
  • 字符编码 1篇
  • svn 2篇
  • sybase 1篇
  • 安全技术 1篇
  • MSDN翻译 1篇
  • 最崇拜的人 2篇
  • ODBC 1篇
  • myeclipse 1篇
  • oracle 7篇
  • gsoap、jax-ws框架java webservice 1篇
  • winsowserver 2008 ie 安全 1篇
  • android 10篇
  • 免新闻打扰小工具 1篇
  • java 10篇
  • 算法(排序) 1篇
  • 生活 1篇
  • cocos2dx 1篇
  • android布局 2篇
  • http 1篇
  • android jni 1篇
  • mysql 5篇
  • ubuntu 6篇
  • IE基本运用 1篇
  • shell 20篇
  • Tomcat 2篇
  • centos 7篇
  • 正则表达式 1篇
  • c 1篇
  • android事件 1篇
  • 手势 1篇
  • chromium 7篇
  • viausl studio 2010性能优化 1篇
  • IE 5篇
  • git 5篇
  • libcurl 2篇
  • google 1篇
  • 搜索引擎 1篇
  • unicode c++ cout printf local 1篇
  • 免杀毒软件坑杀 1篇
  • c++ url 1篇
  • bat 2篇
  • com 1篇
  • chromium gyp 1篇
  • chromium ninja 1篇
  • shell linux command 1篇
  • http ftp libcurl 1篇
  • 健康 1篇
  • php ftp mysql nginx linux 2篇
  • php mysql
  • jsonp 跨域 1篇
  • geoip php 1篇
  • 7z linux 1篇
  • regex 1篇
  • nginx 3篇
  • winDug 1篇
  • html 1篇
  • linux 1篇
  • nginx+php 1篇
  • ios object-c 1篇
  • 技术合伙 1篇

最新评论

  • ChatGLM的chat和stream_chat有什么区别,几句话简单说清楚

    竹雨夜滴翠: 懂了,谢谢

  • neo4j所有处理过程

    2301_79594052: 您好,我遇到一个报错neo4j.exceptions.ClientError: There is no procedure with the name `db.index.fulltext.createNodeIndex` registered for this database instance. Please ensure you've spelled the procedure name correctly and that the procedure is properly deployed. 是运行这行代码的时候出现的graph.query("CALL db.index.fulltext.createNodeIndex('movie',['Movie'], ['title'],{ analyzer: 'cjk'})"),您有空回复一下吗

  • telegram api接口细节介绍

    CV大师杨某: 大佬,知道怎么使用TG小程序自己的页头嘛

  • python logging日志格式化对齐之空格

    北风之神c: 总结的很全面,写得赞,博主用心了。 此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装,兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全,文件日志写入性能高 。 5、入参简单,能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。

  • 如何在 Ubuntu 20.04 上安装和配置 Neo4j

    qq_45952885: echo "deb [signed-by=/usr/share/keyrings/neo4j.gpg] https://debian.neo4j.com stable 4.1" | sudo tee /etc/apt/sources.list.d/neo4j.list

最新文章

  • Python之Pydantic基础教程
  • Python各种符号的基本功能
  • Python中的`__init__`方法和`self`参数的作用
2024
10月 8篇
09月 24篇
08月 7篇
07月 29篇
06月 13篇
05月 1篇
2023年22篇
2021年6篇
2020年1篇
2019年4篇
2018年1篇
2015年60篇
2014年109篇
2013年54篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家商场美陈公司官网新疆玻璃钢动物雕塑防火玻璃钢雕塑甘肃玻璃钢卡通雕塑介绍四川玻璃钢商城广场美陈雕塑报价贵州景区玻璃钢雕塑图片玻璃钢雕塑分割后如何对接钦州商场美陈辽宁商场创意商业美陈风格许昌大型玻璃钢雕塑本溪玻璃钢雕塑制作厂家佛山发光小品玻璃钢雕塑工艺西安哪有玻璃钢花盆的金华特色玻璃钢雕塑批发江阴百货商场美陈台州玻璃钢雕塑多少钱晋城附近玻璃钢彩绘雕塑佛山玻璃钢足球形象雕塑许昌水景校园玻璃钢雕塑定做迪庆玻璃钢雕塑直销玻璃钢雕塑仿金属刷什么油漆广东户外玻璃钢雕塑图片人物玻璃钢卡通雕塑代理价格温县玻璃钢雕塑定制新郑室内玻璃钢仿铜雕塑公司新疆玻璃钢卡通雕塑园区雕塑玻璃钢和不锈钢哪个好玻璃钢校园雕塑价格上海佛像玻璃钢雕塑订做价格玻璃钢棒棒糖雕塑图片香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化