PCIe AER(一)

8 篇文章 2 订阅
订阅专栏
本文深入探讨PCIe AER(Advanced Error Reporting)中correct error的各个bit,包括Receiver Error Status、Bad TLP、Bad DLLP、REPLAY_NUM Rollover和Replay Timer Timeout等,并结合规范解析关键概念。通过trace分析,了解错误检测及处理流程。
摘要由CSDN通过智能技术生成

1、AER status register

 1.1  correct error每个bit的介绍(spec 6.2.7) 

        1.1.1 Receiver Error Status

表格后面的reference;

4.2.1.1.3

        If a received Symbol is found in the column corresponding to the incorrect running disparity or if the Symbol does not correspond to either column, the Physical Layer must notify the Data Link Layer that the received Symbol is invalid. This is a Receiver Error, and is a reported error associated with the Port (see Section 6.2 )

4.2.1.2

4.2.4.8

4.2.6

 

         总结:4.2.1.1.3指出如果8b/10b编码中出现symbol的disparity错误或者symbol本身错误,这是一种receiver error;

        4.2.1.2指出,一条规则,一个正确的TLP 在STP symbol和 END/EBD中间至少有18个symbol(1DW = 4symbol,18symbol,如果TLP header是3DW,LCRC 4symbol,还剩下2symbol=1DW 的data; 如果header 是4DW,LCRC是2symbol,就没有data?3DW header 主要是32bit的memory/IO request,Config Request,这些都要携带data,completion呢??? ) 

        4.2.4.8 指出了8b/10b 中receiver error,128b/130b 中的receiver error(8b/10b decode errors, Framing Errors, loss of Symbol lock, Elasticity Buffer Overflow/Underflow, or loss of Lane-to-Lane de-skew. 128b/130b:Framing Errors, loss of Block Alignment, Elasticity Buffer Overflow/Underflow, or loss of Lane-to-Lane de-skew)

        4.2.6 的重点是table 4-20,在LTSSM的哪个阶段会检查receiver error;

        其中有一些概念:symbol,可以理解为固定格式的8bit数据,参考spec table 4-1,附录B,8b/10b编码后会有RD-/RD+(CRD: Current Running Disparity)两种10bit格式,为了保持均衡性,RD后面要跟相反的RD,学习链接:

(2条消息) #PCIe# 为什么引入编码机制?_pcie disparity_那么菜的博客-CSDN博客

        还有receiver error中的其他概念也需要学习(Elasticity Buffer Overflow/Underflow, or loss of Lane-to-Lane de-skew),暂时还没找到具体资料

        其中对于TLP在lane上的传输格式,要区分gen1/gen2和gen3/gen4,因为编码方式不一样,导致了差异性,其中gen1/gen2

         TLP之前的STP&PSN 占3symbol, STP,PSN都是symbol,但是gen3/gen4DLLP或者TLP的开始不再是一个symbol,而是一个token(具体格式,spec fig 4-13),但是为什么gen3/gen4要这样呢,为了block更好对齐吗???

          1.1.2 Bad TLP

        

         总结:LCRC出错

        实际系统测试中,如果链路有问题(phy),但是没有引起其他不可修复错误,这个时候也可能引起其他correctable error置位,比如出现Bad TLP(如果引起replay错误,除非逻辑有问题,不然链路就很差了)

          1.1.3 Bad DLLP

         总结:CRC错误

        1.1.4 REPLAY_NUM Rollover

 

         总结:发送一个TLP,对端回复了nak,这个时候buffer中的TLP会重传一次,acknak机制中有一个2bit的REPLAY_NUM,初始为00b,一般希望是重传后能够被对方接收并回复ack,如果重传4次还没收到ack,那么就链路层进入recovery重新训练一下到L0。重传一次REPLAY_NUM+1,当REPLAY_NUM从11b rolls over 到00b时说明传了第四次了,这个时候就会触发REPLAY_NUM Rollover置位

        1.1.5 Replay Timer Timeout 

        总结:REPLAY_TIMER是传输的时候开始计时,收到ack/nak的时候reset,超时是因为对方没有回应,或者回应晚了(总之就是回应超时了)

         1.1.6 Correctable-Advisory Non-Fatal Error

         这个不具体介绍了,因为涉及到uncorrectable error,简单来讲,就是uncor error可以设置为fatal 或者non-fatal,某几个uncor error发生这种错误时候不想引起host 宕机,默认初始设置为non-fatal error,这时候发生错误引起Advisory Non-fatal error置位;错误置位流程看spec fig 6-2(v、5.0r1.0)

        具体由哪些case,可以具体看spec 6.2.3.2.4 Advisory Non-Fatal Error Cases

1.2、trace分析

       

         分析一个简单的bad TLP ,根据流程图,需要检查的是框图触发error后需要set的寄存器,需要测试的是条件里面能够RW的寄存器; 

 如上图所示,发生Bad TLP错误后(LCRC出错),检测到错误的设备会向rc 发送message(看spec Figure 6-3),后续device status 中相关bit会置位,检查AER status也会置位;对于uncorrectable error,也要检查一下header log(后续再学)

撒花,

PCI】PCIe高级错误上报能力AER(十二)
zz2633105的博客
05-27 4631
本文参考PCIe协议 5.0:https://download.csdn.net/download/zz2633105/89204842本文参考intel IP用户指南:https://www.intel.cn/content/www/cn/zh/docs/programmable/683501/23-2-10-0-0/debugging-data-transfer-and-performance-25123.html。
PCIe AER (二)
weixin_37160065的博客
05-08 1205
uncorrectable error 1/2
PCIe扫盲——高级错误报告AER(二)
zsmcdut的博客
09-08 2925
转:http://blog.chinaaet.com/justlxy/p/5100057839 这一篇文章讲一讲,高级错误报告(Advanced Error Reporting,AER)关于可校正和不可校正错误的相关寄存器,以及Root如何处理来自其他PCIe设备的错误消息等内容。 Ø  高级可校正错误处理(Advanced Correctable Error Handling) o &nb
PCI AER and linux implementation
05-12
pci aer and linux implementation.
PCIe AER的驱动
lsy673908720的博客
06-02 1557
不同的内核版本对PCIeAER机制有微妙的差别,本次研究基于linux内核版本:4.9.190。 驱动文件的目录:[drivers\pci\pcie\aer]、[drivers\pci\pcie]。 PCIe AER的内核模块初始化的位置在[aerdrv.c]。 驱动初始化入口:device_initcall(aer_service_init); 在aer_service_init里首先要判断能否注册aer驱动。 在pci_aer_available-> pci_msi_enabled检查msi中
PCIE AER Linux 驱动详解
这个地瓜真是甜啊
10-28 4296
PCIE AER 错误上报处理驱动解析
PCIeAER linux 驱动浅析
Lenz_s_law的开发记录本
03-06 5690
AER及linux内核驱动简介:https://blog.csdn.net/u010443710/article/details/104649179 1. AER 中断 首先AER驱动作为错误上报和处理的机制,肯定有一个错误上报的入口。 这个入口就是AER中断。linux的AER驱动只针对RC,也就是说软件需要处理RC的AER中断请求。 并在中断处理函数中通过AER 寄存器来判断错误类型并...
2021, Dec日志-关于PCIeAER
12-11 2829
PCIe定义了很多的Cap. 但大多数人只用到了其中一些最常用的,比如MSI/MSIX, PMC, ARI, PCI express, PASID等等 还有很多Cap, 没有深入了解的实践机会, 比如LTR, OBFF, TPH, 等等,等等,非常之多。 另外一些Cap,比如AER, DPE/eDPC, ACS, ATS, SRIOV有一点点了解。 ATS, PASID可以看成TA(translation agent), ATPT(address trans and protection t..
pcie-aer 使用说明,中文版本
08-28
PCI Express (PCIe) Advanced Error Reporting (AER) 驱动程序是针对PCIe设备设计的一种机制,用于处理和报告PCIe链路上发生的错误。该驱动程序是PCIe生态系统中的一个重要组成部分,确保系统能够识别并响应不同类型...
PCIE那些事之AER高级信息上报
xwb1040885790的博客
05-09 4126
本文总结了AER错误处理流程 什么是AER AER 英文简称 Advanced Error Reporting 翻译中文是高级错误报告,是PCIE异常信息处理机制,用于报告PCIe 错误信息 错误信息主要分为两种 Correctable Errors 和Uncorrectable errors 其中 Correctable Errors包含非致命的错误和致命的错误 a.ERR_FATAL:致命错误,此错误类型影响了PCIe link链路。 b.ERR_NONFATAL:指影响了设备功能,但是PCIe
pcie aer寄存器
09-26
pcie aer寄存器是PCI Express Advanced Error Reporting (AER)的寄存器,用于报告PCIe设备的错误和异常情况。AER功能允许系统在PCIe设备发生错误时,能够及时地检测、报告和处理这些错误,提高系统的可靠性和稳定性...
pcie aer寄存器怎么关
最新发布
07-05
PCI Express (PCIe) Advanced Error Reporting (AER) 是一种扩展,用于检测和报告 PCIe 总线级别的错误。如果你想关闭 AER 功能,通常是在硬件或BIOS设置中管理这些选项,因为这涉及到系统底层配置。 步骤可能包括...
PCIe的capability扩展空间】AER
smartvxworks的博客
03-25 336
下面是PCIe设备端错误记录和报告的详细流程图。
PCIEAER和DPC解释
逆风水手的博客
08-09 5326
AER(Advanced Error Reporting)和 DPC(Downstream Port Containment)是PCIe(Peripheral Component Interconnect Express)总线规范中定义的两种不同的错误处理机制,它们在PCIe架构中有一定的关联。
PCIE AER Linux 驱动详解 - ERR EXCEPTION
生活需要深度
03-17 2460
因为硬件可以纠正可纠正的错误无需任何软件干预,如果有发生时,在 PCI Express 根端口收到的消息变为错误类型和代理 ID, PCI Express AER 驱动程序首先解码此错误。为避免与 BIOS 冲突,同时处理 PCI Express 错误,PCI Express AER驱动程序必须请求 BIOS 以获得 PCI 的所有权,通过 ACPI _OSC 方法,在 PCI Express 规范和 ACPI 规范中描述的。虽然硬件有能力纠正和减少可纠正的错误,但是可纠正的错误可能对系统有性能的影响。
PCIe扫盲——高级错误报告AER(一)
zsmcdut的博客
09-08 4750
转:http://blog.chinaaet.com/justlxy/p/5100057838 前面的文章提到过高级错误报告(Advanced Error Reporting,AER),接下来详细地介绍一下这一功能。在已有的PCIe错误报告机制上(之前文章介绍的),AER还支持以下特性: ·         在登记实际发生的错误类型时
PCIe学习笔记(2)错误处理和AER/DPC功能
PoPo's Blog
02-19 3644
处理器上错误通常可分为detected和undetected error。Undetected errors可能变得良性(benign),也可能导致系统故障如silent data corruptions (SDC)。Detected errors则又可分为correctable errors (CE) 和uncorrectable errors (UCE)。PCIe定义了两种错误报告范式:基线功能和高级错误报告功能(AER)。本文介绍PCIe错误定义及AER/DPC功能。
PCIe 错误检测和处理
奔跑的蜗牛的博客
07-14 8597
规范使用了四个关于错误的通用术语,定义如下:1.——确定存在错误的过程。错误是由代理发现的,这是由于本地问题,例如接收到坏数据包,或者因为它从另一个设备接收到了发出错误信号的数据包(如中毒数据包)。2.-根据检测到的错误在体系结构寄存器中设置适当的位,作为错误处理软件的辅助。3.—通知系统存在错误情况。这可以采取将错误消息传递到根复合体的形式,假设设备能够发送错误消息。反过来,当根收到错误消息时,它可以向系统发送中断。4.-一个代理通过发送错误消息通知另一个代理错误情况的过程,
写文章

热门文章

  • latex——小白学习经验 22658
  • CVPR 2018 paper ---object detection 7959
  • PCIe Configuration Space基础知识学习 7368
  • AD14.2中文画pcb板子的笔记 3480
  • 离线安装gcc 3052

分类专栏

  • 经验分享 4篇
  • 文献阅读 2篇
  • 阅读总结 2篇
  • 学习笔记 8篇

最新评论

  • PCIe Configuration Space基础知识学习

    awarenessxie: 写的很好,就是贴图怎么这么模糊,完全看不清。

  • AD14.2中文画pcb板子的笔记

    CSDN-Ada助手: 哇, 你的文章质量真不错,值得学习!不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性;(2)增加条理清晰的目录。

  • 【笔记】VAE学习加代码复现

    CSDN-Ada助手: 乌云背后永远是晴空万里!

  • PCIe AER(一)

    Amelie_yalili: 配置空间里的

  • PCIe AER(一)

    闻一鸣: Headerlog是tlp包里面的吗

大家在看

  • 使用 K-means 聚类进行图像压缩 557
  • SQL语句高级查询(适用于新手)
  • 【已解决】【Hadoop】 Shell命令易错点及解决方法 476
  • 【Linux 从基础到进阶】高负载系统的优化与维护
  • 什么是FPGA?| FPGA秋招必看基础 501

最新文章

  • float32转float16、snorm/sunorm8/16 学习及实现
  • Reed-Solomon纠错码——RS(255,251)学习及实现
  • PCIe AER (二)
2024年2篇
2023年4篇
2022年2篇
2021年1篇
2020年1篇
2019年1篇
2018年4篇

目录

目录

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家岑溪玻璃钢伟人像雕塑衢州玻璃钢雕塑批发云南哪里有玻璃钢景观雕塑长沙动物玻璃钢雕塑创作周年庆典商场美陈批发价广东景区玻璃钢雕塑哪家便宜厦门公园玻璃钢雕塑价格淮南学校玻璃钢雕塑价位六安玻璃钢雕塑商家玻璃钢雕塑开裂是什么原因内蒙古卡通玻璃钢动物鹿雕塑萍乡佛像玻璃钢雕塑唯品会商场美陈曲阳正规玻璃钢雕塑攀枝花迎宾玻璃钢卡通雕塑推荐玻璃钢雕塑武士马新郑铜玻璃钢人物雕塑奥体十一商场美陈保定优质玻璃钢雕塑询问报价江西玻璃钢人物雕塑玻璃钢卡通雕塑品牌零售玻璃钢花盆花器金华特色玻璃钢雕塑多少钱商场美陈圣诞节博野玻璃钢雕塑公司美陈玻璃钢雕塑报价表黄山室外玻璃钢雕塑余姚玻璃钢雕塑加工厂西安商场春季美陈玻璃钢雕塑裂缝香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化