新聞中心

        EEPW首頁 > 嵌入式系統 > 設計應用 > 板載故障記錄原理解析

        板載故障記錄原理解析

        作者: 時間:2011-02-15 來源:網絡 收藏

        OBFL基線記錄的創建獨立于任何電路板故障。OBFL系統應一直保持一個初始基線記錄和至少一個近期基線記錄。在完成對OBFL的系統現場配置、首次成功將電路板件投入使用之后,就會立即生成初始基線。首次創建近期基線記錄的時候,將使用初始基線記錄。創建近期基線記錄的目的,是為了獲取OBFL資源的近期值。隨后每次成功的電路板復位都會創建后續的基線。OBFL還會要求提供存檔的舊基線。任何穩定的基線都會被標注為“優良”基線,并在故障排查過程中用作參考基線。如果沒有優良基線記錄,初級基線記錄將用作參考基線。

        基線記錄將獲取特定的軟硬件配置詳情,并存儲在非易失性存儲器中。基線記錄的硬件部分包括電路板配置數據詳情,如機架編號、電路板件的插槽號、序列號、子卡標識詳情、FPGA和ASIC修訂號等。該部分還應該存儲諸如SRAM/SDRAM/DDR這樣的板載存儲器類型、序列號和配置詳細信息。BIOS版本、固件版本、OS詳情和應用軟件版本應存儲在軟件基線記錄下。該記錄在縮小由近期軟硬件升級造成的電路板故障范圍時非常有用。

        基線記錄的第三部分存儲電路板環境變量值。任一存儲的電路板環境變量都存放有近期的“N”個值,最大實際值和電路板環境變量的最低允許值。環境變量包括電路板電源部分參數,如電壓、電流以及來自電路板上一個或者多個感應器的溫度讀數。

        電路板環境變量的值定期采集、存儲為近期值,并同最大允許值進行比較。如果采集的值大于最大允許值,將采用當前的時間戳更新環境錯誤事件(Environment Error Event)記錄。此外,電路板一般有多個電壓源和溫度感應器。溫度應定期記錄(比如每隔30分鐘),而電壓數據可以不需這么頻繁(比如每隔60分鐘)。

        事件記錄

        OBFL事件記錄負責存儲由板載存儲器故障、系統復位、意外事件、中斷錯誤或者電路板環境錯誤導致的硬件故障事件跡象(如電路板崩潰)。OBFL事件記錄可以分為下列幾類:

        存儲錯誤:通常,SDRAM或者DDR錯誤分為可糾正的錯誤和不可糾正的致命錯誤兩種。可糾正錯誤可以通過存儲器中的其他硬件邏輯來查找并糾正單比特ECC錯誤來加以糾正。雖然這種錯誤不具有致命性,但它會給系統性能造成一定影響,因此記錄這種事件有助于排除系統性能錯誤。此外,記錄可糾正錯誤還可以就將來可能出現的致命錯誤提出告警。對于屬于不可糾正致命錯誤的多比特存儲錯誤,在事件日志中應該登記錯誤地址位置、預計數據和其他存儲詳細信息。

        linux操作系統文章專題:linux操作系統詳解(linux不再難懂)


        評論


        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 忻州市| 沙坪坝区| 香河县| 睢宁县| 奉节县| 双鸭山市| 兴隆县| 安庆市| 韶山市| 拉萨市| 鄂托克前旗| 江川县| 攀枝花市| 江油市| 龙州县| 东乡县| 杭锦后旗| 深州市| 会东县| 灵川县| 濉溪县| 尼勒克县| 凭祥市| 徐州市| 南康市| 赤峰市| 墨脱县| 定南县| 清镇市| 察哈| 松阳县| 独山县| 新晃| 新昌县| 青川县| 南华县| 贡觉县| 东乡| 偏关县| 扎鲁特旗| 永丰县|