新聞中心

        EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > Linux編程時(shí)遇到Oops提示該如何排查?

        Linux編程時(shí)遇到Oops提示該如何排查?

        作者:ZLG致遠(yuǎn)電子 時(shí)間:2018-11-30 來源:電子產(chǎn)品世界 收藏

          用于表示函數(shù)的調(diào)用關(guān)系,通過這段信息我們可以知道,函數(shù)的整個(gè)執(zhí)行流程,知道它的函數(shù)調(diào)用關(guān)系,最后整理出來的函數(shù)執(zhí)行流程如下:

        本文引用地址:http://www.104case.com/article/201811/395128.htm

          


          從中我們看到了熟悉的init函數(shù)、probe函數(shù)、以及清楚probe函數(shù)下執(zhí)行的操作過程是到哪一步出錯(cuò)的。現(xiàn)在我們知道了代碼的執(zhí)行流程,出錯(cuò)的PC指針的位置,但還是看不到代碼,出錯(cuò)指針處我們只看到了一串?dāng)?shù)字,那么接下來我們就操作一下,把pc指針的數(shù)據(jù)變?yōu)橛幸饬x的代碼。

          第一步,分辨出錯(cuò)誤代碼在什么位置

          這次實(shí)驗(yàn)涉及的二進(jìn)制文件有內(nèi)核的燒錄固件以及驅(qū)動(dòng)的ko文件,所以第一步分析就需要確定出錯(cuò)代碼是在內(nèi)核固件里還是ko文件里。

          首先得到內(nèi)核代碼的范圍,用以下命令將內(nèi)核反匯編。

          


          查看這個(gè)文件的格式如是:

          


          第一列行數(shù),第二列運(yùn)行地址,第三列二進(jìn)制碼,第四列匯編代碼,既然第二列為運(yùn)行地址,即等同于程序運(yùn)行到這行時(shí),pc指針的值等于這個(gè)數(shù)值。這樣只要翻看這個(gè)文件的頭部以及尾部,就能知道內(nèi)核代碼的PC指針范圍為:c0008000~c0562338。

          根據(jù)前面第5步寄存器值,出錯(cuò)時(shí)PC指針為c02f1878,即在內(nèi)核源碼范圍內(nèi)。

          第二步,分析出錯(cuò)函數(shù)的出錯(cuò)語句

          那么根據(jù)第3步PC指針,得到regulator_set_current_limit的匯編代碼,如下:

          


          函數(shù)入口地址為c02f186c。

          在第3步PC指針指出偏移地址為“PC is at regulator_set_current_limit+0xc”。

          PC = 0xc02f1878 = 0xc02f186c + 0xc,符合匯編代碼地址。

          第三步,找到出錯(cuò)函數(shù)的C語言代碼

          這步可以說是最困難的,因?yàn)閮?nèi)核代碼層次多,同名函數(shù)也可能存在許多份,可能幾份編譯進(jìn)內(nèi)核(static聲明的局部函數(shù)),也可能沒編譯進(jìn)內(nèi)核,如何從眾多的代碼中分析出具體哪段呢。

          本人就使用了一些小手段,首先給每個(gè)同名函數(shù)的入口加段亂碼,讓編譯器篩選出編譯進(jìn)內(nèi)核的文件(因?yàn)閬y碼,所以編譯會(huì)報(bào)錯(cuò)),然后給剩下的函數(shù)加打印語句,通常經(jīng)過第一步之后,可選的目標(biāo)就兩三個(gè),通過打印進(jìn)一步確認(rèn)代碼即可。

          以下為篩選出來的C語言代碼。

          


          看到這好像是定位了函數(shù),但對(duì)于不熟悉匯編的人來說,C與匯編還是沒有關(guān)聯(lián)起來,好像進(jìn)入了死胡同,但先別氣餒,從上面的匯編代碼中我們知道,函數(shù)名即為函數(shù)的首地址,那么調(diào)用子函數(shù)即需要讓CPU知道子函數(shù)名,那么匯編如何調(diào)用子函數(shù)呢?使用bl指令, bl+子函數(shù)名。既然匯編有這么一個(gè)特性,那么我們看匯編代碼。

          上面582734行為“bl c0493104”這句調(diào)用了子函數(shù),再看C中調(diào)用此函數(shù)的語句。

          


          那么結(jié)果顯而易見,不可能定義個(gè)變量都報(bào)錯(cuò)吧,所以唯一可能錯(cuò)誤的語句就是struct regulator_dev *rdev = regulator->rdev,同理,這句的前半部也只是定義一個(gè)rdev的變量,再結(jié)合內(nèi)核給出來的提示——空指針,所以錯(cuò)誤就是regulator->rdev是一個(gè)空指針。

          最終的問題就歸結(jié)于,為什么regulatar->rdev為空指針。這部分的查閱代碼以及推理需要更深層次地挖掘,工作量也非本文能說清的,故作者在這里就大膽地推測(cè)與上面的A->B->C模型類似。所以我們就需要在這個(gè)資源存在的時(shí)刻,調(diào)用它之前給它賦值。

          這時(shí)侯,我們就需要拿出第8步函數(shù)執(zhí)行的回溯關(guān)系圖,既然知道這個(gè)圖中最后的函數(shù)的輸入?yún)?shù)regulator的rdev為空,那么我們就關(guān)心regulator結(jié)構(gòu)體以及它的意義。從結(jié)構(gòu)體的意義我們才能知道如何給它賦值。

          


          在相關(guān)的代碼文件中搜索關(guān)鍵字”regulator”或”regulator =”(建議搜這個(gè),因?yàn)檫@種才是賦值語句)得到如下代碼。

          


          分析這個(gè)函數(shù)可知,regulator實(shí)際是pdata的一個(gè)成員,他需要data來初始化,那么接下來的事情就簡(jiǎn)單了,在回溯關(guān)系中找一個(gè)位置把data的數(shù)據(jù)塞入pdata中,剛好這段函數(shù)就是初始化的regulator的,那就直接拿去用吧。

          把這段添加到probe函數(shù)內(nèi)的這個(gè)位置,實(shí)現(xiàn)了在mxsbl_probe和mxsbl_do_probe之間賦值此變量。

          


          這樣重新編譯后即可正常加載ko文件。


        上一頁 1 2 下一頁

        關(guān)鍵詞: Linux Oops

        評(píng)論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 洮南市| 拉萨市| 黎城县| 商水县| 长汀县| 彭州市| 志丹县| 酉阳| 黑山县| 乌兰浩特市| 扎赉特旗| 南岸区| 荆门市| 祁东县| 海宁市| 平潭县| 方山县| 观塘区| 雷波县| 安阳县| 江源县| 西贡区| 常宁市| 大宁县| 定结县| 扎鲁特旗| 克拉玛依市| 白玉县| 襄垣县| 广饶县| 曲麻莱县| 广州市| 皋兰县| 蒙阴县| 小金县| 奇台县| 宁武县| 新巴尔虎左旗| 广宁县| 昆明市| 临猗县|