如何利用芯片數據提高生產力?
半導體生態系統正爭先恐后地更有效地使用數據,以提高設計團隊的生產力、提高晶圓廠的產量,并最終提高現場系統的可靠性。
本文引用地址:http://www.104case.com/article/202302/443795.htm數據收集、分析和利用是所有這些工作以及更多工作的核心。可以在從設計到制造流程中的每個點收集數據并進入現場,并且可以將其循環回當前和未來的設計中以防止代價高昂的故障,或者向前推進以防止軟件和硬件之間不必要的交互。
「當我們查看現場數據以及新代工廠/晶圓廠啟動過程中發生的事情時,我們已經看到他們如何在每個芯片上創建大量數據以確定如何提高產量」, Cadence 數字與簽核集團產品管理副總裁 Kam Kittrell 說。「這一直是一個大數據問題,其中涉及很多深奧的事情——如何提高產量和可制造性設計。它正在獲取大數據,對其進行分析,研究如何調整正在發生的事情,以便在未來獲得更好的收益。這正是流程節點開發。但現在它向下游走得越來越遠,因為我們希望能夠進行系統級測試,因為超大規模公司正在將非常復雜的云系統與數千臺計算機放在一起,并使用這些完全相同的計算機構建數千個站點。」
讓系統、軟件和硬件的組合協同工作是一個巨大的挑戰,從測試芯片收集現場數據并將其反饋到設計到制造流程中可以顯著提高生產芯片和系統的產量。「如果他們了解了有關芯片的一些信息,他們就可以在下游進行測試,看看是否會立即出現故障,」Kittrell 說。「你不想在云中處理客戶的有效載荷,然后看到它失敗了,然后你發現了一些你可以從芯片測試中知道的東西。」
其他人同意。「這里正在發生的大趨勢是產品的復雜性,」是德科技新市場高級經理兼數字孿生項目經理 Chris Mueth 說。「這是最大的驅動力。你可以說有一些監管標準和小型化正在進行,但這實際上都是關于復雜性的,而且它只會變得越來越糟,因為消費者想要更多的功能在他們的手中。開發人員將繼續向產品中添加越來越多的功能。」
想想 15 年前的 2.5G 移動芯片。「手機中的 PA 芯片可能有 100 項要求,」Mueth 說。「現在它是一款多功能 5G 芯片,可以滿足 2000 項要求。它可能有多個波段。它必須在多種電壓下以多種工作模式運行,并且所有這些都必須進行管理和驗證。我們聽說過芯片制造商錯過驗證需求的故事,只有在它已經在手機芯片中時才發現它。」
而這只是故事的一部分。所有這些都需要在可能影響整個系統的變化的背景下進行查看,因此需要端到端地收集和分析數據。
英飛凌軟件和生態系統副總裁 Rob Conant 表示:如果你是一家生產聯網設備的傳統公司,你會進行用戶研究和焦點小組討論的連接安全系統業務部門。「你用它來告知你未來的產品方向。在物聯網領域,他們真的沒有全心全意地進入那個模型。這是對這些產品的事后補充。但是,其他產品的構建以連接性為核心。家庭安全系統就是一個很好的例子。它有一個非常具體的價值主張和一個非常具體的客戶,一個有形的客戶可交付成果。連通性是該可交付成果的核心。對于提供這些服務和解決方案的公司而言,重要的不是包裝在他們相機上的吸引力。這是關于他們能夠以多經濟和多有意義的方式提供特定的客戶價值,因此他們更加積極地使用數據來了解他們的產品如何運作,他們的客戶如何使用這些產品,以及這些產品如何與客戶價值聯系起來。這種客戶成功的想法在某種程度上存在于消費類硬件中。如果你把它深入到半導體公司本身,這個想法就會滲透到像 Infineon 和其他公司這樣的較低級別的組件供應商中,但它并不是本地的。它是我們銷售產品的附加組件。」
更好的自動化
有效地利用數據可以為設計團隊帶來豐厚的回報。設計復雜性增加與人才短缺之間的鴻溝越來越大,而數據是縮小這一差距的重要因素。
「任何 EDA 公司都會在設計和測試上花費大量時間,但由于正在發生的大趨勢,數據管理領域出現了一個新興領域來處理如何管理所有需求,」Mueth 說。「我怎么知道這些要求是否得到滿足?模擬或測試設備以確保其滿足要求的標準是什么?你有需求管理本身嗎?我如何知道芯片中的 IP 在我制造時是正確的 IP?我使用的工具和版本的可追溯性如何?當您進行驗證時,所有這些都很重要。正如你想象的那樣,我正在那里處理大量的數據。」
反過來,這些數據可用于改進仿真和驗證,并可縮短調試過程。
「在仿真領域,工程團隊正在執行三項主要任務,」 Imperas 首席執行官 Simon Davidmann 說。「一個是構建可以運行的軟件。他們試圖啟動并運行軟件,并擁有他們想要了解的某些數據。二是另一個極端,工程師們正在圍繞 RISC-V 進行驗證。然后是另一群正在尋求提高性能的人。所有這些人都需要不同類型的數據。」
但是工程團隊需要了解他們收集數據的目的以及他們需要什么類型的數據。
「這是'什么'和'為什么'。「怎么做」對于我們工程師來說顯然是必需的,因為例如在我們的建模方面,我們是速度很快,」Davidmann 說。「我們不想在模型中加入任何會減慢我們速度的東西。如果你想開始分析模型中發生的事情,它會減慢它的速度。所以我們非常關心人們想要什么數據,因為它會對性能產生影響。然后,當一個工程團隊想要添加數據分析時,從我們的角度來看,有幾種類型的數據是有用的。首先,他們必須確定他們想要將其用于什么用途以及他們想要的粒度。有些人正在嘗試調整軟件并需要非常具體的數據,例如逐周期數據。或者,如果有人試圖驗證某事,他們將需要與硬件事件等相關的完全不同的數據。一旦他們獲得了數據,就會有不同的抽象。例如,如果我們正在幫助工程團隊移植 Linux,他們不想查看 RTL 中的事件。他們甚至不想查看寄存器值。他們想看函數的抽象。或者,他們想查看操作系統中作業調度程序的抽象。這就是所有可以收集的數據。然后,他們可以對其進行分析,看看它的性能如何,或者他們探索了操作系統的哪些部分。」
確保設備滿足要求是一項巨大的挑戰,這就是為什么估計有三分之二(或更多)的芯片開發用于驗證。「這里的壓力有很多不同的方式,」Mueth 說。「其中一部分只是定義我需要的需求,并定義如何模擬或測試這些需求。然后,需要流程定義以及自動化構建,因為您可能不會手動完成所有這些工作。您想以自動化方式進行。然后你必須確定如何收集數據、減少數據并理解數據。」
更有效地利用數據
數據可能會因任務配置文件的不同而有很大差異,這對于汽車芯片而言與 5G 電話芯片大不相同,并且它可能會根據其在流程中的使用方式和位置而有所不同。
「今天我們問我們的客戶,'你是否了解你的個人資料的實際情況?' 答案或多或少是『不』,這與 HPC 的情況相同,」Synopsys 汽車硅生命周期解決方案產品經理 Pawini Mahajan 說。因此,我們試圖通過硅生命周期管理 (SLM) 做的是在架構級別的設計生命周期早期插入監視器,并在整個生產生命周期中收集數據,包括在斜坡階段、生產階段、制造階段。我們甚至可以在設備到達現場之前不斷收集數據。所有這些數據都是我們在整個生命周期中收集的,我們將這些數據作為反饋循環提供給設計工程師,以進一步改進下一代設計。但是我們對現場數據所做的工作也可以用于任務概況。例如,您可以監控任務概況,或老化和退化。所有這些數據都在收集和填充。
這些數據如何被分割和分析取決于它的用途。其中大部分是使用用戶為自己的目的創建的內部工具完成的。在某些情況下,數據不完整是因為數據收集受到合同義務的阻礙。
「這是一個非常破碎和脫節的區域,」馬哈詹說。「每家半導體公司、一級供應商或 OEM,取決于他們在生命周期中所處的位置,都有自己的解決方案。一些半導體公司可能擁有自己版本的過程、電壓和溫度監視器,用于從其芯片中收集數據。但是,一旦該芯片進入汽車,目前可能還沒有一種指標可以通過 OEM 的數據湖提取該數據,因為這些合同中不存在某些交互。」
在設計流程中,最重要的是提高生產力。數據很重要,但往往沒有得到應有的有效利用。
Synopsys DesignDash 產品經理 Mark Richards 表示:「隨著設計規模的不斷擴大,挑戰變得如此困難,以至于他們沒有時間進行他們想要進行的多輪優化。」 「這主要是關于在他們擁有的時間窗口內完成它,所以無論 PPA 是什么,無論他們最終采用何種治療方法,他們最終都會采用。隨著這些設計變得越來越大,迭代時間越來越長,他們試圖做的只是以某種方式提高生產力。數據是達到目的的一種手段,他們將采取目前可以找到的最佳手段來實現這一目標。」
如果收集和分析了正確的數據,它可以用來顯著改進優化。理查茲說:「如果我們能夠開始以一種他們可以有效吸收它的方式向用戶展示它,那將有助于推動并提高生產力。」 「我們如何利用所有這些引擎,使用引擎蓋下的方法能夠以比從日志文件中獲得的更細粒度的級別讀取引擎?然后我們可以開始合并該數據,并嘗試在其中找到模式。如果我們可以提取這些模式,我們就可以開始將它們視為因果關系、相關性或介于兩者之間。這有助于工程師更有效地完成工作,這正是他們最終想要達到的目標。」
一旦芯片制造并通過測試,它就可以用于硬件/軟件啟動。「假設硅質量好并且是已知的好芯片,你想(取決于應用程序)添加第一級軟件,例如軟件內核,然后對其進行測試,」高級主管 Vivek Chickermane 說。Siemens Digital Industries Software 的 Tessent 嵌入式分析研發.「然后你把它放在下一個層次上,這可能是操作系統微服務,然后是完整的操作系統,也許還會添加一些應用程序。您構建軟件堆棧,并在實驗室中進行盡可能多的測試。在那里,工程師們真的很想在現場部署之前識別和調試問題,他們緊緊關注幾個問題。例如,如果系統是單芯片,它可能會使用以前從未使用過且從未在硅片中得到驗證的 IP。您顯然想驗證這一點。下一個級別是添加內核或操作系統等。我們可能不確定其生態系統有多強大。編譯器、內核服務、微服務有多好?你想確保所有這些都運作良好。然后你想檢查軟件是否會按預期運行,
一旦設計團隊達到調試目標并且硬件/軟件協同設計被認為是好的,他們就可以從實驗室轉移到現場。這帶來了一系列完全不同的挑戰。
「該領域存在很多不確定性和不可預測性,因為您無法始終確保將要在該領域使用的所有軟件以前都曾嘗試過,」奇克曼說。「假設你買了一部手機,現在你要添加一個稍后開發的應用程序。芯片供應商尚未測試該應用程序。現在想象一下,這是一個很大的系統,里面有各種需求復雜的應用。這是一組完全不同的問題。在現場,挑戰是如何構建一個非常可靠和可預測的系統,尤其是當您有很多動態組件時?我如何從不太可靠和不太可預測的組件構建它?可靠性與設計不當的硅無關。就是硅還沒有被 100% 證明。您可能有 95% 的信心發布它。所以仍然存在不確定性,這在該領域受到了壓力。」
有效使用數據對于縮小差距至關重要,無論是涉及匯總數據還是監控數據。
「有了聚合數據,我可能想運行一個應用程序,看看有多少緩存未命中或發生了多少浮點運算,」他說。「省電模式是否啟動,啟動了多少次?該系統是根據該聚合數據設計的,因為許多指標(如電池壽命或 CPU 利用率)都依賴于它。該數據來自性能計數器。另一方面,監測數據更加全面。性能計數器提供聚合數據,而監視器提供時間敏感數據,因此有時間差。假設您決定每 100 微秒收集一次數據,因此每 100 微秒就是一個時間差。例如,我們的用戶想要所謂的指令跟蹤。他們想知道當時正在執行什么指令。如果它是總線監視器,那么它會查看總線上發生的事務。CPU 正在與內存通信嗎?是在和網絡對話嗎?是在和 I/O 對話嗎?」
數據的力量
擁有數據是一回事。以可以在設計中產生重大差異的方式應用它是一個巨大的飛躍,這會轉化為消費者的價值。
「如果你看看像 Apple 這樣的公司,他們擁有大量關于蜂窩連接的信息,」Infineon 的 Conant 說。「蜂窩連接在哪里工作?它在哪里不起作用?為什么它有效?為什么它在不同的地方不起作用?客戶如何使用該產品?功耗如何根據 MCU 的使用方式而變化?他們為該手機設計自己的核心或編寫自己的核心芯片組的能力在很大程度上取決于他們擁有的數據的豐富性,這些數據提供了對使用模型的洞察力。」
真正的價值來自于對不同用例的深入理解,以及利用數據為這些用例構建產品的能力。「如果你看看使用他們的芯片的手機的性能,那是非常好的,因為他們對使用模型有深刻的理解,」科南特說。「這些芯片的設計是由這些數據和對它的深刻理解驅動的。這是半導體公司需要追求的目標——深入了解其產品的使用模型。但今天,他們往往敬而遠之。」
評論