姓名:朱碩雅
學(xué)號(hào):14020120008
轉(zhuǎn)載自http://mp.weixin.qq.com/s?__biz=MzAxNDAyMzc0Mg==&mid=2683460284&idx=1&sn=6938f8bafa9c33c71c1f4250696c4ace&scene=21#wechat_redirect
【嵌牛導(dǎo)讀】:公司里做項(xiàng)目,經(jīng)常遇到可靠性要求極高而成本不足的情況,因此要對(duì)其有一定了解。
【嵌牛鼻子】:可靠性,成本
【嵌牛提問(wèn)】:(1)可靠性與成本應(yīng)如何取舍?
(2)如何在不降低可靠性前提下盡可能降低成本?
【嵌牛正文】:
一些軍品標(biāo)準(zhǔn),會(huì)要求每臺(tái)設(shè)備都經(jīng)過(guò)篩選試驗(yàn):也就是說(shuō)每臺(tái)設(shè)備都經(jīng)過(guò)嚴(yán)格的測(cè)試,除了器件做早期的老練篩選。整機(jī)也做篩選試驗(yàn)和環(huán)境試驗(yàn)。而一些大規(guī)模發(fā)貨的設(shè)備:會(huì)在研發(fā)階段做HALT試驗(yàn),然后根據(jù)HALT試驗(yàn)的數(shù)據(jù)設(shè)計(jì)HASS試驗(yàn),對(duì)生產(chǎn)環(huán)節(jié)的設(shè)備進(jìn)行測(cè)試。HASS應(yīng)用于產(chǎn)品的生產(chǎn)階段,以確保所有在HALT中找到的改進(jìn)措施能夠得已實(shí)施。HASS還能夠確保不會(huì)由于生產(chǎn)工藝和元器件的改動(dòng)而引入新的缺陷。
但是一些沒(méi)有達(dá)到海量發(fā)貨的設(shè)備,在早期是沒(méi)有條件去做HASS試驗(yàn)的,所以其承諾的整機(jī)溫度范圍如果超過(guò)器件的溫度范圍,又是如何去保證質(zhì)量的呢?
首先,是通過(guò)HALT試驗(yàn)或者環(huán)境試驗(yàn)的數(shù)據(jù),通過(guò)足夠多的樣本數(shù),在大樣本數(shù)能夠達(dá)到測(cè)試條件的前提下,對(duì)實(shí)際場(chǎng)景能否滿足要求進(jìn)行折算和評(píng)估。但是這里面有概率性風(fēng)險(xiǎn):例如,我們一個(gè)產(chǎn)品在早期,沒(méi)有設(shè)計(jì)HASS試驗(yàn)的前提下,將設(shè)備安裝到西伯利亞的寒冷世界。當(dāng)時(shí)就發(fā)生一塊電路板啟動(dòng)失敗,反復(fù)重啟的情況。最后采取更換,故障單板返還的措施。甚至一些大廠,經(jīng)過(guò)大量測(cè)試驗(yàn)證,0~70℃的DDR可以用于更低的溫度,而認(rèn)為高溫有風(fēng)險(xiǎn),需要對(duì)高溫規(guī)格進(jìn)行降額。(不建議小廠這么做,因?yàn)闆](méi)有足夠的資源進(jìn)行試驗(yàn)和驗(yàn)證;沒(méi)有足夠資源進(jìn)行單板大批量樣本驗(yàn)證,以及支持返還進(jìn)行根因分析。)
其次,一些器件規(guī)格不能滿足的場(chǎng)景,可以通過(guò)整機(jī)方案解決,例如換更高性能的風(fēng)扇、增加風(fēng)扇、液冷、加熱器等等措施,可以彌補(bǔ)器件本身溫度范圍不能滿足要求的情況。例如:曾經(jīng)在華為設(shè)計(jì)的一款I(lǐng)P Camera,號(hào)稱“窮兇極惡”(寬溫度范圍、寬電壓范圍、高規(guī)格防雷),為了實(shí)現(xiàn)無(wú)故障超低溫啟動(dòng),原本設(shè)計(jì)的時(shí)候,預(yù)留一些加熱器、或者一些加熱電阻,同時(shí)修改IPC的啟動(dòng)策略,由紅外燈先工作一段時(shí)間,再啟動(dòng)CPU工作,保證工作溫度沒(méi)沒(méi)那么惡劣,是可接受的范圍。
可靠性是一系列方法的整合
可靠性整合是指無(wú)縫地、緊密地把不同可靠性方法融合在一起,從而以最小成本得到最佳可靠性。也就是說(shuō),可靠性方案是幾種方法協(xié)調(diào)使用的整體,而不是一堆無(wú)序的可靠性任務(wù)。
產(chǎn)品由各種部件和組件構(gòu)成。產(chǎn)品的可靠性在設(shè)計(jì)生產(chǎn)過(guò)程中,涉及到學(xué)科主要有:機(jī)械學(xué)、電子學(xué)、軟件、光學(xué)、化學(xué),所有這些學(xué)科組成了產(chǎn)品。因此應(yīng)該重視這些學(xué)科之間的關(guān)系,和總體的效果。我們?cè)O(shè)計(jì)的過(guò)程中也應(yīng)該是考慮更全面,而不僅僅是從某個(gè)部件的角度思考,或者僅僅從某個(gè)學(xué)科的維度去思考和解決問(wèn)題。
在結(jié)構(gòu)和硬件、 ?軟件和硬件方面尤為如此。在大多數(shù)公司里面,軟件可靠性和硬件可靠性是分別制定的,并沒(méi)有進(jìn)行整合。因此當(dāng)故障發(fā)生時(shí),同事間 往往只是相互指責(zé),而不是相互協(xié)調(diào)。
開(kāi)發(fā)部門(mén)往往都是從自己部門(mén)的學(xué)科出發(fā),去思考可靠性設(shè)計(jì);甚至更糟糕的是一些大公司從自己部門(mén)的利益和KPI去考慮設(shè)計(jì)。但是客戶要的是完整的產(chǎn)品、并希望產(chǎn)品是各個(gè)部件在一起能正常運(yùn)轉(zhuǎn)。因?yàn)榭煽啃灾饕煽蛻艉妥罱K用戶進(jìn)行衡量,產(chǎn)品開(kāi)發(fā)人員應(yīng)該從產(chǎn)品和部件兩個(gè)方面進(jìn)行綜合考慮,從而開(kāi)發(fā)出可靠的產(chǎn)品。
但是有些設(shè)計(jì)人員,擔(dān)心質(zhì)量事故、擔(dān)心考評(píng)的黑事件,設(shè)計(jì)的時(shí)候,做可靠性堆砌,不計(jì)成本的增加可靠性,過(guò)設(shè)計(jì)、過(guò)冗余、過(guò)度降額。這就需要:一方面,公司在可靠性和成本雙方面進(jìn)行引導(dǎo),同時(shí),需要設(shè)計(jì)人員能夠具備全面思考產(chǎn)品,能夠站在公司角度,站在客戶角度去思考和設(shè)計(jì)產(chǎn)品。
可靠性VS成本
可靠性設(shè)計(jì)可以減少保修成本、使用成本、可以提高客戶滿意度;同時(shí)可靠性設(shè)計(jì)也會(huì)造成開(kāi)發(fā)成本和生產(chǎn)成本。在生命周期的各個(gè)階段使用合適的方法,我們提高可靠性,到底要實(shí)現(xiàn)到什么程度呢?
在保證我們達(dá)到業(yè)界標(biāo)準(zhǔn)、交付標(biāo)準(zhǔn)、客戶需求等前提下,我們應(yīng)該是運(yùn)用可靠性設(shè)計(jì)實(shí)現(xiàn)生命周期的總成本(LCC ?Life-cycle Costing)的降到最低。
1、增加可靠性成本會(huì)增加產(chǎn)品的總成本。當(dāng)可靠性提升到一定高度,很難再進(jìn)一步提高時(shí),投資回報(bào)率變差。因此弄清楚可靠性目標(biāo)是什么很重要。產(chǎn)品的可靠性過(guò)高或者過(guò)低,其實(shí)都不好。產(chǎn)品可靠性過(guò)高通常會(huì)增加成本,客戶或許不需要這么高的可靠性,他們可能會(huì)選擇更便宜、或者相同價(jià)格,更時(shí)尚、更實(shí)用、更易用的產(chǎn)品。例如諾基亞手機(jī)摔不爛,但是賣不掉,就是個(gè)令人悲哀的故事。
2、可靠性下降時(shí),維保的成本會(huì)增加。如果是終端產(chǎn)品考慮返修率,如果是大型設(shè)備甚至考慮差旅成本,維保的人力和時(shí)間成本。
3、軟件幾乎沒(méi)有生產(chǎn)成本。因此保修成本和經(jīng)費(fèi)幾乎全部用于硬件。如果提高軟件可靠性不能節(jié)約成本,那么我們?yōu)槭裁催€要提高軟件可靠性呢?
因?yàn)椋阂?、事?shí)正面,軟件故障率有可能是硬件的10倍甚至更多。客戶并不區(qū)分是軟件故障還是硬件故障。即支持在線升級(jí),任然會(huì)造成使用中斷、業(yè)務(wù)中斷等問(wèn)題。
二、軟件可靠性方案的好處不在于直接降低成本,而在于減少運(yùn)作安裝返工率、減小故障維修事件、減輕軟件人員維護(hù)工作量。同時(shí)提升客戶滿意度。
所以提高軟件可靠性,必定可以帶來(lái)成本的節(jié)約。
用板。