美國時間1月27日,特斯拉發佈新一代Model S,其最大改動就是方向盤和車機。其背後晶片層面的改動更大,馬斯克更誇下海口,這款車機可以打2020年的超大型遊戲Cyperbank 2077。這款車機不僅打敗任何車機,並且恐怕10年內都是宇宙最強車機。讓我們來一探究竟。
新車機改為17英寸豎屏,解析度2200*1300。
後排中間還有一個8英寸小屏,解析度估計是960*540。
上圖是特斯拉車機的GPU部分,特斯拉又一次無視車規,使用了消費級產品。不過在供電電路上,特斯拉還是考慮到了汽車的複雜情況。特斯拉使用了AMD的Navi 23 GPU,其供電電路異常複雜。
LM74810是德州儀器的車載保護晶片,是德州儀器剛剛在2020年初推出的晶片,主要用在電動車車機供電保護中,特斯拉是儘量用先進的晶片。而目前業內是使用濾波和電源調節的方案,特斯拉的可以提供額外的過流保護,集成度也更高。
LM74810-Q1 利用過壓可調節特性,可在不需要的負載突降事件中提供保護。如圖 所示,LM74810-Q1 的 OV 引腳可使用比較器發送出現過壓事件的信號。這會斷開用於驅動 Q2 金屬氧化物半導體場效應電晶體(MOSFET)的 HGATE 電壓。額定電壓較低的下游元件沒有輸入端發生瞬變時所需的電壓范圍,而將連接至 OV 引腳的電阻分壓器調整至您所需的閾值,則可以使用此類下游元件。LM74810-Q1 器件的額定輸入電壓最大為 65V,可在發生 35V 峰值電壓的瞬態事件時繼續工作。LM74810-Q1,連同適當的 MOSFET 和輸入端瞬態電壓抑制器(TVS),可在發生 ISO 7637-2 測試脈衝 1 等高負電壓瞬變時為系統提供保護。如果輸入電壓為負,則 LM74810-Q1 關斷並將 DGATE 拉低。然後,圖 中 Q1 的二極體為系統提供反向電壓保護,並防止產生負電流。一旦輸入電壓恢復標稱值,LM74810-Q1 則重新導通,並使 MOSFET 正常工作。LM74810-Q1 具有浪湧電流限制功能,可在啟動期間控制電流大小。輸出端電容會限制電流,從而確保元件內不會流經超出安全工作范圍內的電流。還可以提供過流保護和低壓瞬態保護。千顆起售價1美元。
LT8638s是ADI公司的40V降壓開關,是2019年3季度的產品,也算比較新,特點是噪音特別低,EMI幹擾很低,ADI稱之為Silent Switcher Monolithic Buck。再向上是德州儀器的LP87522,這是一個4相的電源管理IC,千顆起售價2美元。負載開關還是德州儀器的,型號是TPS22965,只有0。3美元。LDO即線性穩壓器是安森美的,型號NCV8710,這本來是做車內氛圍燈上的。ADS1015是德州儀器的4路ADC,負責監視電壓和電流變化,特斯拉在供電方面還是照標準車規來做。
記憶體方面是三星的K4ZAF325XM,這是昂貴的GDDR6記憶體,估計有有4個模組,這意味著總共8GB的記憶體。根據該圖,該記憶體為14 Gbps,並連接到128位元記憶體匯流排。這將提供最大的224 GB / s的頻寬,類似於Xbox SeriesS。
TMP451是德州儀器的溫度感測器,監測Navi 23的溫度。晶振是SiTime的SIT8924,提供寬溫度范圍的100MHz晶振。
視頻輸出有3路,兩路DisplayPort,其中一路為High Bit Rate 2(HBR2),支援4K(4096X2160)60Hz,一路為一代HBR,足以支持2K/60P。一路HDMI 1。4。
最後來看今天的主角Navi 23。先來說那個恐怖的算力,在FP32情況下,可以達到10TFLOPS,這與一般的AI加速器的算力是有差異的,AI加速器只做MAC乘和累加運算,分訓練和推理兩大類,訓練用在資料中心,推理用在終端產品,我們平時見到的絕大多數都是推理用的。
FP32的資料格式有兩個用途,一個是做深度學習訓練用,精度和動態范圍很高。再有一個是做圖形浮點運算,兩者實際差不多,都是大規模並行運算。推理領域考慮到成本,沒必要用那麼高的,INT8是整數8位元,推理領域默認的算力數值都是INT8位下取得的,FP32是浮點有小數的32位。整數運算的單位是OPS,浮點運算是Flops。FP32的算力可以至少折算4倍的INT8。通常處理器中針對FP32和INT8是兩個不同的運算單元,如英偉達的Xavier,AI算力是30TOPS INT8,GPU算力是1。3TFLOPS FP32。高通最頂級的Snapdragon的GPU是1。84TFLOPS。Navi 23是專用顯卡晶片,足以比美英偉達的RTX2080,自然算力很高,達到了10TFLOPS,如果做推理至少有40TOPS。這麼強的算力自然也有缺點,那就是高功耗,索尼PS5的功耗210瓦左右,電源功耗350瓦,外媒Eurogamer以及旗下數毛社對PS5、PS4 Pro、2070s、2080s等硬體的功耗進行了對比,測試顯示,PS5待機功耗為1。5W,閒置下載遊戲時PS5功耗為36W,在運行《古墓麗影:崛起》時PS5功耗為107W,峰值200W。特斯拉用做車機,無論怎麼降低功耗,在打遊戲時整機平均功耗不會低於100瓦,單GPU部分的功耗估計是80瓦或更高。跟桌上型電腦功率差不多。
RDNA2最強的地方在於Infinity Cache,它位於AMD Navi GPU內主要的計算核心集群的旁邊,本質上是一個小型而有效的記憶體存儲。它位於較小的L1和L2快取記憶體之間,嵌入GPU本身。AMD Infinity Cache 充當著海量頻寬放大器的角色,實現的有效頻寬最高可達 256 位 16 Gbps GDDR6 的 3。25 倍。使用 Infinity Cache+ 256bit GDDR6 顯存的方案相比傳統的 384bit GDDR6 顯存頻寬翻倍,而且功耗還更低。通常L2緩存的容量都很小,一般不超過1MB,而Infinity Cache 有128MB。
一般車機CPU的功率是多少呢?特斯拉Model 3上的是英特爾的A3950,TDP功耗大約9。5瓦,用在寶馬頂配車機上的A3960是12。5瓦。。這裡需要對晶片功耗做一些解釋,通常晶片的功耗是TDP,這是英特爾發明的詞,TDP的英文全稱是「Thermal Design Power」,也就是熱設計功耗,簡稱熱功耗。顧名思義,它用來標識CPU或者GPU被設計成需要被排出多少熱量才能保證讓其穩定工作在標稱頻率上。誠然功耗和需要耗散的熱量是正相關的,但兩者並不是相等關係。電流和電壓隨著運算量不同而起伏不定,功耗P也隨之變化,但總的來說暫態功耗是大於需要散熱器排除的熱量的。這是因為功耗除了提高溫度需要散熱器降溫外還產生了熱輻射等其他耗散。絕大部分汽車晶片功耗都用TDP標準,一般來說車機晶片TDP功耗不高於15瓦,一般都在10瓦以下。
但是在GPU領域,完全不用TDP這個標準,通常是TBP、GCP或TGP,TBP,也就是Typical Board Power,典型整板功耗,通常在顯卡上使用,其標稱了整塊板卡(顯卡的話就是GPU+顯存+其他附件)的功耗,更具有參考價值。GCP(Grpahics Card Power)也叫顯卡功率。TGP,Total Graphics Power,與TBP基本沒差別。AMD沒有公佈NAVI 23的TBP或TDP,實際NAVI23的任何資料都沒公佈。根據VIDECOCARDZ的資料,AMD NAVI23的TGP設計目標是65-90瓦,單NAVI23的TDP功耗估計在70-80瓦左右。
只有特斯拉這樣近乎瘋狂的廠家才會用高於大部分車機晶片8倍功耗的設計,即便新興造車也沒人敢這麼瘋狂,這種設計不僅可靠性很低,也比較耗電。特斯拉恐怕10年內都保持領先。
特斯拉至少得為這GPU準備三個風扇,或者用水冷,當然了,特斯拉或許藝高人膽大,上一代Model s頻繁黑屏死機,是因為節約成本用了消費級得EMMC,OTA次數太多,刷爆了。不過特斯拉的粉絲絲毫不在意。
很多人會說,特斯拉的設計師肯定考慮到了這麼高的功耗。
特斯拉一貫不走尋常路,特斯拉的設想可能是讓你停車狀態下打遊戲,馬斯克號稱其車機可以達Cyberpunk 2077,莫說車機,99%的桌上型電腦都無法流暢打這款遊戲。馬斯克是要宇宙最強的稱號,其他的都可以緩一緩。
下表是Cyberpunk 2077推薦電腦配置。
最低級別都需要英偉達GTX1060顯卡,要流暢的2K屏顯示,需要RTX2060或AMD的RX 5600。
至於CPU,無從知曉,與NAVI 23配合最好的自然還是AMD的Zen2。因此推測用的就是Zen2,如果用了傳統的車機晶片,恐怕很難和NAVI23配合好,研發週期會很長,NAVI23最早也得在2020年1月定版,這麼短的時間用在量產車上,恐怕只有Zen2做CPU才能做到,並且有PS5和Xbox的經驗,也能縮短時間。對AMD和台積電這都是利好,AMD壟斷了三大遊戲機的晶片,晶片代工又由台積電獨家掌握。