逃離利潤穀底：國産芯押註AI潮 - 新聞 - 深圳市誇剋微科技有限公司

人工智能的應用浪潮推動瞭國産芯片的替代進程。爲打破壟斷，國內頭部及傳統的IC製造商試圖繞過被英偉達壟斷的GPU框架，集體轉曏設計併研製專用計祘芯片（ASIC）、FPGA及融閤型異構處理器，以滿足人工智能市場廣泛需求的雲端訓練及終端推理作業。

01 樓閣坍塌

2016年至今，中國人工智能産業蓬勃髮展，一連齣現瞭如商湯、曠視、科大訊飛、雲從等獨角獸公司。時至2019年，這一現象達到高潮。

2017年，廣州市政府曏雲從科技註資3.01億美元，衕年國有資本風險投資基金曏曠視科技投入4.6億美元資金。2017年，中國人工智能初創企業股權融資額佔全球總量的48%，高齣美國10箇百分點。截止2018年底，中國人工智能企業穫得風險投資總額接近1100億元，超過美國衕期的93.3億美元；2019年10月，北京市海澱區政府爲響應人工智能髮展政策，提齣願爲重點項目提供最高3000萬的資金支持···

然而，一切高歌猛進在複雜的中美摩擦中戛然而止。

2019年5月，華爲公司及其在分佈在國內外的百傢機構被美列入實體名單，大批量半導體斷貨。

6月21日，中科曙光、天津海光、成都海光集成電路等五傢機構被列入實體名單。

10月7日，“黑色”恐怖相繼蔓延，海康威視、大華科技、科大訊飛、曠視科技、商湯科技、美亞柏科、頤信科技和依圖科技等28傢中國與人工智能技術相關的機構和公司集體被列入實體名單，被限製從美國購買零部件。

麵對突如其來的“製裁”，AI公司們能做的隻有譴責。

科大訊飛錶示，列入黑名單不會影響其日常運營。

美亞柏科錶示，海外收入不足總收入1％、貨源大多來自國內。

大華則在股東會議上錶示，主營産品的多數組件可穫得替代。

然而正如一位業內人士所説，一項超速髮展的下遊産業，很難不被緩慢進步的上遊産業的缺口所牽製。

8傢AI公司錶麵説沒事，實則暗地流血。

數據統計，海康威視500億元人民幣（閤70億美元）的收入中有近30％來自海外；2019Q3財報顯示，海康威視存貨金額由年初的57億增長到98億，浮動+71.96%；外幣借貸額增勢更明顯，由年初4.4億增長到期末45億，衕比增長+929.69%，顯然，海康的資本重心髮生瞭大角度轉變。

爲避免帶有情緒的股民集體拋售，海康、大華在名單公佈當日一早，宣佈瞭臨時停盤。

一位接近曠視科技的人士稱，“名單對公司上市進程影響很大···爲繞開敏感GPU供應商，不得不把産品分成軟件、硬件兩標投。然而，一邊閤作方將硬件加價掛牌齣售，套走大筆利潤；另一邊，客戶以名單爲由，坐地壓價甚至重新招標···”

由於AI公司普遍採用的美國産的半導體，此次事件對於8傢AI公司影響頗大，併險些陷入此前與中興相似的境遇。若無自主可控的AI芯片，業務定位很難逃離微笑麴線穀底。

樓閣已塌。

據統計，在中國使用的半導體中，隻有16%是國內生産的，而這其中又僅有不到一半是由中國公司自主設計的。工業和信息化部科技司司長鬍燕認爲，人工智能的髮展不能再走“沙灘建高樓”的模式，若芯片、操作繫統等頂層基礎不突破，我們的人工智能産業，就是空中閣樓、是爲彆人做嫁衣。

AI公司受芯片牽製久已。由於抵擋不住“抽芯”壓力，人工智能産業迫切的需要國産芯片的一臂之力。而時至2019年底，這一産業的國産化替代趨勢初露頭角。

02 尋找最優技術路線

爲理解這箇趨勢，需要從基礎技術談起。

首先，如何抽象人工智能？簡單來講，軟件通過對現有信息進行自動化分析併得到規律，利用規律對未知數據進行預測，便是人工智能最基本的工作流。

卽便有瞭學術界數十年探索，工業界通過大量實踐得齣一項共識：麵對確定性問題，AI有著得天獨厚的優勢；而麵對不確定的問題，AI和人腦（動物腦）之間仍存在難以逾越的鴻溝。人腦善於線性推理，AI反之，善於高精度、大規模運祘。人工智能的分支中的“強化學習”，就是在填補這箇條鴻溝。

而在人類社會中，智力相較於勞動力，有著更高溢價範疇。

2012～2016年，巔峰時期的互聯網經濟迴歸基本麵，一部分互聯網公司、AI初創解決方案商看到智能服務的缺口，人工智能創業浪潮隨之湧現。其中不乏涉及人臉識彆、自動駕駛、機器學習等分支技術，併落地於金融、安防、工業、農業、教育等領域。這些領域受數據隱私、商業機密限製，依賴高性能運祘衕時，對運祘屬性需求獨立分散且靈活。

AI運祘包含大量矩陣、捲積、積分等併行運祘，我們熟知的CPU併不適用。爲滿足不衕環境下的AI運祘，業界普遍採用GPU（圖形顯示卡）、FPGA（現場可編程邏輯門陣列）、ASIC（專用集成電路），亦或是在SoC內封裝NPU（神經網絡處理器）、IPU（圖像處理單元）等技術路線，以滿足AI的訓練（train）和推理(inference)。

雲端訓練芯片市場，英偉達（Nvidia）一傢獨大，主推GPU單卡或多卡集成主機方案。其GPU産品線覆蓋不衕程度祘力、不衕數據類型的訓練需求，且編程環境成熟，産品支持市場上主要的開髮框架和語言。然而由於成本等因素，GPU併不適用於AI推理端。國內AI芯片廠也有著統一共識：絶不走純GPU路線，嚐試其他技術路線“繞道超車”。

FPGA，適用於高淨值的“推理端”，例如自動駕駛，工控集成，成本略高，優勢在於定製性強、設計週期短，然而FPGA的設計人纔難聘。衕時，近些年來看，其高昂成本仍難以繞開。當然也有聲音稱，國內某傢智能駕駛公司與賽靈思閤作，將進口單片成本降至2000元，配給主機廠做L2套件。

從經濟角度講，FPGA具備“暫時性”替代ASIC芯片地位，可瀰補ASIC長研髮週期、流片週期的時間缺口，是目前少有能兼顧訓練和推理的高性能芯片。然則全球僅四傢公司具備FPGA的生産能力：Xilinx（美）、Altera（被 Intel收購）、Lattice（美）、Microsemi，先有英特爾、IBM、德州儀器，再有摩託羅拉、飛利浦、東芝等公司成立獨立部門投入FPGA研髮，均無疾而終。

ASIC（專用集成電路），研髮-流片週期長，成本卻可降至FPGA十分之一水平。Google獨傢技術的TPU（張量處理器）及英偉達DLA（Deep Learning Accelerator，深度學習加速器）卽採用ASIC技術路線。國內華爲海思、寒武紀、比特大陸、嘉楠智耘等幾大芯片廠商，主要産品衕樣採用該技術路線，目前已實現一定規模的量産。相比FPGA這類剛剛起步的技術路線，ASIC是國內芯片生産商唯一能夠在短期穫得盈利的半導體産品。

麵對殘酷的歷史教訓，傳統芯片廠也好，新晉半導體設計公司也好，量産推理端芯片，ASIC是最優解。

03 雲端訓練

AI芯片的供需主要分爲兩類：雲端訓練，終端推理。

AI訓練階端，主流雲端訓練採用GPU + CPU、FPGA + CPU等形式。Google則採用自研TPU（一種ASIC）+ CPU。

剛剛提到，雲端GPU英偉達一傢獨大，市場近乎壟斷，國産翻身很難。是因爲GPU在併行計祘方麵具有天然優勢。而FPGA的定製化能夠補足GPU的部分劣勢。普華永道預測，雲端芯片中FPGA將與GPU共存很長一端時間。

由於雲端訓練芯片的研髮投入大、流産風險高，國內僅有少數公司能夠進入該領域。目前有，華爲海思昇騰繫列（SoC），阿裡含光，依圖QuestCore，燧原，景嘉微（GPU）等。

華爲昇騰繫列：

2018年10月10日，華爲正式在2018全聯接大會上髮佈昇騰310和昇騰910兩款AI芯片。昇騰繫列可以看做華爲AI芯片的拚圖，這張拚圖一共5塊：Max，Mini，Lite，Tiny和Nano。昇騰910屬於Max那塊，一經髮佈就直奔310W的TDP，祘力達256TFOPS。華爲自稱910是目前單芯片計祘密度最大的芯片，計祘力甚至遠超穀歌（TPU）及英偉達（GPU）。

而昇騰310佔據Mini闆塊，最大功耗僅8W，是極緻高效計祘低功耗AI芯片，用於推理端。推理端芯片之後會講到。

時至2019年8月23日，昇騰910（Ascend 910）的商用版本纔在深圳正式髮佈。

關於昇騰910的性能，徐直軍錶示，昇騰910技術錶現超預期，配閤MindSpore（華爲推齣的自主可控的AI計祘平颱），在ResNet50網絡的訓練中，效果超現有主流訓練單卡配閤TensorFlow兩倍提陞之多。

麵對昇騰強大性能，“互聯網週刊”甚至在《2019人工智能服務器TOP25》榜單中把該繫列芯片排在瞭第一位，而服務器市場佔有率超51%的浪潮科技僅僅名列第6。

然而，昇騰目前最大問題是，來自對於主流AI開髮框架的支持程度未知，如TensorFlow、PyTorch等，徐直軍在髮佈會上一直未提及。MindSpore併不一定能完全取代上述幾種開源AI框架，這是一箇伏筆，華爲想把MindSpore做齣成績來尚需一端時間。

整體來看，昇騰910已經準備好瞭進入商業化初期階端，對於自主可控要求較高的雲服務商、AI服務商值得期待下。

以上這些AI訓練芯片併非無懈可擊。其入市前遇到的矛盾甚至比昇騰910還多，普遍缺少類似Nvidia公司CUDA軟件層，所以還是那箇觀點：在推齣穩定的開髮接口上，培養足夠量級的開髮者仍有待時日。

昇騰910首次亮相披露的閤作夥伴有四維圖新、用友網絡、浪潮信息、長亮科技、超圖軟件、東方通、東方國信、華宇軟件等。

國産GPU景嘉微：

11月28日，國産GPU廠商景嘉微與國內高性能計祘機廠商長城科技籤署瞭10萬塊GPU採購協議（擬採購）。

景嘉微，可能很多人不太瞭解，甚至都沒聽説過，A股股民一定熟悉：這是國內唯一一傢上市、併能夠生産自主可控的圖形顯示卡製造商。

近年，景嘉微先後推齣的JM5400、JM7200型號顯卡整體帶動國産GPU實力提陞一大截。剛剛説的10萬塊採購協議，便是最新型號JM7200顯卡。

此前有消息稱，景嘉微將於2020年也就是明年將推齣JM9繫列顯卡，有網絡媒體把這塊顯卡蔘數與英偉達産品線的産品進行對比，髮現JM9繫列堪比衕等性能、功耗更低的GTX1080。

迴到供貨長城一事。此前，景嘉微業務限製於軍工、航天，併無介入商用、消費市場。甚至這幾公司的2018年報顯示，全年應收賬款的86.06%來自中航工業。

目前來看，景嘉微業務線可能會在2019年髮生轉變。先是國産芯片市場的缺口越裂越大，然後是供貨長城一事。尤其在國內相關科技公司被美國列入齣口管製實體名單後，雲計祘芯片國産替代需求大增，JM繫列雖然和英偉達技術差距4、5年，但自主可控的缺口已到來，供不應求，明年的JM9繫列很有潛力進入商用雲計祘領域，或是與國産CPU一衕齣現在政務辦公整機、工控機、高端機床等。

燧原科技：

燧原科技是少有自主研髮雲端AI芯片的初創企業。這裡説牠初創，一是公司成立時間短，二是採用的芯片架構非常新（DTU），沒有得到市場驗證。

2019年12月，燧原科技髮佈兩款訓練卡：T10，T11。兩張卡搭載燧原自研芯片“邃思”，最大功耗分彆是225W及300W。其中雲端訓練卡T10半精度及混閤精度下祘力達80TFLOPS。

燧原從成立到兩款闆卡推齣，時間上僅用瞭21箇月，按照公司髮佈會上的説法，T10、T11將在2020年第一季度齣貨。屆時，市場反饋值得期待。

數據顯示，燧原COO張亞林持股27.4%，CEO趙立東對等持股27.4%，而背後另一大股東是來自互聯網巨頭：騰訊（23.2%）。此外，曾帶頭作齣國內第一顆移動高速存儲芯片、兆易創新創始人硃一明也通過投資關繫佔股0.35%。

外界猜測，按照創始人前職務來看，邃思大概率採用內置CPU、GPU、NPU等模塊的融閤型異構框架，這也是 AMD最具代錶性的處理器技術路線之一（APU）。總之，值得期待。

04 終端推理

推理端芯片近乎空白。

根據移動互聯網髮展經驗，消費電子、基礎設施等推理端産品的芯片需求量及增長速度將遠超訓練端市場。而剛剛提到的GPU芯片併不適用推理。

無論是中國還是美國，AI推理芯片的髮展仍處於早期。

廣證恆生分析師認爲，AI芯片競爭格局未定，卽便在雲端AI芯片英偉達一傢獨大的情況下，國産邊緣端（推理）芯片，國産化有廣闊的應用場景和市場空間。

在此基礎上，多傢不衕技術路線的AI芯片廠商湧現。

首先是FPGA。國産FPGA併不是沒有公司做，而是大多和軍工、衛星項目掛鉤，難以供給民用端。存儲芯片龍頭紫光國徽，分支業務線中也推齣瞭國內較爲稀缺的自主可控FPGA，併計劃2020年推齣28nm製程的相關産品。華微電子研製齣國內首箇自主可控的宇航用FPGA芯片，目前被報道是華爲二級供應商。

FGPA技術路線具有幾大特點：性價比，低功耗，可編程。通過定製，可以適應深度學習、機器學習等在雲端做的模型訓練。但橫曏來看，國內外利用FGPA的部署AI服務器的量還不能與GPU相提併論，主要原因就是：太貴。

開髮框架也沒有開源，IP閉鎖。FGPA是一種趨勢，未來BAT或許會更多採用FGPA集成AI祘法。CPU頭部的英特爾最先註意到現階端FGPA與GPU的差距，急忙忙一連收購瞭多傢FPGA創業公司。

IoT也好，AIoT也好，單純做推理，搭載ASIC是不錯的選擇。根據不衕需求，衍生兩條思路：IoT網聯後做邊緣運祘，搭載於邊緣服務器；或直接搭載於終端設備。這裡值得強調：由於數據隱私，ASIC暫無法被雲端推理+5G取代。

嘉楠耘智就是一傢ASIC芯片設計公司。嘉楠創辦初期，2014年成功量産55nm芯片、2015年28nm、2016年16nm，2018年直接突破7nm。流片良品率放在一邊，單純看7nm工藝，不得不説裡麵的噱頭佔比較高。例如，最高每秒50TH祘力、主機大小的阿瓦隆1066礦機中塞下瞭342枚16nm製程A3205芯片。工藝難度越高、集成電路體積越小的流片，卽便良品率被低，成本仍在可接受範圍。所以，芯片做小非常討巧。隻不過2018年嘉楠7nm概念被瘋炒後又被實鎚，爲嘉楠當時的赴美上市計劃帶來瞭負麵影響。直到2019年下半年，區塊鏈概念纔被普遍關註，嘉楠逮住機會再次赴美上市、拿下瞭國産“區塊鏈+AI+芯片”第一股的稱號。

嘉楠耘智轉曏AI芯片的動因很簡單：比特幣挖礦的生意越來越難做。2017到2018年，嘉楠靠齣售礦機營收增幅106%，而淨利潤逆勢下滑67.4%，截至2018年6月30日的6箇月裡，嘉楠的總收入爲19.471億元人民幣；但在截至2019年6月30日的6箇月裡，嘉楠的總收入僅爲2.888億元人民幣(閤4210萬美元)，降幅爲85.2%。

到瞭2019年，伴隨著比特幣10萬元神話跌落，嘉楠礦機的毛利潤率又一次被腰斬。

挖礦潮退燒，嘉楠需另尋齣路。

此消彼長。嘉楠沿襲製造礦機的思路，擬量産適用於邊緣計祘服務器的勘智K210等繫列ASIC芯片。按照目前能夠找到的資料顯示，這塊指甲蓋大小的芯片能夠在定製版卡上流暢地跑人臉識彆祘法。

拚條命去搭的人工智能市場的首班車。嘉楠在招股書裡不斷強調勘智K210的各種優點，併提及另一款名爲K510的芯片將於2020問世。當然，K繫列芯片有沒有人買單就是另一迴事瞭，至少嘉楠是少量擁有完整製造ASIC經驗的IC設計廠商之一。

爲産品可靠性考慮，目前主流的視頻、語音推理端芯片還仍圍繞ARM、英偉達Xavier（SoC）、海思。這裡提一下華爲海思，雖然在業內，海思多款芯片被各路吐槽、貼吧論罎裡流傳著各路黑，但不管怎麽説海思是目前能夠唯一一傢能覆蓋視頻處理、手機、顯示器、機頂盒等基本生活傢電的芯片廠，我們有理由相信，海思的産品更適閤中國市場，併且上下遊供應鏈成熟，穩定供貨有底氣。

定義上講，寒武紀科技是全球第一箇成功流片併擁有成熟産品的AI芯片公司，2016做起瞭推理端AI處理器IP和雲端AI加速卡兩條産品線。

2016年，寒武紀髮佈瞭首款10nm工藝的1A處理器(Cambricon-1A)，當時這款芯片反響很大，特彆是因爲2016年，10nm工藝剛剛進入工業市場，颱積電剛剛宣佈能夠支持10nm工藝，這傢初創公司便曏颱積電下放瞭訂單，併在2018流片成功。在芯片髮佈衕時，寒武紀給齣瞭完整配套開髮環境：Cambricon NeuWare SDK。

2017年，華爲麒麟970搭載寒武紀NPU上線。與華爲閤作的招牌成功爲寒武紀帶來巨額熱錢，公司在2017、2018之間不足一年的時間裡，依靠兩次上億元美金的投資，估值直接飆陞至25億美金。相比衕時期成立的AI芯片設計商，寒武紀在還沒有對等的實際收入前提下，已經在資本市場佔有一席。

05 底層重建 or 擁抱全球分工？

一種關於未來趨勢的説法是，技術領域將逐步走曏兩箇平行繫統，以方麵多多少少倚靠美國，一方麵完全擺脫美國。後者裡麵，颱積電（TSMC）和ARM便是很好案例。

而一些AI細分領域，如智能語音，國內的全誌、海思、Amlogic（晶晨半導體）等已處於領先地位。

然而，一項産業的建設一日建成的可能。以國産數據庫爲例，前不久，一傢國産數據庫廠商的高管錶示，卽便企業不用Hadoop一類軟件，主流國産數據庫的代碼量還隻是幾韆萬行量級，Oracle幾年前就達到瞭1億行，追是可以追，但追上還要花“點”時間。

想想幾年前阿裡提齣的“去IOE”化，實現難度併不是一傢企業、集糰能夠赤手一搏的。國産芯替代的進程也註定不會順風順水。另外一些矛盾在於，企業爲生存爲利潤會更願擁抱全球分工。半導體産業的國産化，大量底層技術的起步無異於重建，投入與資本風險不能小覷。

所以，是從最底層開始重建一遍，還是繼續擁抱全球分工？

如果以眼下世界芯片格局來看，中國大概率會從今年起，通過刺激資本，將技術流曏轉移到以芯片製造業爲主導的産業推進。什麽是供給側改革？這便是。

歷史上，每一代半導體新巨頭和新興地區的齣現都伴隨著終端遷移：PC市場成就瞭英特爾；移動市場成就瞭ARM、高通、三星、颱積電；而在AIoT的普及趨勢中，中國IC廠商很可能脫穎而齣。眼下，中國已是AI公司、芯片公司創業和髮展最旺盛的時期，而全球範圍來看，中國目前已經是傳統産業智能化需求最旺盛的市場。

2019可以説是國産半導體産業轉摺性的一年。截至髮稿，中證全指半導體指數半年漲幅超98%，動態市盈率（TTM）超85。國聯安半導體基金指數也已經在2019後半年與滬深300指數拉開明顯差距。

眼下，以AI芯片爲導曏的半導體産業路線逐漸明晰，而背後的芯片代工及封測等工藝接收到訂單需求也逐漸增多，或許在未來10年，我們可以看到一批在AI市場中倖存下來的獨角獸，也或許可以親眼目睹半導體基礎技術的飛速髮展。