求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

CANN

事實揭露 揭密真相
前往: 導覽搜尋

來自 新浪網 的圖片

CANN華為推出的異構計算架構平台。

發展歷程

2018年,華為發布CANN。

2020年8月10日,華為推出CANN 3.0版本

版本記錄

CANN 3.0版本

CANN 3.0支持向下兼容和演進,端、邊、雲全場景協同,只需要一套應用代碼,就可以兼容超過10種設備形態、14操作系統、多種AI框架。

同時,昇騰統一編程接口AscendCL滿足了開發者在框架、算子等方面的定製化開發需求,並提供兩種算子開發方式,兼具效率和性能。

CANN 3.0還充分釋放了AI硬件的性能,高性能算庫擁有1000多深度優化的硬件親和算子,同時通過深度圖優化、自動圖拆分與融合、數據Pipeline智能優化等技術,支撐極致性能的發揮。

基於高度適配的軟硬件組合,搭載CANN 3.0的華為Atlas硬件在主流推理和訓練模型的性能實現了業界領先。

在視頻場景中,Atlas 300I可同時處理80路1080p、25FPS的高清視頻,是業界同時處理路數的2倍。

相關諮詢

華為CANN要替代英偉達CUDA,比鴻蒙替代安卓還難麼?

數字時代[1]石油[2]曾是工業的血液,驅動着世界的運轉。然而,隨着人工智能的興起,一種新的能源正在悄然崛起,它就是算力——AI時代的新石油。這不再是關於地下的挖掘,而是關於數據的開採和智能的提煉。在這個新紀元,算力成為了衡量一個企業、一個國家乃至一個文明進步的關鍵指標。

每一個算力時代,都有兩大核心,一個是計算芯片,另一個是操作系統。在CPU時代,就是大名鼎鼎的Wintel聯盟。那麼在AI時代呢?目前看最有可能的就是英偉達的GPU+CUDA。也就是說,英偉達集最強的AI算力和AI操作系統於一身,難怪其市值能直逼3萬億美元。

在CPU算力時代,我們被Wintel卡了很多年脖子。直到華為芯片+鴻蒙操作系統的出現,我們才看到了一點點「解套」的曙光(注意,也僅僅是一點曙光)。上一個卡點還沒解決好,英偉達GPU+CUDA又成了AI時代的另一個卡點。

那這一個卡點該怎麼解決呢?目前來看,還是得靠華為——Ascend(昇騰)+CANN。但這有幾成勝算呢?要知道,生態的壁壘是最難打破的。鴻蒙都不能算成功了,CANN要打破CUDA的圍堵,還有漫漫長路。

老牌霸主,英偉達CUDA的統治力

CUDA(Compute Unified Device Architecture),由英偉達在2006年推出,標誌着GPU並行計算的新時代的開啟。這一創新的並行計算平台和API模型,不僅讓GPU超越了圖形渲染的界限,更在科學計算、深度學習、數據分析等領域發揮着巨大的作用。CUDA的誕生,使得開發者能夠利用GPU的強大並行處理能力,為各種計算密集型任務提供了加速的可能。

自誕生以來,CUDA經歷了多個重要版本的更新,每一次更新都為行業帶來了深遠的影響。例如,CUDA 2.0引入了對雙精度浮點運算的支持,這對科學計算尤為重要。隨後的版本,如CUDA 4.0,特別強調了對多GPU系統的支持,允許更加靈活的數據共享和任務分配,進一步推動了高性能計算的發展。到了CUDA 11,英偉達特別重視對大規模數據集和AI模型的支持,以及增強的異構計算能力,這在深度學習領域的應用尤為突出。

CUDA不僅僅是一個計算平台,它更是一個龐大的技術生態系統。英偉達通過CUDA,構建了一個包括開發庫(Libraries)、運行時(Runtime)和驅動(Driver)在內的完整軟件棧。這個生態系統為開發者提供了豐富的工具和資源,包括數學和科學計算任務運算庫、便捷的應用開發接口等,極大地促進了技術創新和應用開發。

CUDA的統治力在GPU行業中是顯而易見的,CUDA平台的廣泛應用和強大的生態系統,為英偉達在高性能計算、人工智能、數據中心等領域提供了堅實的基礎。隨着技術的不斷進步和市場需求的增長,CUDA的市場份額和行業影響力預計將會進一步擴大。

CUDA的成功不僅在於其技術優勢,更在於它所構建的生態系統和社區。數百萬的開發者、科研人員和企業在使用和貢獻於CUDA平台,形成了一個自我增強、不斷創新的循環。這種由下至上的創新模式,使得CUDA能夠持續引領行業發展,保持其霸主地位。

CUDA並不缺挑戰者

AMD作為GPU領域的另一大巨頭,同樣擁有自己的並行計算平台來與英偉達的CUDA競爭。AMD的相應技術是ROCm(Radeon Open Compute platform),這是一個開源軟件平台,旨在提供高性能的GPU計算解決方案

ROCm最初發布於2015年,比CUDA晚了整整9年,其旨在為AMD GPU提供類似於CUDA的編程模型和工具鏈。它支持多種編程語言,包括C++、Fortran等,並提供了一套豐富的數學庫和計算接口。

隨着版本的迭代,ROCm不斷增加新特性和優化性能,例如支持OpenCL、HIP(一種類似於CUDA的編程模型)等,使得開發者可以更容易地將CUDA代碼移植到AMD GPU上。

ROCm 5.0版本,對性能和穩定性進行了顯著改進,支持了更多的AI框架和庫,如TensorFlow、PyTorch等,同時增強了對AMD最新GPU架構的支持。

儘管ROCm在不斷進步,但CUDA由於其先發優勢和長期積累,已經建立了一個龐大且成熟的生態系統,擁有更廣泛的開發者基礎和社區支持。CUDA提供了更全面的庫支持和優化,這使得在許多情況下,開發者更傾向於使用CUDA。

據JCR統計,英偉達在全球GPU市場中占據了80%以上的份額,而AMD的市場份額相對較小。據統計,CUDA的開發者數量在2020年已達到200萬,到2023年增長至400萬,顯示出其強大的用戶基礎和需求粘性。

儘管AMD的ROCm在開放性、多供應商支持方面具有優勢,但要想在短期內撼動CUDA的市場地位幾乎不太可能

來自中國的挑戰者——華為CANN

除了AMD的ROCm,英偉達CUDA的另一個挑戰者,是來自中國的CANN。CANN(Compute Architecture for Neural Networks)的誕生標誌着華為在AI算力領域的深入布局,作為昇騰AI全棧的核心,CANN扮演着承上啟下的關鍵角色,適配多框架與多異構芯片,為多樣化的AI應用場景提供高效易用的編程方式。

自CANN 1.0的誕生之日起,華為便在AI算力領域展開了一場技術革新的馬拉松。隨着AI技術的不斷進步,CANN也迎來了快速的迭代更新。

CANN 3.0的發布,標誌着華為在異構計算架構上的一次重大飛躍。這一版本不僅優化了與上層深度學習框架的兼容性,更在底層AI硬件的適配上做了深入的工作,實現了軟硬件之間的高效協同。這種優化大幅度提升了AI模型的開發效率和運行性能,為AI應用的快速部署和穩定運行打下了堅實的基礎。

參考文獻