時(shí)間:2024-03-12來(lái)源:本站
當前,AI大模型發(fā)展如火如荼,“百模大戰”仍在繼續。而大模型發(fā)展的背后是龐大的算力支撐。隨著(zhù)大模型迭代速度越來(lái)越快,參數越來(lái)越大,對智能算力提出了更高性能的挑戰。作為中國領(lǐng)先的AI算力提供商和AI服務(wù)器TOP2企業(yè),寶德應需而動(dòng),隆重推出了寶德自強®昇騰AI推理服務(wù)器PR425KI G2,助力大模型賦能千行百業(yè)。
更高算力密度
PR425KI G2基于鯤鵬+昇騰處理器打造,采用8模組高效推理方式,支持8*32GB HBM片內存和32個(gè)DDR4系統內存插槽,可以提供強勁的AI推理能力。在緊湊的4U空間內,其內部集成了圖像&視頻預處理器,外部通信模塊、硬件加速器、芯片管理核等模塊,具備完整的SOC功能,能高效加速AI應用。
極致能效比
PR425KI G2配置高效節能電源、動(dòng)態(tài)冷卻機制,提供0.6 PFLOPS/ kW超高能效比,在保持其性能的同時(shí),大大節省運營(yíng)費用;同時(shí),還采用智能散熱系統,根據熱關(guān)鍵器件溫度綜合調節風(fēng)扇轉速,節能的同時(shí)降低了噪音并提高風(fēng)扇的可靠性。
高速網(wǎng)絡(luò )帶寬
PR425KI G2配備了8*200GE RoCE v2高速接口,通過(guò)HCCS Full mesh互聯(lián)模式,實(shí)現了8路NPU之間的無(wú)縫連接,極大地提升了數據傳輸速度和模型推理效率,讓復雜計算任務(wù)處理如行云流水,助力企業(yè)快速洞察數據價(jià)值,搶占市場(chǎng)先機。
針對高性能大模型推理場(chǎng)景,PR425KI G2是33B以上高性能大模型應用推理的理想選擇。PR425KI G2具備強大計算能力、高能效比和高網(wǎng)絡(luò )帶寬等優(yōu)勢,能夠輕松應對高性能大模型推理帶來(lái)的挑戰,提供穩定可靠的算力支持。它不僅能夠幫助企業(yè)快速構建智能客服系統,提升客戶(hù)服務(wù)體驗,還能助力內容創(chuàng )作者實(shí)現文案與創(chuàng )意的自動(dòng)化生成,加速知識管理與沉淀過(guò)程,為各行各業(yè)的數字化轉型插上翅膀。
未來(lái),寶德將繼續充分發(fā)揮自身技術(shù)優(yōu)勢,加大研發(fā)創(chuàng )新,不斷推出更多性能強勁、安全可靠的算力產(chǎn)品和方案,助推更多大模型場(chǎng)景落地和應用,促進(jìn)千行百業(yè)數字變革,為我國人工智能產(chǎn)業(yè)的發(fā)展注入強勁的動(dòng)力。