登錄
微信登錄
打開(kāi)手機(jī)微信,,掃描二維碼
掃描成功
請(qǐng)勿刷新本頁(yè)面,,按手機(jī)提示操作
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,謹(jǐn)防詐騙
您的微信還未注冊(cè)
中科曙光不會(huì)以任何理由要求您轉(zhuǎn)賬匯款,,謹(jǐn)防詐騙
您可以同時(shí)關(guān)注中科曙光微信公眾號(hào)
使用微信掃一掃即可登錄,! 查閱資料更方便、 快捷,!
您已經(jīng)注冊(cè)賬號(hào)和
關(guān)注微信公眾號(hào)
2025年1月
服務(wù)熱線:400-810-0466
成功案例
項(xiàng)目背景
咪咕公司是中國(guó)移動(dòng)面向移動(dòng)互聯(lián)網(wǎng)領(lǐng)域設(shè)立的,負(fù)責(zé)數(shù)字內(nèi)容領(lǐng)域產(chǎn)品提供,、運(yùn)營(yíng),、服務(wù)的一體化專(zhuān)業(yè)子公司,是中國(guó)移動(dòng)旗下音樂(lè),、視頻,、閱讀、游戲,、動(dòng)漫數(shù)字業(yè)務(wù)板塊的唯一運(yùn)營(yíng)實(shí)體,,下設(shè)咪咕音樂(lè)、咪咕視訊,、咪咕數(shù)媒,、咪咕互娛、咪咕動(dòng)漫五個(gè)子公司,。
目前,咪咕已成為國(guó)內(nèi)領(lǐng)先的全場(chǎng)景品牌沉浸平臺(tái),,匯聚超過(guò)1700萬(wàn)+首歌曲、430萬(wàn)條視頻,、1200+路音視頻直播,、50萬(wàn)+冊(cè)書(shū)刊、3萬(wàn)+款游戲,、47萬(wàn)集動(dòng)漫畫(huà),。基于如此龐大而海量的數(shù)據(jù),咪咕承載著中國(guó)移動(dòng)大部分的人工智能業(yè)務(wù),。而為了更好的開(kāi)展人工智能技術(shù)的研發(fā)與應(yīng)用,,咪咕采購(gòu)GPU服務(wù)器及相關(guān)軟件用于AI域的技術(shù)平臺(tái)構(gòu)建。
需求簡(jiǎn)介
咪咕公司集中采購(gòu)機(jī)架式GPU服務(wù)器,,是為了滿足咪咕公司IT資源池項(xiàng)目大規(guī)模數(shù)據(jù)計(jì)算要求,,主要建設(shè)超大規(guī)模的人工智能線下訓(xùn)練平臺(tái),、線上推理平臺(tái)及相應(yīng)的云計(jì)算平臺(tái),,重點(diǎn)研發(fā)適用于通信行業(yè)的人臉識(shí)別、智能客服,、輿情分析等AI技術(shù)和應(yīng)用,。根據(jù)GPU服務(wù)器的配置和管理要求,GPU服務(wù)器供應(yīng)商進(jìn)行有針對(duì)性舍棄和優(yōu)化的服務(wù)器,。
機(jī)架式GPU服務(wù)器應(yīng)按照目前大型,、云計(jì)算數(shù)據(jù)中心的要求,簡(jiǎn)化現(xiàn)場(chǎng)維護(hù),,并提高對(duì)遠(yuǎn)程,、自動(dòng)化運(yùn)維管理的支持能力。
解決方案
曙光AI產(chǎn)品系列中的GPU服務(wù)器主要面向中高功率密度數(shù)據(jù)中心和標(biāo)準(zhǔn)19’機(jī)架,,并能夠?qū)崿F(xiàn)靈活采購(gòu)和部署的一類(lèi)GPU服務(wù)器,。
其中本次典配1和典配2采用4U8卡GPU服務(wù)器分別搭配4塊V100和P40,同時(shí)還配置了雙口25GE光纖網(wǎng)卡,,支持RoCE,,提高了設(shè)備信息處理的帶寬,降低了信息傳輸中的延遲,,主要面向人工智能中的深度學(xué)習(xí)使用場(chǎng)景,。
對(duì)滿足需求的GPU卡與本項(xiàng)目選用的GPU服務(wù)器進(jìn)行系統(tǒng)穩(wěn)定性測(cè)試和GPU卡性能測(cè)試,并提供相關(guān)測(cè)試方法和測(cè)試報(bào)告,,有力的驗(yàn)證了產(chǎn)品的穩(wěn)定性和高性能,。
本次典配3和典配4采用4U4卡GPU服務(wù)器分別搭配4塊P40和P4主要面向人工智能中的在線推理使用場(chǎng)景和視頻編解碼使用場(chǎng)景。
曙光深入理解咪咕的AI應(yīng)用,、協(xié)助搭建AI訓(xùn)練模型,、不斷提出優(yōu)化建議,分享了曙光SothisAI的技術(shù),。曙光SothisAI是專(zhuān)門(mén)面向深度學(xué)習(xí)的云平臺(tái),, 嵌入了caffe和tensorflow等深度學(xué)習(xí)框架,同時(shí)融合了任務(wù)調(diào)度系統(tǒng),,結(jié)合 docker容器技術(shù),,為用戶提供深度學(xué)習(xí)計(jì)算服務(wù), 集中了數(shù)據(jù)集管理、鏡像管理,、容器管理,、模型管理、文件管理,、任務(wù)管理和資源管理等,。實(shí)現(xiàn)對(duì)高性能計(jì)算資源的調(diào)度分配、訓(xùn)練任務(wù)提交,、任務(wù)管理,、資源狀態(tài)監(jiān)控等功能。提供深度學(xué)習(xí)集群的一體化解決方案,。
同時(shí)還搭配了曙光的集群管理軟件,,為咪咕AI域的構(gòu)建提供全方位的工業(yè)設(shè)計(jì)、作業(yè)調(diào)度,、集群監(jiān)控管理等功能,,方便快捷的應(yīng)用軟件服務(wù),讓工業(yè)設(shè)計(jì)更加簡(jiǎn)單,,強(qiáng)大的作業(yè)調(diào)度讓計(jì)算更加高效,,豐富的集群配置、管理工具,讓集群管理更加簡(jiǎn)化,。集群運(yùn)行狀態(tài)精細(xì)化展現(xiàn),,集群異常狀況及時(shí)告警,讓系統(tǒng)隱患防患于未然,。系統(tǒng)直觀展示各類(lèi)軟硬件資源的運(yùn)行狀況,,準(zhǔn)確快速地定位設(shè)備故障源,保障各種IT設(shè)備的安全穩(wěn)定運(yùn)行,。