近日,金山云正式推出GPU云辦事器實(shí)例P3I實(shí)例,目前已在金山云官網(wǎng)上線。P3I實(shí)例是業(yè)內(nèi)首款采用英偉達(dá)高性能計(jì)算卡Tesla P4 的云辦事器產(chǎn)品,單實(shí)例負(fù)載能力是傳統(tǒng)CPU的 30 倍以上,具有訪存性能高、聯(lián)網(wǎng)增強(qiáng)、配備新一代網(wǎng)卡三大特點(diǎn),性價(jià)比更高,為包孕語音識(shí)別、語義識(shí)別、語音合成、人臉識(shí)別、圖像識(shí)別、場景識(shí)別、廣告保舉、智能游戲和無人駕駛等在內(nèi)的多種人工智能應(yīng)用場景提供基礎(chǔ)設(shè)施支撐,滿足企業(yè)級(jí)客戶對(duì)于計(jì)算的高尺度需求。
P3I實(shí)例的推出,將加速人工智能技術(shù)應(yīng)用的普及,通過優(yōu)質(zhì)的產(chǎn)品和體驗(yàn),讓人工智能的潛力得以全面釋放。
率先采用Tesla P4計(jì)算卡,提供澎湃動(dòng)力
當(dāng)下,人工智能可謂熱度空前,上至科技巨擘,下至創(chuàng)業(yè)新秀,紛紛將人工智能技術(shù)當(dāng)作開掘市場金礦的利器,例如智能音箱、智能電視、刷臉支付、無人超市、智能保舉、無人駕駛等等,大量的商業(yè)應(yīng)用場景被一一建構(gòu),這對(duì)計(jì)算量、數(shù)據(jù)量、深度學(xué)習(xí)等能力提出了更高的要求。如何為人工智能提供充沛動(dòng)力,加速相關(guān)應(yīng)用的開發(fā),降低計(jì)算成本壓力,成為擺在很多企業(yè)面前的現(xiàn)實(shí)問題。
在金山云看來,作為深度學(xué)習(xí)的重要支撐,近年來GPU在很大程度上提高了辦事器的運(yùn)算能力,大幅度提升訓(xùn)練速度,由此產(chǎn)生的云端計(jì)算集群,已成為人工智能的重要引擎。此次推出的P3I實(shí)例,是業(yè)內(nèi)首款采用英偉達(dá)高性能計(jì)算卡Tesla P4 的云辦事器實(shí)例產(chǎn)品,將為人工智能的應(yīng)用提供澎湃動(dòng)力。
Tesla P4 專為處理深度學(xué)習(xí)工作負(fù)載,可提升辦事器的工作效率,在任意超大規(guī)模神經(jīng)網(wǎng)絡(luò)上的推理延遲,較CPU降低 15 倍以上,推理吞吐效率較CPU提高 60 倍以上,,比擬英偉達(dá)上一代計(jì)算卡M4 有更低的延遲和更大的吞吐。因此,P3I實(shí)例有著更好的性價(jià)比和效率,單實(shí)例負(fù)載能力是配備傳統(tǒng)CPU辦事器的 30 倍以上,適用于深度神經(jīng)網(wǎng)絡(luò)模型的推理預(yù)測等場景。
P3I實(shí)例提供兩種配置,第一種配置一顆Tesla P4 GPU搭載8GB DDR5 顯存、 14 核vCPU、120GB內(nèi)存和500GB SSD硬盤,計(jì)算能力5.5TFlops;第二種配置兩顆Tesla P4 GPU搭載16GB DDR顯存、 28 核vCPU、240GB內(nèi)存和1000GB SSD硬盤,計(jì)算能力11TFlops。客戶在使用該產(chǎn)品建設(shè)深度學(xué)習(xí)平臺(tái)時(shí),可按照業(yè)務(wù)負(fù)載選擇差別配置,從而滿足客戶的定制化需要。
三大特點(diǎn)配合Tesla P4,助人工智能多點(diǎn)開花
為更好地發(fā)揮Tesla P4 的作用,P3I實(shí)例具有三大特點(diǎn)。首先,P3I實(shí)例提高了Tesla P4 的訪存性能,進(jìn)行了延時(shí)優(yōu)化,性能提升22%,接近物理機(jī)水平。通過優(yōu)化云辦事器Hypervisor層性能,降低Tesla P4 拜候內(nèi)存開銷,優(yōu)化了GPU DMA訪存性能,加快HOST內(nèi)存到數(shù)據(jù)交換速率,將充分發(fā)揮Tesla P4 的運(yùn)算能力。
第二,全線支持聯(lián)網(wǎng)增強(qiáng)。P3I實(shí)例的聯(lián)網(wǎng)增強(qiáng)大幅提高實(shí)例發(fā)包速率,能夠降低60%以上的網(wǎng)絡(luò)延遲。在刷臉認(rèn)證、刷臉支付、刷臉門禁、語音識(shí)別等應(yīng)用場景中,客戶對(duì)時(shí)間延遲的敏感度最高,聯(lián)網(wǎng)增強(qiáng)可大幅降低預(yù)測請(qǐng)求到預(yù)測系統(tǒng)(運(yùn)行于P3I實(shí)例上)的時(shí)間延遲,加上Tesla P4 低延遲的特點(diǎn),P3I實(shí)例能為客戶帶來更優(yōu)質(zhì)的體驗(yàn)。
第三,P3I實(shí)例配備新一代智能網(wǎng)絡(luò)適配器,帶寬得到進(jìn)一步提升。在人工智能的推理預(yù)測應(yīng)用中,客戶除了對(duì)時(shí)間延遲敏感,對(duì)于系統(tǒng)吞吐也有較高要求,P3I實(shí)例配備的新一代網(wǎng)絡(luò)適配器,可幫手客戶提升網(wǎng)絡(luò)吞吐一倍以上,能夠更好適配Tesla P4 的吞吐能力。
人工智能需要找到應(yīng)用場景,發(fā)展才有意義。P3I實(shí)例的推出,將幫手人工智能應(yīng)用在各個(gè)行業(yè)不停落地,讓客戶更好發(fā)揮自身的優(yōu)勢(shì)和資源。目前,P3I實(shí)例已開放購買,已有多家知名人工智能廠商的數(shù)十個(gè)應(yīng)用正在適配。在人工智能產(chǎn)業(yè)從技術(shù)厘革行進(jìn)到應(yīng)用落地的重要階段時(shí),P3I實(shí)例將成為金山云鞭策產(chǎn)業(yè)發(fā)展進(jìn)步的新引擎。