■原題:算法訓練幾乎0成本!梧桐大模型讓首批用戶吃上“螃蟹”
■記者:思文
行(xing)業大(da)(da)模(mo)(mo)(mo)型(xing)正在爆炸式(shi)(shi)集中推出,關(guan)注大(da)(da)模(mo)(mo)(mo)型(xing)的人士都知(zhi)道了行(xing)業大(da)(da)模(mo)(mo)(mo)型(xing)的簡單(dan)公式(shi)(shi),通用大(da)(da)模(mo)(mo)(mo)型(xing)+行(xing)業場景+訓練(lian)調優=行(xing)業大(da)(da)模(mo)(mo)(mo)型(xing),因(yin)此訓練(lian)調優是企業自研(yan)大(da)(da)模(mo)(mo)(mo)型(xing)不可避(bi)開的重要環節。
然在其(qi)他企業(ye)還(huan)在觀望,推出(chu),演示或者調優的(de)(de)當下,宇視作為推出(chu)AIoT行業(ye)大模型的(de)(de)第一(yi)人,6月9號,其(qi)小(xiao)范圍召開了大模型“梧(wu)桐”種子合作伙伴(ban)簽約會并公開了“梧(wu)桐”未來的(de)(de)規劃。
目前“梧桐”針對需求計劃細化出三種不同模型:
l CV(計算機視覺)行業大模型
提供AI訓練、AI在線學(xue)習等(deng)服(fu)務,預計將在7月底上線,現(xian)階段已經(jing)在小范圍(wei)測試。
l NLP(自然語言處理)行業大模型
提供資(zi)料中心、大(da)數據平(ping)臺(tai)、代(dai)碼開發等服務,這是一款自用行業(ye)大(da)模型,目前階段只(zhi)在(zai)宇(yu)視內部(bu)(bu)使用,主要用在(zai)內部(bu)(bu)生(sheng)產(chan),精準度要求更高。
l MM(多模態)行業大模型
提供Vlog等服務,目前已在樂(le)園景(jing)(jing)區、鄉村振(zhen)興等場景(jing)(jing)的(de)(de)視頻宣傳(chuan)上有豐富的(de)(de)落地案例。
那打出“AIGC平權”旗幟的宇視將怎么把技術平權和知識平權真正融進中小型企業業務里?
CPS中安(an)網(wang)作為特(te)邀媒體就此疑問與部(bu)分宇(yu)視核心(xin)高管面(mian)對面(mian)進行了“圓(yuan)桌(zhuo)對話(hua)”。
1、大模型趨勢下
中小型企業怎么用好數據?
中小企(qi)(qi)業(ye)(ye)(ye)作為中國(guo)經濟發展的(de)重(zhong)要(yao)主體之一,據(ju)工信部公布的(de)數據(ju),2022年我國(guo)日均(jun)新設企(qi)(qi)業(ye)(ye)(ye)達2.38萬戶,中小微企(qi)(qi)業(ye)(ye)(ye)數量已(yi)超過5200萬戶,在如今大模(mo)型熱潮下(xia),不少中小企(qi)(qi)業(ye)(ye)(ye)都在關(guan)注行業(ye)(ye)(ye)大模(mo)型將會如何(he)為自身企(qi)(qi)業(ye)(ye)(ye)真正(zheng)做(zuo)到降本(ben)增效。
雖然數字化轉型理念愈來愈普及,不少中小企業都想搭上“高效”這趟車,但“數據怎么用?”“花費多少成本?”這兩(liang)大疑慮(lv)把大部分中小企業攔(lan)在了車(che)門外。
除此之外,雖(sui)說(shuo)行業(ye)都在認可“ALL in AI”這一現狀,但不少中小(xiao)型(xing)企業(ye)對(dui)于AI的理解可能仍局(ju)限性停(ting)留在人臉識別。
宇(yu)視云智能(neng)產品(pin)部部長湯利(li)波告訴CPS中安網,作為直接(jie)接(jie)觸到市場(chang)(chang)動向脈搏的(de)(de)中小型(xing)企(qi)業,其完(wan)全(quan)可以利(li)用數據(ju)針(zhen)對性(xing)訓練(lian)一(yi)些細分業務場(chang)(chang)景的(de)(de)算法。“通過場(chang)(chang)景化算法指標能(neng)力的(de)(de)提(ti)升(sheng),有機會(hui)去提(ti)升(sheng)解決方案的(de)(de)增值(zhi)性(xing),包括服務收益的(de)(de)增值(zhi)性(xing)。”
舉個簡(jian)單的(de)(de)例子,在游(you)(you)(you)樂(le)園(yuan)娛樂(le)等場所,大部分人可能認為攝像頭只是起到安全防控的(de)(de)作用,但假設負責這個場景業務的(de)(de)企業,愿(yuan)意(yi)讓(rang)攝像頭搭(da)載上提前訓練好的(de)(de)大模型(xing),訓練好的(de)(de)大模型(xing)經過推理后(hou),將其(qi)視頻數(shu)據進行自(zi)動分割、自(zi)動識別、剪輯美化,游(you)(you)(you)樂(le)園(yuan)就能從原有的(de)(de)出(chu)售(shou)游(you)(you)(you)客圖片的(de)(de)業務升級到游(you)(you)(you)客專屬vlog,這便讓(rang)原本(ben)只是躺在存(cun)儲里的(de)(de)數(shu)據得(de)到了進一步調(diao)動應用。
可以明顯看到,在大模(mo)(mo)型(xing)趨勢下,對于中小(xiao)型(xing)企業而言,其如何(he)通過大模(mo)(mo)型(xing)利(li)用(yong)數據達(da)到降本(ben)增效的作用(yong),結(jie)果(guo)還是開源或(huo)者節(jie)流,省下人(ren)力、時(shi)間、精力成本(ben)的同時(shi)對現有(you)業務進行升(sheng)級賦能,將服務收益最大化(hua)或(huo)許才是正(zheng)解。
基于此,對于判斷市場上任意一(yi)項新技術或者(zhe)新產品是(shi)否值得應用,中(zhong)小型(xing)企(qi)業往往更加在意實際投入成本(ben)幾(ji)何。關于成本(ben)問(wen)題,會上,宇(yu)視的大模(mo)型(xing)也給出了階段性(xing)答案。
2、幾乎0成本訓練
梧桐CV行業大模型將上線
“我們需要更多的渠(qu)道(dao)能夠有(you)這種能力,更好(hao)的和宇視(shi)合作,而(er)不是只有(you)幾家壟斷的市場。”宇視(shi)CPO朱(zhu)兵說。
具體來說,宇(yu)(yu)視(shi)的(de)賦能之道是,在(zai)訓練(lian)(lian)側(ce)上,用戶(hu)企(qi)業(ye)可以(yi)遠程通(tong)過(guo)互(hu)聯網訪問之后來訓練(lian)(lian)算法(fa),宇(yu)(yu)視(shi)會承擔云(yun)的(de)租(zu)用費(fei)用,為(wei)用戶(hu)企(qi)業(ye)省去前期(qi)訓練(lian)(lian)需(xu)要的(de)成(cheng)本,企(qi)業(ye)可以(yi)幾乎0成(cheng)本獲得(de)宇(yu)(yu)視(shi)開通(tong)的(de)大模型訓練(lian)(lian)賬號,在(zai)訓練(lian)(lian)過(guo)程中,會有宇(yu)(yu)視(shi)專門的(de)技術團(tuan)隊進行支持。
在推理側上,宇視通過(guo)將場(chang)景化(hua)的算(suan)(suan)法(fa)進行剝離,也就(jiu)是將相對小模型的算(suan)(suan)法(fa)部署到宇視邊緣端的設備上,一(yi)定程度上避免(mian)合(he)作伙伴為此額外(wai)部署一(yi)個幾(ji)千(qian)萬起(qi)步的超算(suan)(suan)機房。
此外,算法拓展在目前階(jie)段仍屬于(yu)煙囪式(shi),即使用戶需(xu)求(qiu)很相近,但(dan)由于(yu)對(dui)象的(de)不同還是需(xu)要重新(xin)生成算法,容(rong)易導致投入產出比(bi)和客戶需(xu)求(qiu)之間的(de)矛盾,而預計7月(yue)底正式(shi)上(shang)線的(de)“梧桐CV行業大模型”可以較好(hao)解決這(zhe)個問題。
舉個(ge)例子(zi),假設現在有(you)60多萬(wan)個(ge)體(ti)育(yu)(yu)館(guan),300多萬(wan)套器(qi)材(cai),這(zhe)60多萬(wan)個(ge)體(ti)育(yu)(yu)館(guan)的器(qi)材(cai)放置地(di)點都不同,此時(shi)項目方需(xu)要(yao)知道(dao)所有(you)館(guan)的器(qi)材(cai)的使(shi)用(yong)頻(pin)率和大(da)眾愿意使(shi)用(yong)哪類健(jian)身器(qi)材(cai),這(zhe)時(shi)候(hou)如果用(yong)小(xiao)模型(xing)就需(xu)要(yao)采(cai)集(ji)各個(ge)體(ti)育(yu)(yu)館(guan)的數(shu)(shu)據(ju)進(jin)行對比再針對性地(di)多次(ci)訓練(lian),而(er)“梧桐CV行業大(da)模型(xing)”卻(que)能在比較小(xiao)的數(shu)(shu)據(ju)量(liang)情況(kuang)下,做到泛化(hua)識別和推理,即(ji)使(shi)器(qi)材(cai)對象(xiang)千差萬(wan)別,但省去(qu)了二次(ci)訓練(lian)、學習的環節。
場(chang)景多N倍,算法(fa)獲得率提升(sheng)(sheng)80%,算法(fa)精準度從85%提升(sheng)(sheng)至(zhi)95%,讓IT工程訓練(lian)師(shi)訓練(lian)算法(fa),更(geng)容(rong)易解決行(xing)業Know-How問題,入門(men)(men)門(men)(men)檻更(geng)低,大(da)模型梧桐的優(you)勢也由此凸顯,
目前“梧桐CV行業大模型”已經和第一批合作伙伴完成落地計劃的簽約,率先在體育、教育、交通、零售等領域進行首發落地。
相(xiang)信(xin)在未來,大(da)模型(xing)(xing)的(de)“訓練(lian)”“推理”兩個關鍵詞優勢將會日益凸顯,據了(le)解,為(wei)保障(zhang)大(da)模型(xing)(xing)的(de)順利運行,宇視目前部(bu)署(shu)在云邊(bian)端芯片款(kuan)(kuan)(kuan)型(xing)(xing)超過(guo)(guo)50款(kuan)(kuan)(kuan),支持(chi)的(de)算法種類(lei)超過(guo)(guo)1000個,模型(xing)(xing)數過(guo)(guo)萬,產品款(kuan)(kuan)(kuan)型(xing)(xing)過(guo)(guo)千。
前期成本宇視承擔,合作伙伴幾乎0成本接入,這么大的支持力度,相信業內人士都會十分好奇,宇視到底靠梧桐大模型怎么實現盈利?
3、瞄準生態價值
力爭高效落地
傳統意義上,做(zuo)了一個軟件,投(tou)入100萬(wan)(wan),就要力爭賣到200萬(wan)(wan),最(zui)后賺(zhuan)100萬(wan)(wan),光明正大的(de)追求利(li)潤是企業繞不開的(de)話(hua)題(ti)。
但這次,宇視并沒有(you)打算使(shi)用(yong)傳統的(de)(de)賣軟件直接獲利策(ce)略,而是(shi)通過(guo)(guo)讓(rang)利給合(he)作伙伴,讓(rang)合(he)作伙伴通過(guo)(guo)使(shi)用(yong)“梧(wu)桐”得到多個專屬的(de)(de)“行業軟件工程師”。“讓(rang)宇視的(de)(de)渠道盈利,讓(rang)他們有(you)進入一些新的(de)(de)業務模式的(de)(de)可能。”朱兵說(shuo)道。
在這個平權時代,支撐宇視此次這么大膽的行徑的信心和念想究竟來自哪里?
“平權時代,最大(da)的競(jing)爭(zheng)力在于你的效率,在于公司(si)看清楚自己的定位之后能夠(gou)第一時間全力撲(pu)上去做。”
2012年(nian),宇(yu)(yu)視捕捉到人工(gong)智能的(de)發(fa)展(zhan)趨勢,同年(nian)便開(kai)始在深度學習領域進行(xing)投入,2016年(nian),宇(yu)(yu)視推(tui)出初(chu)代基(ji)于DL的(de)AIoT產品,如今來到大模(mo)型爆(bao)炸階段,宇(yu)(yu)視又成為第一個(ge)推(tui)出“AIoT行(xing)業大模(mo)型”的(de)第一人。
2023年,宇視這次對于“梧桐”大模型的定位到底是什么?
沒錯,就是落地化,工程化。正如微(wei)軟將GPT-4對接Office、金山將其(qi)大模(mo)型產品“WPS AI”接入WPS,大模(mo)型最終的(de)落(luo)地還得是在(zai)硬件上。
那宇視(shi)怎么快(kuai)速落地實現工(gong)程化?總結為以(yi)下(xia)幾點:
1、原有的深度學習積累和產品工程化落地可繼承
2、站在通用大模型的肩膀上開發自己的行業大模型
3、通過“剪枝”和“蒸餾”等技術,實現行業大模型的邊緣側部署
4、開放(fang)能力(li)給合作(zuo)伙伴,同時有專門的培訓(xun)和(he)技術服務體系保障
也許正如此次宇(yu)視(shi)簽約(yue)種子伙伴之一(yi)的萬店掌所言,眾多(duo)行(xing)業(ye)大模型中為什(shen)么(me)選(xuan)擇宇(yu)視(shi),其實占比很大一(yi)部分原(yuan)因是其本身已(yi)經(jing)和(he)宇(yu)視(shi)有(you)過(guo)合作,對宇(yu)視(shi)這(zhe)個(ge)品牌已(yi)經(jing)存在(zai)(zai)一(yi)定的認知(zhi)力和(he)認可度,剛(gang)好宇(yu)視(shi)在(zai)(zai)這(zhe)個(ge)階段推出(chu)了大模型就相當于為合作伙伴提供了一(yi)條龍服務,省(sheng)去了對其他新品牌的學習、切換成本,選(xuan)擇宇(yu)視(shi)會(hui)適配度更高(gao)。
當然,在(zai)這個數據量爆炸(zha)的(de)時代(dai)下,不(bu)少企業(ye)還是會十(shi)分在(zai)意保密性(xing),而目前由于(yu)大部分中小企業(ye)不(bu)具(ju)備私(si)有云(yun)的(de)部署能力,因此愿(yuan)意上云(yun)的(de)企業(ye)的(de)數據會相對集中在(zai)公有云(yun)上,一旦拿出來(lai)訓練是否會產生泄漏(lou)的(de)風險?
“我們(men)前期在(zai)接觸合作伙(huo)伴過程中,也(ye)有客戶有安(an)全(quan)性的疑慮,主要疑慮在(zai)原有數據是否外(wai)泄和訓練成果收否會被無償占用兩(liang)方面”湯(tang)利波說(shuo)道。而宇視“梧桐”也(ye)將(jiang)通過相(xiang)關技術(shu)進(jin)行分(fen)權(quan)、分(fen)域(yu),建立(li)完善(shan)的權(quan)限管(guan)理和安(an)全(quan)管(guan)控(kong)制度,融合等方式保證訓練成果的安(an)全(quan)性和獨享性。
4、大模型戰場已開局
是開始還是結束?
風起于青(qing)萍之末,浪成于微瀾(lan)之間。
相對之前企業(ye)拼數(shu)據樣本,拼私有的(de)(de)(de)訓練(lian)平臺,拼技術架構的(de)(de)(de)小模型(xing)AI時代,如今隨著大(da)(da)模型(xing)相繼開源(yuan)后(hou),有基礎的(de)(de)(de)企業(ye)大(da)(da)都可以基于開源(yuan)組件(jian)進行(xing)自(zi)身大(da)(da)模型(xing)的(de)(de)(de)自(zi)研,先用(yong)通用(yong)大(da)(da)模型(xing)把原始的(de)(de)(de)大(da)(da)量(liang)行(xing)業(ye)場(chang)景的(de)(de)(de)知識數(shu)據清洗一遍,再把顯著目標值給提(ti)取出來,去重后(hou)形成行(xing)業(ye)數(shu)據庫(ku),最終投(tou)喂給通用(yong)大(da)(da)模型(xing)訓練(lian)出一個行(xing)業(ye)大(da)(da)模型(xing)。
Open AI用了上萬塊(kuai)英偉達GPU喂出了一個ChatGPT,浪潮掀到中國,國內千模(mo)大(da)(da)戰已拉開,行業大(da)(da)模(mo)型或將是未來各個領域都會去追尋的模(mo)式(shi)。
縱觀(guan)安防行業(ye)幾十年的發展,從模擬(ni)階(jie)(jie)段的爭(zheng)奪攝像頭代理權(quan),到(dao)網(wang)絡數字階(jie)(jie)段的系統(tong)業(ye)務成焦(jiao)點,再到(dao)智(zhi)能化階(jie)(jie)段的ALL in AI,如今已到(dao)大模型卷入階(jie)(jie)段,或(huo)許正如宇視CEO張鵬國(guo)曾在深圳安博會舉辦期間抒發的經典(dian)語(yu)錄所言:“意識到(dao)這是場(chang)戰爭(zheng)的時候(hou),戰爭(zheng)已經結(jie)束了,機會不會等(deng)待后(hou)知后(hou)覺(jue)的傲慢。”
[出處] 思文(wen), 算法訓練(lian)幾乎0成本!梧(wu)桐(tong)大模型讓(rang)首批用戶吃(chi)上(shang)“螃(pang)蟹”.CPS中(zhong)安網(wang), 2024-06-14