免费久久人人爽人人爽AV_亚洲s色大片在线观看_丰满人妻熟妇乱又伦精品_人妻在厨房被色诱 中文字幕

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公(gong)司新聞

以數據驅動模型,可訓練、可現場應用的賽博學習平臺

來源:易(yi)道博識 發(fa)布時間(jian):2022-11-18

日前(qian),由江蘇省(sheng)支(zhi)付清(qing)算服務協(xie)會(hui)、山東(dong)省(sheng)支(zhi)付清(qing)算協(xie)會(hui)支(zhi)持(chi)的2022金融(rong)科技(ji)創(chuang)新發展論壇在遵義成功召開。易(yi)道(dao)博(bo)(bo)識CTO康鐵鋼先生受邀參會(hui),與來自銀行、保險、證券等行業(ye)的100余位行業(ye)專家,分享以數據(ju)驅動模型,可(ke)訓練、可(ke)現場應用(yong)的賽(sai)博(bo)(bo)深度(du)學習平臺在行業(ye)中的應用(yong)創(chuang)新。



行業痛點繁多,長尾(wei)憑(ping)證痛點難除


隨(sui)著金(jin)融業務的發展,越(yue)來(lai)越(yue)多的業務線中涉及(ji)的紙質(zhi)憑(ping)證影像(xiang)需要(yao)用到OCR自動處(chu)理(li),來(lai)進一步提升業務辦(ban)理(li)的效率。從企業內部(bu)的數據類型(xing)來看(kan),這(zhe)些憑(ping)證影(ying)像按照格式可以分為兩類:一類是(shi)固(gu)定(ding)格式的憑(ping)證(戶口(kou)本、港澳臺身(shen)份證、外國人永(yong)久居留證等),占整體90%以上;一類是(shi)非固(gu)定(ding)格式的憑(ping)證(銀行流水等)。這些憑(ping)證存在以下特點:

1、種類(lei)多:內在(zai)各個業務受理過程(cheng)中涉及(ji)到的憑證(zheng)都在(zai)百種以上,甚(shen)至(zhi)多達幾百種;

2、更(geng)新(xin)頻繁:不(bu)少憑(ping)證會隨著業務需(xu)求或(huo)者(zhe)監(jian)管制(zhi)度的(de)變化而調整格式;

3、長尾憑(ping)證“雞肋”:存在(zai)很多使用頻率低,但總體數量大(da)的憑(ping)證,這些(xie)憑(ping)證單獨采購識別(bie)的價(jia)值不(bu)大(da)但又無法解決(jue);

4、數(shu)據安全:大(da)多數(shu)情況(kuang)下(xia),隱(yin)私數(shu)據(ju)是無(wu)法(fa)對外(wai)的,如何在這(zhe)種情況(kuang)下(xia)做模型訓(xun)練是客(ke)觀需要面(mian)對的問題;


基于此類特點,對憑證的OCR識別工作就特別復雜。目前針對與此的解決方案都各有缺陷:要(yao)(yao)么持(chi)(chi)續(xu)投入高,需要(yao)(yao)廠(chang)商就(jiu)每一(yi)種憑(ping)證(zheng)進行定(ding)制化開發,要(yao)(yao)么需要(yao)(yao)采購廠(chang)商底(di)層能力,而且需要(yao)(yao)OCR專家團隊的(de)支持(chi)(chi),投入成(cheng)本(ben)更高。因此,行(xing)業迫切(qie)需要一個能夠減少(shao)后續投入,自主可控(kong)的解決方案。


自我數據閉環,賽博自成有機整體


賽博學(xue)(xue)習(xi)平(ping)臺是易道博識基于(yu)深度學(xue)(xue)習(xi)自(zi)主研(yan)發的一站式(shi)機器(qi)學(xue)(xue)習(xi)訓練平(ping)臺。賽博(bo)平(ping)臺集數據管理、數據標注、模型(xing)訓(xun)練和(he)模型(xing)應用于一身(shen),提供(gong)及(ji)時、現場化的數據驅動(dong)模型(xing)應用解決(jue)方案。



論壇上,易(yi)道(dao)博識CTO康鐵鋼介紹道(dao):“賽博平臺(tai)充分利(li)用(yong)了現(xian)有(you)的經過(guo)長期迭代的基礎模(mo)型能力,包括圖像、OCR和(he)(he)NLP等(deng),在(zai)少量樣(yang)本的驅(qu)動(dong)下,利(li)用(yong)遷移(yi)學(xue)習和(he)(he)小樣(yang)本學(xue)習等(deng)技術(shu),高效(xiao)地完(wan)成增(zeng)量模(mo)型的訓練(lian),生成最(zui)優的模(mo)型文件,并(bing)通過(guo)推理平臺(tai)來實現(xian)模(mo)型的快(kuai)速(su)部(bu)署(shu)與生產應用(yong)。


產品組成上,賽博平(ping)臺由管(guan)理(li)中心CyberCenter、數(shu)據標(biao)注平(ping)臺 CyberData、深(shen)度學(xue)習訓(xun)練平(ping)臺 CyberLearning和深(shen)度學(xue)習推理(li)平(ping)臺 CyberServing幾(ji)個子平(ping)臺組成,各子平(ping)臺依次承擔(dan)平(ping)臺管(guan)理(li)、數(shu)據管(guan)理(li)與標(biao)注、模(mo)型訓(xun)練和模(mo)型服務的功能,個子平(ping)臺之間相互獨立又(you)有效(xiao)配合,形成(cheng)一個有機整(zheng)體,從而有效(xiao)支撐(cheng)數據(ju)驅動模型(xing)應用的整(zheng)體功能(neng)。


數據標注(zhu)平臺(tai) CyberData


數據(ju)平臺主要(yao)功能(neng)包括數據(ju)管理、數據(ju)處理、樣本擴充(chong)、數據(ju)標注與采集。數據(ju)平臺內置exLabeler標注客戶端,提(ti)供強大專(zhuan)業的CV、OCR、結構化和(he)NLP任務標注功能(neng)。同時,數據(ju)平臺還支持單人和(he)團隊標注模式。


用戶可以(yi)通過exLabeler客戶端完成樣本(ben)(ben)的標(biao)注(zhu)(zhu)。exLabeler支持CV、OCR、結構化和(he)NLP等(deng)領(ling)域算法的標(biao)注(zhu)(zhu)。標(biao)注(zhu)(zhu)完成的數據集可以(yi)直(zhi)接(jie)用于模型訓練,或(huo)進一步做后處(chu)理(如圖像處(chu)理、樣本(ben)(ben)擴充等(deng)),然后再用于模型訓練。


數據標注平臺 CyberData工作流程


深度學習訓練平臺 CyberLearning


訓練(lian)平(ping)臺通過(guo)自(zi)身對(dui)于訓練(lian)資源(yuan)池(chi)的(de)集中管(guan)(guan)理(li)與分配,以(yi)(yi)及與管(guan)(guan)理(li)平(ping)臺的(de)無(wu)縫對(dui)接,可以(yi)(yi)方便地(di)實現(xian)訓練(lian)基礎設(she)施的(de)管(guan)(guan)理(li),從而減輕用戶(hu)的(de)管(guan)(guan)理(li)維護(hu)工作(zuo)。同時,利(li)用自(zi)動(dong)超參搜(sou)索等(deng)技術(shu),訓練(lian)平(ping)臺可以(yi)(yi)自(zi)動(dong)搜(sou)索到(dao)最佳性能(neng)的(de)模型(xing)。


通過分(fen)布式訓(xun)(xun)練與多(duo)框架支持,訓(xun)(xun)練平臺可以(yi)最大化(hua)利用(yong)計算資源,加(jia)速模型(xing)訓(xun)(xun)練。同(tong)時,利用(yong)自動超參搜(sou)索(suo)等技(ji)術,訓(xun)(xun)練平臺可以(yi)自動搜(sou)索(suo)到最佳性能的模型(xing)。最后,對于訓(xun)(xun)練所得的最優模型(xing),訓(xun)(xun)練平臺支持一(yi)鍵部(bu)署到推理(li)平臺,實現模型(xing)的快速應用(yong)。


深度(du)學習訓練平臺 CyberLearning工作(zuo)流(liu)程(cheng)



深度學習(xi)推(tui)理平臺 CyberServing


推(tui)理(li)(li)平(ping)臺(tai)主要(yao)完成(cheng)各種(zhong)識別(bie)功能(neng)的部署(shu)。業務系統(tong)通過調用推(tui)理(li)(li)平(ping)臺(tai)提供的RESTful API提交圖(tu)像并獲(huo)得識別(bie)結果。整(zheng)體上講,推(tui)理(li)(li)平(ping)臺(tai)產品(pin)需求可分解為模型管理(li)(li)、API過程定義、識別(bie)數據查看(kan),接口統(tong)計和其它非功能(neng)項等部分。其中模型管理(li)(li)和API管理(li)(li)模塊(kuai)屬于基(ji)礎(chu)核心模塊(kuai)。


推(tui)理平(ping)臺(tai)對同(tong)一模(mo)(mo)型(xing)(xing)不同(tong)版(ban)本的管理,并(bing)支持(chi)在模(mo)(mo)型(xing)(xing)服(fu)務中同(tong)時加載和運行多(duo)個(ge)版(ban)本的模(mo)(mo)型(xing)(xing)。推(tui)理平(ping)臺(tai)還支持(chi)一個(ge)API綁定多(duo)個(ge)模(mo)(mo)型(xing)(xing)服(fu)務。模(mo)(mo)型(xing)(xing)升級時,用戶可以選擇先在部分服(fu)務中激活(huo)新版(ban)本的模(mo)(mo)型(xing)(xing),完成測試驗證后再升級其他服(fu)務。


深(shen)度(du)學習推理(li)平臺 CyberServing工作流(liu)程


值得一提的(de)(de)(de)是,賽博(bo)平(ping)(ping)臺(tai)(tai)打(da)造了數據驅(qu)動模型應用(yong)的(de)(de)(de)閉環。推理平(ping)(ping)臺(tai)(tai)支(zhi)持對于自身所(suo)產生(sheng)的(de)(de)(de)生(sheng)產數據根據不同的(de)(de)(de)條件進行(xing)自動采集的(de)(de)(de)功能,采集后的(de)(de)(de)數據可(ke)以(yi)方(fang)便(bian)地導入標(biao)注平(ping)(ping)臺(tai)(tai),形(xing)成(cheng)數據集,并(bing)支(zhi)持進一步的(de)(de)(de)數據處(chu)理與標(biao)注。標(biao)注完成(cheng)的(de)(de)(de)數據集可(ke)以(yi)用(yong)于模型的(de)(de)(de)訓(xun)練調優,從(cong)而(er)得到性能更佳的(de)(de)(de)模型,用(yong)于更新(xin)推理平(ping)(ping)臺(tai)(tai)生(sheng)產模型,從(cong)而(er)形(xing)成(cheng)一個完整的(de)(de)(de)數據閉環。


《國民(min)經(jing)濟和(he)社會發展(zhan)第十四個(ge)五年規(gui)劃(hua)(hua)和(he)2035年遠景目標(biao)綱要(yao)》提出加快數(shu)(shu)字化(hua)發展(zhan),人民(min)銀(yin)行《金融科技發展(zhan)規(gui)劃(hua)(hua)(2022-2025)》中明確了“十四五”期間行業(ye)金融科技發展(zhan)、數(shu)(shu)字化(hua)轉型目標(biao),要(yao)從治理(li)體系(xi)、業(ye)務創新、技術(shu)和(he)數(shu)(shu)據能力(li)建設、風(feng)險防范等多(duo)維度提出重點任(ren)務,推(tui)動行業(ye)數(shu)(shu)字化(hua)轉型落地實施。


如今,AI產(chan)業正(zheng)逐步進入低(di)技(ji)術門(men)檻(jian)、低(di)部(bu)署成(cheng)本、各產(chan)業深(shen)度參(can)與雙向共建的效率化(hua)生產(chan)階段。而作(zuo)為支撐AI模型開(kai)發(fa)及(ji)落地的資源型平臺,賽(sai)博平臺可(ke)在多方面提(ti)升(sheng)AI技(ji)術價(jia)值釋(shi)放。從總體上看(kan),賽博(bo)平(ping)臺可提(ti)供(gong)較為前沿的技術、符(fu)合業(ye)務場(chang)景(jing)的模型生產經驗(yan)以及打(da)包(bao)的數據與算法資源。


“具體而言,一方面,賽博平(ping)臺(tai)一定(ding)程(cheng)度上(shang)解決(jue)了規模(mo)化多(duo)場景的業務不斷衍生(sheng)出的長尾需求(qiu)。另一方面,平(ping)臺(tai)采用自動機(ji)器學(xue)習技術,很(hen)大(da)程(cheng)度上(shang)降低了機(ji)器學(xue)習的編程(cheng)工作量、節約了AI 開發時間、減輕了對專業數(shu)據科學(xue)家(jia)與算法(fa)工程(cheng)師的依賴,讓缺乏機(ji)器學(xue)習經驗的(de)開發(fa)者用上(shang)AI,加快了(le)開發(fa)效率


“我(wo)(wo)們通(tong)過(guo)產品和服務(wu)來獲得行業認可。我(wo)(wo)們認真服務(wu)每一(yi)個客戶,認真解決客戶問題。”康鐵鋼說道(dao):“我(wo)(wo)們會專注于人工智能(neng)(neng)領域,致(zhi)力于人工智能(neng)(neng)領域的(de)理論研究(jiu)與應(ying)用開(kai)發,不斷創新(xin),為企業降本增(zeng)效,通(tong)過(guo)人工智能(neng)(neng)提(ti)升社會的(de)運行效率。”

在線留言