色噜噜狠狠色综合成人网_色五月丁香六月欧美综合_国产98在线 | 欧美_狠狠躁天天躁夜夜躁婷婷

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公司新聞

以數據驅動模型,可訓練、可現場應用的賽博學習平臺

來源:易道博(bo)識 發布時間:2022-11-18

日前,由江蘇(su)省支付(fu)清(qing)算(suan)服務協(xie)會、山東省支付(fu)清(qing)算(suan)協(xie)會支持的(de)2022金融(rong)科技(ji)創(chuang)新發展論壇在(zai)遵義(yi)成功召開。易道博(bo)識CTO康鐵鋼(gang)先生(sheng)受邀參會,與來自銀行、保險、證券等行業(ye)的(de)100余位行業(ye)專家,分享以數據驅動模型,可(ke)訓練(lian)、可(ke)現場(chang)應用(yong)的(de)賽博(bo)深(shen)度學(xue)習平臺在(zai)行業(ye)中的(de)應用(yong)創(chuang)新。



行業痛點繁多,長尾憑證痛點難除


隨著金融業務的發展(zhan),越(yue)來越(yue)多的業務線中(zhong)涉(she)及(ji)的紙質憑證(zheng)影(ying)像需要用到(dao)OCR自動處理,來進(jin)一步(bu)提升業務辦理的效率。從企(qi)業內部(bu)的數據(ju)類型(xing)來(lai)看,這些憑證(zheng)影像按(an)照(zhao)格(ge)式可以(yi)(yi)分(fen)為兩類(lei):一(yi)類(lei)是(shi)固定(ding)格(ge)式的(de)憑證(zheng)(戶口本、港澳臺身份(fen)證(zheng)、外國人永久(jiu)居(ju)留證(zheng)等),占(zhan)整體(ti)90%以(yi)(yi)上;一(yi)類(lei)是(shi)非固定(ding)格(ge)式的(de)憑證(zheng)(銀行流水等)。這些憑證存在(zai)以下特點:

1、種(zhong)類多:內在各個業務受(shou)理(li)過程中涉(she)及(ji)到(dao)的憑證(zheng)都(dou)在百(bai)種以上,甚(shen)至多達幾(ji)百(bai)種;

2、更新(xin)頻(pin)繁:不少憑證會隨(sui)著業務(wu)需(xu)求或(huo)者監管(guan)制度的變(bian)化而調整(zheng)格式(shi);

3、長尾憑證“雞肋”:存在(zai)很多使用頻率低,但總體數量大(da)(da)的憑證(zheng),這些憑證(zheng)單(dan)獨采購識別的價值不大(da)(da)但又無法解決;

4、數據安(an)全:大多數情況(kuang)下,隱私數據是(shi)無法對(dui)外(wai)的(de),如何(he)在這種情況(kuang)下做模型訓練(lian)是(shi)客觀需要(yao)面對(dui)的(de)問(wen)題;


基于此類特點,對憑證的OCR識別工作就特別復雜。目前針對與此的解決方案都各有缺陷:要么(me)持(chi)續投入高(gao),需(xu)要廠商(shang)就每一種(zhong)憑證進行定制(zhi)化開發,要么(me)需(xu)要采購廠商(shang)底(di)層能(neng)力,而且需(xu)要OCR專(zhuan)家團隊的支持(chi),投入成本更高(gao)。因(yin)此,行業迫切需要一個能(neng)夠減少后續(xu)投(tou)入(ru),自主可控的解決方案。


自我數據閉環,賽博自成有機整體


賽博學習平(ping)臺是(shi)易(yi)道博識基(ji)于(yu)深度學習自(zi)主研發的一站式機器學習訓練平(ping)臺。賽博平臺集數據(ju)管理、數據(ju)標注、模(mo)(mo)型訓練和模(mo)(mo)型應用(yong)于一身,提供(gong)及(ji)時、現場(chang)化的(de)數據(ju)驅動模(mo)(mo)型應用(yong)解決方案(an)。



論壇(tan)上,易道博識CTO康(kang)鐵鋼(gang)介紹道:“賽博平臺(tai)充(chong)分利用了(le)現有的經(jing)過長期迭(die)代的基礎模(mo)型(xing)能力,包括圖像、OCR和NLP等(deng),在(zai)少(shao)量(liang)樣本的驅動下,利用遷移(yi)學(xue)習(xi)和小樣本學(xue)習(xi)等(deng)技術(shu),高效(xiao)地完(wan)成增量(liang)模(mo)型(xing)的訓練,生(sheng)成最(zui)優(you)的模(mo)型(xing)文(wen)件,并通過推理平臺(tai)來實(shi)現模(mo)型(xing)的快速部署與(yu)生(sheng)產應用。


產品組成(cheng)(cheng)上,賽博平(ping)臺由管理(li)(li)中心CyberCenter、數據標(biao)注平(ping)臺 CyberData、深度(du)學習(xi)訓練平(ping)臺 CyberLearning和深度(du)學習(xi)推理(li)(li)平(ping)臺 CyberServing幾個子平(ping)臺組成(cheng)(cheng),各子平(ping)臺依次(ci)承擔平(ping)臺管理(li)(li)、數據管理(li)(li)與(yu)標(biao)注、模型訓練和模型服務(wu)的功能,個(ge)(ge)子平(ping)臺(tai)之間相互獨(du)立又有(you)效(xiao)配合,形成一個(ge)(ge)有(you)機整體,從而有(you)效(xiao)支撐數據驅(qu)動(dong)模型(xing)應用的整體功能。


數據標注平臺 CyberData


數(shu)據平臺主要(yao)功(gong)能包括數(shu)據管(guan)理(li)、數(shu)據處理(li)、樣本擴充(chong)、數(shu)據標(biao)注與采集(ji)。數(shu)據平臺內置exLabeler標(biao)注客戶端,提供強大專業的CV、OCR、結構化(hua)和NLP任務標(biao)注功(gong)能。同時,數(shu)據平臺還(huan)支持單人和團隊標(biao)注模式。


用戶可以(yi)通過exLabeler客(ke)戶端完(wan)成(cheng)樣本(ben)的(de)標(biao)(biao)注(zhu)。exLabeler支持CV、OCR、結構化和NLP等(deng)(deng)領域算法的(de)標(biao)(biao)注(zhu)。標(biao)(biao)注(zhu)完(wan)成(cheng)的(de)數據集可以(yi)直接用于模(mo)型訓練,或(huo)進一步做(zuo)后處(chu)理(li)(如圖(tu)像(xiang)處(chu)理(li)、樣本(ben)擴充等(deng)(deng)),然(ran)后再用于模(mo)型訓練。


數據(ju)標注平臺 CyberData工作流程


深度學(xue)習(xi)訓練平臺 CyberLearning


訓練(lian)平臺(tai)通過自(zi)身對(dui)于訓練(lian)資源(yuan)池的集中管理(li)(li)與分配,以(yi)及與管理(li)(li)平臺(tai)的無縫對(dui)接(jie),可(ke)以(yi)方(fang)便(bian)地實現訓練(lian)基礎設施的管理(li)(li),從而減輕用戶的管理(li)(li)維護工作。同時(shi),利用自(zi)動超參(can)搜索等技(ji)術,訓練(lian)平臺(tai)可(ke)以(yi)自(zi)動搜索到最佳性能的模(mo)型。


通過(guo)分布(bu)式(shi)訓(xun)練與多框架支(zhi)持,訓(xun)練平(ping)(ping)臺可以最(zui)大化利用計(ji)算資源,加速模(mo)型訓(xun)練。同時,利用自動超參搜(sou)索等(deng)技術(shu),訓(xun)練平(ping)(ping)臺可以自動搜(sou)索到(dao)最(zui)佳性能的(de)模(mo)型。最(zui)后,對于(yu)訓(xun)練所(suo)得(de)的(de)最(zui)優模(mo)型,訓(xun)練平(ping)(ping)臺支(zhi)持一鍵部署到(dao)推(tui)理平(ping)(ping)臺,實現模(mo)型的(de)快速應用。


深度學習(xi)訓練平臺(tai) CyberLearning工作(zuo)流程(cheng)



深(shen)度學(xue)習(xi)推理平臺 CyberServing


推理平臺(tai)(tai)主(zhu)要完成(cheng)各種識(shi)別功能(neng)的部(bu)署。業務系統通過(guo)調用推理平臺(tai)(tai)提供的RESTful API提交圖像并獲得識(shi)別結(jie)果。整(zheng)體上(shang)講,推理平臺(tai)(tai)產品需求(qiu)可分解為模(mo)型(xing)管理、API過(guo)程(cheng)定義、識(shi)別數據查看,接口(kou)統計和(he)其(qi)它非(fei)功能(neng)項(xiang)等部(bu)分。其(qi)中模(mo)型(xing)管理和(he)API管理模(mo)塊屬(shu)于基礎(chu)核心模(mo)塊。


推(tui)理(li)平臺(tai)(tai)對同一模(mo)型(xing)不同版(ban)本(ben)的管理(li),并支(zhi)持(chi)(chi)在模(mo)型(xing)服務中同時(shi)(shi)加載和運行多個版(ban)本(ben)的模(mo)型(xing)。推(tui)理(li)平臺(tai)(tai)還支(zhi)持(chi)(chi)一個API綁定多個模(mo)型(xing)服務。模(mo)型(xing)升級(ji)時(shi)(shi),用戶可以(yi)選擇先(xian)在部(bu)分服務中激活(huo)新版(ban)本(ben)的模(mo)型(xing),完成測試驗證(zheng)后再升級(ji)其他服務。


深(shen)度(du)學習推理平臺(tai) CyberServing工(gong)作(zuo)流程(cheng)


值得(de)一(yi)提的(de)是,賽(sai)博平(ping)(ping)臺打(da)造了(le)數(shu)據(ju)(ju)驅動模型(xing)(xing)應用的(de)閉環(huan)。推理(li)(li)平(ping)(ping)臺支(zhi)持對于自身所(suo)產生(sheng)的(de)生(sheng)產數(shu)據(ju)(ju)根據(ju)(ju)不同的(de)條(tiao)件進(jin)行自動采集的(de)功(gong)能,采集后的(de)數(shu)據(ju)(ju)可(ke)以方(fang)便(bian)地導入標(biao)(biao)注(zhu)平(ping)(ping)臺,形(xing)成(cheng)數(shu)據(ju)(ju)集,并支(zhi)持進(jin)一(yi)步的(de)數(shu)據(ju)(ju)處(chu)理(li)(li)與(yu)標(biao)(biao)注(zhu)。標(biao)(biao)注(zhu)完成(cheng)的(de)數(shu)據(ju)(ju)集可(ke)以用于模型(xing)(xing)的(de)訓(xun)練調(diao)優,從而得(de)到性能更(geng)佳的(de)模型(xing)(xing),用于更(geng)新(xin)推理(li)(li)平(ping)(ping)臺生(sheng)產模型(xing)(xing),從而形(xing)成(cheng)一(yi)個完整(zheng)的(de)數(shu)據(ju)(ju)閉環(huan)。


《國民經濟和(he)(he)社會發(fa)(fa)展(zhan)第十(shi)四(si)個五年規劃和(he)(he)2035年遠景目(mu)(mu)標綱要(yao)(yao)》提出加(jia)快(kuai)數字化(hua)發(fa)(fa)展(zhan),人民銀行(xing)《金融科(ke)技(ji)發(fa)(fa)展(zhan)規劃(2022-2025)》中明確了“十(shi)四(si)五”期(qi)間行(xing)業金融科(ke)技(ji)發(fa)(fa)展(zhan)、數字化(hua)轉型目(mu)(mu)標,要(yao)(yao)從治理體系、業務創新、技(ji)術(shu)和(he)(he)數據能(neng)力建設、風險防(fang)范(fan)等多維度提出重(zhong)點任務,推動行(xing)業數字化(hua)轉型落(luo)地實施。


如今,AI產業正逐步(bu)進(jin)入低技術(shu)門(men)檻、低部署成本、各產業深度參(can)與雙向共建的效率化(hua)生(sheng)產階段。而作為支撐AI模型(xing)開發及落地的資源型(xing)平(ping)臺,賽博平(ping)臺可在多方面提升AI技術(shu)價(jia)值釋放(fang)。從(cong)總體上看,賽博(bo)平臺可提供較(jiao)為前沿的技術(shu)、符合業務場(chang)景(jing)的模型生產經驗(yan)以及打包的數據(ju)與算法資源。


“具體而言,一(yi)(yi)方(fang)面(mian),賽(sai)博平臺(tai)一(yi)(yi)定程(cheng)度(du)上解決了規模化多場景的業(ye)務不斷衍生出(chu)的長尾(wei)需(xu)求。另(ling)一(yi)(yi)方(fang)面(mian),平臺(tai)采用自動機(ji)器學習技術,很大(da)程(cheng)度(du)上降低了機(ji)器學習的編程(cheng)工作量、節約了AI 開發時間、減輕了對專(zhuan)業(ye)數據科(ke)學家與算法(fa)工程(cheng)師的依賴(lai),讓缺(que)乏機(ji)器學(xue)習經驗的開(kai)發者用(yong)上AI,加快(kuai)了開(kai)發效(xiao)率


“我們通(tong)(tong)過產品和服務(wu)來(lai)獲得行業認(ren)可。我們認(ren)真(zhen)服務(wu)每一個客戶(hu),認(ren)真(zhen)解決客戶(hu)問題(ti)。”康鐵鋼說道:“我們會專注(zhu)于人工智(zhi)(zhi)能領(ling)域,致力(li)于人工智(zhi)(zhi)能領(ling)域的理論研究與應用開(kai)發,不斷創新,為企業降本增效,通(tong)(tong)過人工智(zhi)(zhi)能提升(sheng)社會的運行效率。”

在線留言