色噜噜狠狠色综合成人网_色五月丁香六月欧美综合_国产98在线 | 欧美_狠狠躁天天躁夜夜躁婷婷

首頁
核心技術
產品體系
解決方案
動態資訊
關于我們
搜索
首頁 動態資訊 公司(si)新聞(wen)

北京衛視專訪易道博識:擁抱深度學習OCR,從服務器端到移動端

來(lai)源(yuan):易道博(bo)識 發布時(shi)間:2022-06-20

自2021服貿會召開以來,北京衛視一直在對會中涌現的服務創新型企業進行深入關注。10月17日,在北京衛視的財經頻道中,播出了易道博識聯合創始人兼首席技術官康鐵鋼接受北京衛視的采訪,并對易道博識的技術積累,產品服務和行業領先度等方面給予了高度認可。


“深度學習的成熟,給文字識別,人臉識別的識別率帶來了巨大提升,除了涌現大量的AI初創公司,也有很多實際的落地場景,我們公司從創立開始就擁抱深度學習,并圍繞深度學習搭建了我們的產品矩陣。”康鐵鋼在采訪中介紹道。


但是,深度學習在實際應用中條件很苛刻。人工智能模型的開發與上線應用需要經歷從業務理解、數據采標及處理、模型訓練與測試到運維監控等一系列流程。過程中需要大量的AI算力、高質量數據源、Al應用算法研發及Al技術人員的支持。


事實上,大部分中小企業用戶并不具備在“算力、數據、算法”三維度從(cong)0到1部署的(de)能力,而財力雄厚的(de)大型企業亦需高性價比的(de)AI開發部署方案。


所以,如何AI基礎層服務在多環節提升技術價值,AI產業如何進入低技術門檻、低部署成本、各產業深度參與雙向共建的效率化生產階段,是企業當下面臨的重要問題。


十年磨(mo)劍(jian),如何用好深(shen)度學習這柄(bing)“利劍(jian)”?



假如,每次開發模型都需要算法工程師單獨完成從生產到上線的全流程招建,就會導取很多時間的耗損與AI模型開發成本的浪費。所以集標注、訓練、推理于一體的賽博(Cybot)深度學習平臺應運而生。


賽博學習平臺是易道博識基于深度學習自主研發的全棧式數據服務平臺,包含數據標注平臺、訓練平臺、推理平臺、接口平臺、管理平臺5大部分,涵蓋數據標注,數據訓練、推理服務三大數據服務環節,可提供模型開放及模型訓練的流水線定制化服務。


賽博學習平臺的出現凝聚了易道博識2013年創立以來,在文字識別,圖像識別等核心技術上近十年的技術沉淀和經驗積累,也與驅動AI業務的外因以及企業自身的內因緊密相關。從外因看,規模化多場景的業務不斷衍生出長尾需求,原有的應用需及時更新;從內因看,囿于開發企業有限的經營成本與AI技術人才,其資源主要投放到現階段的主營業務,現有人員難以推動業務的智能化改造。


其中,智能結構化推理平臺用于訓練產生針對各種不同版式的OCR識別引擎,自動從非結構化數字信息中抽取目標數據,為識別平臺提供結構化方法,一個版式3~5分鐘內即可完成,可以賦予客戶自主解決80%以上的固定格式業務憑證的識別問題。


而其中的API接口平臺屬于API資源的一種,其可幫助技術領先企業開放AI能力與先進資源,從而延伸價值鏈、構造產業生態,形成規模經濟與長尾經濟,且利用開發者的創新應用來反哺開放平臺;同時,其亦可在減輕基礎設施建設投入的條件下協助開發者打造自身產品或服,節省開發時間。

從總體上看,賽博學習平臺可提供較為前沿的技術、經濟合理的模型生產經驗以及為實現敏捷開發而打包的數據、算力與算法資源。具體而言,其采用自動機器學習技術,很大程度上降低了機器學習的編程工作量、節約了AI開發時間、減輕了對專業數據科學家與算法工程師的依賴,讓缺乏機器學習經驗的開發者用上AI,加快開發效率。


春風化(hua)雨,把深度(du)學習OCR帶給移(yi)動端


國內首份OCR白皮書《智能文字識別(OCR)能力測評與應用白皮書》中指出:大量的OCR應用需要在資源受限的移動端設備上運行,當前移動端OCR算法大多以犧牲一定的算法精度來換取運行速度,針對移動設備設計兼顧性能和效率的輕量OCR模型將是未來發展的重要方向。


早在去年,易道博識就察覺到了行業上的輕量級趨勢和需求,并在今年成功推出了移動端深度學習OCR ——DOM(,Deep OCR of Mobile),也就是手機端的深度學習OCR版本。


DOM是一款可以在(zai)移動端實現深(shen)度(du)學習的(de)(de)OCR產品,可以支(zhi)持在(zai)任意方向或角(jiao)度(du)以及苛刻背(bei)景條件下的(de)(de)超(chao)高(gao)(gao)速證(zheng)(zheng)件識別。DOM最大的(de)(de)特點體(ti)現在(zai)兩方面(mian):高(gao)(gao)精(jing)度(du),輕量(liang)級(ji)。他可以10M左右的(de)(de)內存環境,在(zai)保證(zheng)(zheng)高(gao)(gao)精(jing)度(du)的(de)(de)前提(ti)下,深(shen)度(du)學習的(de)(de)高(gao)(gao)速度(du)優勢完美展現,在(zai)手(shou)機(ji)上(shang)實現了原(yuan)來在(zai)服務端上(shang)才能(neng)支(zhi)持的(de)(de)精(jing)度(du)與速度(du)。



相比傳統 SDK 中(zhong)基于(yu)四邊定位的(de)(de)(de)(de)的(de)(de)(de)(de)方法,深(shen)度學(xue)習(xi)的(de)(de)(de)(de)方法能(neng)夠更好地(di)排(pai)除 背景(jing)噪聲的(de)(de)(de)(de)干擾,如存在(zai)(zai)背景(jing)線條或背景(jing)特征與證件(jian)接(jie)近(jin)的(de)(de)(de)(de)情(qing)況,從而可以得(de)到(dao)更精確的(de)(de)(de)(de)證件(jian)輪廓(kuo)信息。在(zai)(zai)識(shi)別能(neng)力上,基于(yu)深(shen)度學(xue)習(xi)技術的(de)(de)(de)(de) DOM SDK識(shi)別核心具(ju)有(you)大幅(fu)度領先的(de)(de)(de)(de)識(shi)別精度,具(ju)體表現在(zai)(zai)如生僻字(zi)、少(shao)數民族證件(jian)等場景(jing)下更好的(de)(de)(de)(de)識(shi)別效(xiao)果。


DOM SDK的(de)市場(chang)需求(qiu)(qiu)非(fei)常大,證券開戶(hu),銀行(xing)開戶(hu),投保理賠(pei),汽車金融……等大量(liang)應(ying)用(yong)卡(ka)證識別,且移(yi)動端(duan)需求(qiu)(qiu)量(liang)極大的(de)業務,都是DOM SDK的(de)應(ying)用(yong)場(chang)景。這些場(chang)景對(dui)識別速(su)度、識別精度的(de)要求(qiu)(qiu)非(fei)常高(gao),客戶(hu)容(rong)忍度低,注重用(yong)戶(hu)體驗,對(dui)產(chan)品的(de)魯(lu)棒性要求(qiu)(qiu)很高(gao)。


與人臉識(shi)(shi)別等其它識(shi)(shi)別任(ren)務不同,OCR技術不僅需要(yao)卷積神經網絡(luo)(CNN),還(huan)需要(yao)更(geng)復雜、計算量更(geng)大的遞歸神經網絡(luo)(RNN、LSTM),這需要(yao)強大算力(li)為支撐,而手機并不像服務器(qi)端一(yi)樣(yang)擁有GPU。在(zai)不(bu)依賴算力和GPU的情況下(xia),大幅度提升識別精度,顯(xian)著改(gai)善用(yong)戶體驗,這正是DOM SDK的技術(shu)價值所在(zai)。


潤(run)物無聲,瞄準(zhun)市場風口,賦(fu)能更多行業


道阻且長,行則將至。易道博(bo)識作為一名在AI路上已(yi)近10年的棋手,在賽(sai)博(bo)平臺(tai)和(he)移動端(duan)OCR 無疑是兩手好(hao)棋。


首先,二者均從業務前端發掘潛在及外顯的市(shi)場需(xu)求,針對剛需(xu)應用與(yu)高價(jia)值環節延伸出(chu)多條(tiao)增(zeng)量(liang)建設與(yu)運行需(xu)求業務線,瞄準市(shi)場風口的同時,敏捷(jie)、經濟地消化(hua)個性(xing)化(hua)和碎片化(hua)需(xu)求,根據需(xu)求柔性(xing)匹配(pei)生產(chan)。


而(er)在兩手好棋的背(bei)后,易(yi)道博識也在構筑自己的 “珍瓏棋局(ju)”。


從 2020 年至今,易(yi)道(dao)博識(shi)(shi)與華為建立了(le)(le)密(mi)切的(de)合作關(guan)系。不僅與華為在(zai)產品(pin)上達成(cheng)兼(jian)容,還基于各自領(ling)域的(de)技(ji)術(shu)與資源(yuan)優勢,在(zai)解(jie)決方案層上積極(ji)探索實踐。其中,易(yi)道(dao)博識(shi)(shi)的(de)Deep OCR技(ji)術(shu)為Atlas 800推理服務器提(ti)供(gong)了(le)(le)“每秒20張A4紙”量級的(de)文本識(shi)(shi)別能力,因性能提(ti)高帶來的(de)資源(yuan)節省使(shi)得機房空(kong)間(jian)下(xia)降了(le)(le)60%,資源(yuan)能耗(hao)下(xia)降了(le)(le)30%。現已(yi)得到(dao)華為昇(sheng)騰智能OCR解(jie)決方案的(de)Compatible技(ji)術(shu)認(ren)證證書(shu)。


并(bing)且今(jin)年,易道博識已經和英特爾(er)創新孵化器達成(cheng)戰(zhan)略(lve)合作,目(mu)前就產品研發和應用上(shang)和英特爾(er)的CPU技術框(kuang)架進行適(shi)配,目(mu)前階(jie)段(duan)性進展順利,POC技術合作部分已取得(de)了滿意的優化結果,下一階(jie)段(duan)會逐(zhu)步應用到更多的產品類型上(shang)。


在線留言