自2021服貿會召開以來,北京衛視一直在對會中涌現的服務創新型企業進行深入關注。10月17日,在北京衛視的財經頻道中,播出了易道博識聯合創始人兼首席技術官康鐵鋼接受北京衛視的采訪,并對易道博識的技術積累,產品服務和行業領先度等方面給予了高度認可。
“深度學習的成熟,給文字識別,人臉識別的識別率帶來了巨大提升,除了涌現大量的AI初創公司,也有很多實際的落地場景,我們公司從創立開始就擁抱深度學習,并圍繞深度學習搭建了我們的產品矩陣。”康鐵鋼在采訪中介紹道。
但是,深度學習在實際應用中條件很苛刻。人工智能模型的開發與上線應用需要經歷從業務理解、數據采標及處理、模型訓練與測試到運維監控等一系列流程。過程中需要大量的AI算力、高質量數據源、Al應用算法研發及Al技術人員的支持。
而事實上,大部分中小企業用戶并不具備在“算力、數據、算法”三維度從0到1部署的能力,而財力雄厚的大型企業亦需高性價比的AI開發部署方案。
所以,如何AI基礎層服務在多環節提升技術價值,AI產業如何進入低技術門檻、低部署成本、各產業深度參與雙向共建的效率化生產階段,是企業當下面臨的重要問題。
假如,每次開發模型都需要算法工程師單獨完成從生產到上線的全流程招建,就會導取很多時間的耗損與AI模型開發成本的浪費。所以集標注、訓練、推理于一體的賽博(Cybot)深度學習平臺應運而生。
賽博學習平臺是易道博識基于深度學習自主研發的全棧式數據服務平臺,包含數據標注平臺、訓練平臺、推理平臺、接口平臺、管理平臺5大部分,涵蓋數據標注,數據訓練、推理服務三大數據服務環節,可提供模型開放及模型訓練的流水線定制化服務。
賽博學習平臺的出現凝聚了易道博識2013年創立以來,在文字識別,圖像識別等核心技術上近十年的技術沉淀和經驗積累,也與驅動AI業務的外因以及企業自身的內因緊密相關。從外因看,規模化多場景的業務不斷衍生出長尾需求,原有的應用需及時更新;從內因看,囿于開發企業有限的經營成本與AI技術人才,其資源主要投放到現階段的主營業務,現有人員難以推動業務的智能化改造。
其中,智能結構化推理平臺用于訓練產生針對各種不同版式的OCR識別引擎,自動從非結構化數字信息中抽取目標數據,為識別平臺提供結構化方法,一個版式3~5分鐘內即可完成,可以賦予客戶自主解決80%以上的固定格式業務憑證的識別問題。
而其中的API接口平臺屬于API資源的一種,其可幫助技術領先企業開放AI能力與先進資源,從而延伸價值鏈、構造產業生態,形成規模經濟與長尾經濟,且利用開發者的創新應用來反哺開放平臺;同時,其亦可在減輕基礎設施建設投入的條件下協助開發者打造自身產品或服務,節省開發時間。
從總體上看,賽博學習平臺可提供較為前沿的技術、經濟合理的模型生產經驗以及為實現敏捷開發而打包的數據、算力與算法資源。具體而言,其采用自動機器學習技術,很大程度上降低了機器學習的編程工作量、節約了AI開發時間、減輕了對專業數據科學家與算法工程師的依賴,讓缺乏機器學習經驗的開發者用上AI,加快開發效率。
春風化雨,把深度學習OCR帶給移動端
國內首份OCR白皮書《智能文字識別(OCR)能力測評與應用白皮書》中指出:大量的OCR應用需要在資源受限的移動端設備上運行,當前移動端OCR算法大多以犧牲一定的算法精度來換取運行速度,針對移動設備設計兼顧性能和效率的輕量OCR模型將是未來發展的重要方向。
早在去年,易道博識就察覺到了行業上的輕量級趨勢和需求,并在今年成功推出了移動端深度學習OCR ——DOM(,Deep OCR of Mobile),也就是手機端的深度學習OCR版本。
DOM是一款可以在移動端實現深度學習的OCR產品,可以支持在任意方向或角度以及苛刻背景條件下的超高速證件識別。DOM最大的特點體現在兩方面:高精度,輕量級。他可以10M左右的內存環境,在保證高精度的前提下,深度學習的高速度優勢完美展現,在手機上實現了原來在服務端上才能支持的精度與速度。
相比傳統 SDK 中基于四邊定位的的方法,深度學習的方法能夠更好地排除 背景噪聲的干擾,如存在背景線條或背景特征與證件接近的情況,從而可以得到更精確的證件輪廓信息。在識別能力上,基于深度學習技術的 DOM SDK識別核心具有大幅度領先的識別精度,具體表現在如生僻字、少數民族證件等場景下更好的識別效果。
DOM SDK的市場需求非常大,證券開戶,銀行開戶,投保理賠,汽車金融……等大量應用卡證識別,且移動端需求量極大的業務,都是DOM SDK的應用場景。這些場景對識別速度、識別精度的要求非常高,客戶容忍度低,注重用戶體驗,對產品的魯棒性要求很高。
與人臉識別等其它識別任務不同,OCR技術不僅需要卷積神經網絡(CNN),還需要更復雜、計算量更大的遞歸神經網絡(RNN、LSTM),這需要強大算力為支撐,而手機并不像服務器端一樣擁有GPU。在不依賴算力和GPU的情況下,大幅度提升識別精度,顯著改善用戶體驗,這正是DOM SDK的技術價值所在。
潤物無聲,瞄準市場風口,賦能更多行業
道阻且長,行則將至。易道博識作為一名在AI路上已近10年的棋手,在賽博平臺和移動端OCR 無疑是兩手好棋。
首先,二者均從業務前端發掘潛在及外顯的市場需求,針對剛需應用與高價值環節延伸出多條增量建設與運行需求業務線,瞄準市場風口的同時,敏捷、經濟地消化個性化和碎片化需求,根據需求柔性匹配生產。
而在兩手好棋的背后,易道博識也在構筑自己的 “珍瓏棋局”。
從 2020 年至今,易道博識與華為建立了密切的合作關系。不僅與華為在產品上達成兼容,還基于各自領域的技術與資源優勢,在解決方案層上積極探索實踐。其中,易道博識的Deep OCR技術為Atlas 800推理服務器提供了“每秒20張A4紙”量級的文本識別能力,因性能提高帶來的資源節省使得機房空間下降了60%,資源能耗下降了30%。現已得到華為昇騰智能OCR解決方案的Compatible技術認證證書。
并且今年,易道博識已經和英特爾創新孵化器達成戰略合作,目前就產品研發和應用上和英特爾的CPU技術框架進行適配,目前階段性進展順利,POC技術合作部分已取得了滿意的優化結果,下一階段會逐步應用到更多的產品類型上。