易(yi)道博識掌握具有(you)自(zi)主知識產(chan)權(quan)的核心算(suan)法,覆(fu)蓋文字識別(bie)、文檔處理、圖像處理、自(zi)然(ran)語言處理,結合領域模型(xing)學習能力,駕馭算(suan)力資源,不斷(duan)實現數據驅動下的模型(xing)升級,持續打造更強大的AI能力。
文字識別
表格識別
印章識別
勾選識別
簽名比對
印刷、手寫、中文、英文、數字識別
基于深度學習全新DeepOCR識別流程,大幅提升識別速度及精度,
卡證類< 300ms,單張發票< 1s,A4幅面票據混掃< 3s,
漢字字符識別率> 99.5%,數字字符識別率> 99.9%,
英文(wen)字符識別率> 99.7%,手寫(xie)整(zheng)行識別率> 95.2%
有線(xian)、無線(xian)、列位偏移、多列重疊
多形狀、多方向、曲線行、模糊、遮擋
重疊 、小(xiao)印章
符號(hao)檢測、內容(rong)識別
簽名檢(jian)測、簽名比(bi)對
版面分析:標題、段落、表格、印章、簽名、信息塊、圖表
文檔分類:固定格式、非固定格式、富格式文檔、長文本文檔
文檔抽取:實體、關系、表格、印章、簽名
文(wen)檔比對:關鍵信息、段落、表(biao)格(ge)、結構
圖像檢測、圖像分割
圖像質檢:模糊、反光、拍屏、水印、復印、篡改、變形、切邊、遠距離、遮擋
噪(zao)聲和干(gan)擾去除(chu):圖像(xiang)噪(zao)聲、水(shui)印(yin)、陰(yin)影、印(yin)章、痕跡(ji)去除(chu)
文本分析:分詞、詞向量表示、依存句法分析、命名體識別、文本相似度
語言(yan)理解:文(wen)本分(fen)類、信息抽取、情感分(fen)析
依托GPT、BERT等大規(gui)模語(yu)言模型(xing),基(ji)于海量文(wen)本(ben)語(yu)料自動學習,具備更好(hao)的(de)文(wen)本(ben)理(li)解和文(wen)本(ben)生成(cheng)能力。
基于LayoutLM、ERNIE等大規模(mo)文(wen)檔版(ban)式預訓練模(mo)型,利(li)用大量(liang)文(wen)檔樣本自監督學習,更(geng)好地理解各種(zhong)文(wen)檔結構、內容和語(yu)義。
以(yi)大(da)規模語言模型和版(ban)式(shi)預(yu)訓(xun)練模型為(wei)基礎結合領(ling)域數據,通過(guo)下游任務(wu)學習,快速生成領(ling)域中(zhong)小(xiao)規模模型,并輸出場景AI能力。
針對(dui)本地化、私(si)有化等生產部署場景(jing),利用知識蒸餾等模型輕(qing)量(liang)化技術(shu),解決(jue)算力局限(xian)性(xing)問(wen)題實現業務場景(jing)深度(du)融(rong)合。