万众瞩目,9月17日至19日,由国家发展和改革委员会、科技部、工业和信息化部、国家网信办、中国科学院、中国工程院和上海市人民政府共同主办2018 世界人工智能大会在上海举办。
本届大会以“人工智能赋能新时代”为主题,谷歌、亚马逊、微软、腾讯、百度等互联网巨头纷纷现身,共同承办了总计30余个围绕人工智能领域开展的分论坛,全球超过200余家人工智能领域领军企业参加了论坛和展示活动。
9月18日下午,在由小i机器人承办的“听见听懂 AI知你心”智能语音语义分论坛上,合合信息联合创始人、副总裁龙腾博士,以“文本智能处理技术在实践中的应用”为题发表主题演讲。从文本智能处理技术发展现状入手,分析了目前可行的实践应用模式以及未来对于如何让机器“阅读”人类文字的美好展望。
要想让让机器学会阅读,首先要解决入口问题——进行文本识别。OCR技术作为文本识别技术的核心,同时也是较为成熟的一种技术在近几年得到了人工智能领域的重视。百度、阿里、腾讯等巨头的纷纷加入也让沉寂多时的文本处理技术一时间炙手可热。在实践中,当OCR技术面对复杂的现实情况,譬如抖动模糊、歪斜、反光、形变、远距离低像素等,文本识别率往往不如人意。
文档智能处理技术基于人工智能技术的发展,将深度学习和文本识别进行结合,推出的STR(Scenetext Recognition场景文本识别)技术则很好地解决了传统OCR技术无法解决的问题。通过在具体垂直案例中的测试,STR技术相较OCR技术的文本识别率得到了质的飞跃。以银行卡识别为例,目前合合信息的银行卡识别广泛应用于全球的支付行业,合作伙伴包括三星、eBay、支付宝,翼支付等国内外的知名支付公司。在与三星的合作过程中,合合信息银行卡识别准确度高达99.9%,并且可以支持全球范围内的银行卡识别。在国内,超过80%的券商在证件识别领域都选择了合合信息作为其供应商。
在To C领域,合合信息早在2009年就推出了第一款运用文本智能处理技术的移动应用——名片全能王,这也是全球第一个将模式识别技术运用到手机上的APP,目前在全球名片全能王拥有3.2亿用户,另一款文本扫描识别APP扫描全能王,则拥有3.7亿用户,其中80%都是海外用户。To B领域,经过多年的深耕,目前合合信息的STR技术已经成熟运用于金融、银行、保险等领域。而要让机器读“懂”人类的语言,除了做好入口的文本识别,语言语义分析技术的实现也是必不可少的一环。合合信息拥有名片、财报、企业三证、合同、外卖小票等一百多个识别模块,攻克了语言判断、文字识别、版面理解、语义理解等多道难题,让机器像人类一样,动态实时学习更新。
正是出于对文本智能处理技术的极致追求,方成就了今天合合信息在该领域全球领先的地位。从名片识别、文档识别,到如今的一百多个模块识别,七百多亿条企业数据,合合一步一个脚印,通过STR+Data+AI的行业解决方案,赋能保险、证券、酒店、物流、o2o等行业,
助力企业缩减人员成本、提高行业效率。
分享最后,龙腾博士将多年深耕在人工智能领域的经验总结为一句话:
“垂直领域,扎深扎透。
日积月累,必成江河。”
A5创业网 版权所有