首页 >> >> 信息发布 >> 正文
一波未息一波又起,灵云OCR再掀智能图像热潮
通信世界网 http://www.cww.net.cn 2014年6月9日 15:25
标签:灵云科技
 

     编者按:2013年炒得最热的不是房地产,而是智能人机交互技术(HCI)在IT圈的极速扩张。国内的互联网大佬代表BAT在搜索、电商、移动等各个领域抢滩攻地,在智能人机交互(HCI)领域炒得更是火爆,从百度首先战略投资国内第一大智能语音技术开发商捷通华声开始,就已打开了智能语音五彩的市场;然而随着2013年沸沸腾腾的语音热潮逐渐退去,2014年图像识别热潮又开始幕天席地而来,其中以OCR技术尤为瞩目。

  OCR(光学字符识别)技术隶属图像识别技术的一支,也是HCI技术领域最早实现商业化的技术,早期多用于办公文档录入与金融、保险等大型企业的票证识别系统,然而近年来随着智能移动端的迅速发展,OCR技术已在潜移默化中从To B端延伸至To C端,被广泛地应用于各个领域、各项软硬件中。

  放眼国外,近日来有iphone6 ios 8系统透露的用户信用卡扫描功能以及微软SkyDrive欲推出的OCR搜索的消息。

  而国内BAT三巨头也马不停地相继推出OCR相关服务和产品,例如百度的涂书笔记、腾讯微信智能开放平台开放图像识别端口、阿里提出的深化手机应用概念。

  这是否预示着2014年将是OCR技术重新迸发活力的一年?

  语音热潮渐消,OCR后浪迭起

  众所周知,2013年是APP全面攻陷国民智能移动端的一年,其中尤以智能语音交互技术炒得轰轰烈烈,在苹果siri引爆语音识别后,国内在这一领域的技术先驱企业捷通华声、讯飞等更是奋力直追,打造出更符合汉语言习惯的智能语音交互技术;而在语音合成(TTS)技术方面,一直作为国内TTS技术领导者的捷通华声更是在2013年因其灵云平台(hcicloud.com)推出十几种国际语言合成技术,满足全球90%地区的语音合成服务而独领风骚。

  然而信息技术瞬息万变,在智能语音刚被推上一个新的关注和应用高度的时候,OCR等智能图像技术又顺势创新应用于各领域,引起业内的广泛关注。

  在国内,OCR技术商品化最早成熟于上世纪90年代,对于行业内人士和金融通信类企业来讲并不陌生,那时多应用于文本自动录入与证件和表格扫描,以便减少人工录入成本。

  然而,现今随着云计算、大数据时代的到来,各行业各领域的单位和开发者对OCR技术的需求也越来越多样化,大至银行海关证照,小到淘宝店主收支票据,而智能移动端的迅速发展正给OCR便捷化、普遍化提供了可能和新的发展机遇。

  OCR再次以其独特的录入方式而成为互联网新的入口,引发了产业界与各大IT大佬的广泛关注,不断的产品与技术创新比拼,使OCR技术在2014年重又走上了IT舞台的中心,在HCI技术领域,继智能语音之后,一场智能图像领导者的争斗战再次打响。

  捷通华声“云+端”OCR,满足用户多样化需求

  捷通华声OCR首席技术官李健表示:“在国内,OCR技术已发展了数十年,而我们对该项技术的研究也已积累了数十年的调研数据和实践经验,无论是识别率、识别速度、用户界面的友好性,还是产品的稳定性、易用性及可行性等,都足以与国内外IT巨头抗衡。

  自2011年,捷通华声推出国内外第一个全方位HCI技术云服务平台灵云后,灵云OCR系统发挥灵云“云+端”的优势,可满足用户多样化定制需求,为OCR技术的应用提供了比以往任何时候都宽广的发展空间。传统的OCR软件只是通过单一的终端设备,无法联网,应用、操作较单一;而灵云OCR系统则可通过灵云服务全方位拓展应用领域。如:每年我国有众多数字图书馆建设中的大量纸张数据信息,所有银行、税务局、保险公司的大量票据,公安边防海关等部门的各类证照卡数据信息等等,都需要输入到电脑里并做分析存储,几乎可覆盖到国家及各部委的所有重点行业领域。与此同时,新兴的商业及个人应用与服务市场更是一个巨大的市场空白,捷通华声灵云OCR在这一即将成熟的领域已抢占先机。”

  捷通华声OCR前景展望

1

  作为国内高新技术民族企业的代表之一,捷通华声成立伊始就已专注研究智能人机交互技术(ASR、TTS、HWR、OCR等等),在智能图像中另一项代表性技术手写识别的市场已成功占有国内近50%市场份额,尤其是在智能手机端,其应用市场份额更是超过了这一领域的竞争对手。伴随移动互联网、电商等产业发展,OCR在移动端的应用将满足当下日益成熟的终端支付系统对便捷性、安全性的需求。在不断完善OCR多样化应用的同时,捷通华声也正在发力开发更完善的图像识别技术,除了支持票证表格文字的识别,还将实现图片、企业LOGO、人脸实景等更多元化的识别技术。

  2013年,捷通华声与清华大学达成的战略合作,为捷通华声发展OCR等智能图像技术奠定巨大的技术优势。在智能图像研究的学术领域,清华大学一直拥有国内OCR等智能图像技术研究的领导者地位。如今,捷通华声在OCR、手写识别等智能图像领域与清华大学智能图像重点实验室展开合作,双方将充分发挥灵云平台优势,不仅将在证照、表单等传统优势产业应用中推广OCR技术,同时将大力推荐名片识别等产品技术在移动互联网中应用与推广。

  相信灵云OCR在清华大学的全力支持下,这场智能图像热潮将更加精彩!

  灵云科技、源自清华、服务全球。通信世界网

 

来源:综合消息
相关文章
 
文章评论
 
    昵称:  验证码:
 
关注通信世界网
 
 
官方微信
“cww-weixin”(或扫描下图二维码),即可于获得独家的CWW视点分析、最新的通信资讯。
 
 
专家观点
邬贺铨:频率紧张限..
“中国移动说今年要建20万个基站,到时就超过其他国家4G基站总和。但是..
 
 
最新专题
  • 1

  • 1

  • 1

  • 1

通信百科
 
华为IDC/ISP信息安全管理..
IDC需要加强信息安全管理互联网接入服务管理是互联网管理的重要组成部分..
 
 
 
新浪微博 腾讯微博 微信 rss
人民邮电出版社
工业和信息化部
人民邮电出版社图书专营店
中国通信企业协会
中国通信学会
中国互联网协会
无线电频谱管理中心
工业和信息化部电信研究院
中国通信标准化协会
中国移动通信联合会
中国邮电器材公司
中国电信
中国移动
中国联通
中国信息协会信息服务网络委员会
爱购服务器之家
新浪科技
搜狐IT
腾讯科技
凤凰网科技
人民网无线频道
中国通信网
移动Labs
中华电子网
通信产业网
企业网
In-Stat
IT价值联盟
中国软件资讯网
通信人才网
慧聪通信网
CTI论坛
CIO选型网
CTO技术网
美通社
赛立信竞争情报网
CRS通信学社
ZDNet至顶网
和讯科技
博趣·兴趣门户
呼叫中心频道
运营与增值
信天下企业短信
新电子
OFweek光通讯网
中云网