捷通华声灵云智能平台助力“智慧城市” 编者按:随着云计算、大数据、LBS服务、物联网、人工智能的兴起,“地球村”的定义日益清晰,而“地球村”的有力组成部分——“智慧城市”也在瞬息万变的数字革命中不断日新月异,改变着数以十亿计人类的生活、工作。寰宇全球,目前仅有七个城市被评为“智慧城市”,亚太地区只有两个城市被选中,中国地区占数为0,因此,“智慧城市”也成为“中国梦”的一部分。然而,如何实现呢?
《智慧城市发展白皮书》中提到:“智慧城市包含着智慧技术、智慧产业、智慧(应用)项目、智慧服务、智慧治理、智慧人文、智慧生活等内容。对智慧城市建设而言,智慧技术的创新和应用是手段和驱动力,智慧产业和智慧(应用)项目是载体,智慧服务、智慧治理、智慧人文和智慧生活是目标。”
从中可以看出,如果说[智慧技术]是智慧城市建设的根本条件,那么人工智能技术就是驱动智慧城市健康快速发展的创新动力。因此,如何做出高智能并贴合人类生活的人工智能技术应用才是目前亟需解决的首要问题。目前国内在这一领域做人工智能技术研究与应用推广的单位寥寥无几,并且比较粗放零散,并不能形成整合全面的人工智能技术解决方案支撑智慧城市建设。直到2014年初,这一块的问题才得到了有效改善,初始原因是以清华为依托学府派高新技术产业代表——捷通华声,这在地产界、财经界、IT界等多个领域引起了热烈议论。
特别是在今年7月份,捷通华声全面改版灵云平台(全方位人工智能技术整合开放平台),面向国内数以万计的智慧城市建设者、企业免费开放了智能语音识别(ASR)、智能语音合成(TTS)、智能手写识别(HWR)、光学字符识别(OCR)、智能客服(NLU)、机器翻译(MT)等多个可以有效改变现代城市生活的人工智能交互技术,并且提供“云+端”定制化跟踪服务。
这意味着国内首个智慧城市建设技术解决平台得到了实现。
灵云人工智能与智慧城市的契合点 灵云智能语音识别(ASR):捷通华声是国内最主要的语音识别技术供应商,灵云语音识别技术已广泛应用于车载导航、智能家电家居,操作设备只动嘴,不动手。语音识别,就是让机器通过分析和理解过程把语音信号转变为相应的文本或命令的尖端技术。该项技术可被应用于城市建设中的多个领域,例如智能移动端的语音助手(京东手机客户端)、智能家居的室内语音操控、智能驾驶中的语音指令等等,只要你想到的地方基本上都可以应用到这一便捷智能的技术。
灵云智能语音合成(TTS):捷通华声是国内历史最长的语音合成技术供应服务商,灵云智能语音合成技术经过十多年的迭代更新,灵云平台已全面支持中文普通话、粤语、维吾尔语及英语、法语、俄语、西班牙语、意大利语、阿拉伯语、德语、葡萄牙语、日语、韩语、印尼语、泰语等13种语言,覆盖全球90%以上的国家和地区。并且最大程度的贴近真实自然的人声。语音合成是通过机械的、电子的方法产生人造语音的技术,这项技术可以应用于智慧城市建设中的各类电器中,例如厨电安全上,通过智能感应,厨电将通过更加明晰地告诉屋主室内何处漏气失火,避免慌乱;而智能驾驶方面也可以通过语音播报,释放双眼,从而方便得知汽车各个部分零件的运行状态。近日,携程网呼叫中心的语音导航中已嵌入该模块,成为国内首个应用灵云智能语音合成技术的在线旅游服务网。
灵云智能手写识别(HWR):捷通华声手写识别技术占有国内50%的市场份额,灵云HWR支持92种国际语言。手写识别(HandWriting Recognition)是指将在手写设备上书写时产生的有序轨迹信息化转化为汉字内码的过程,可识别各类笔迹,可应用于各种智能终端文字书写、无纸化办公。
十几年的发展,捷通华声灵云手写识别技术在国内处于领先地位,已为各行业软件与手机、PAD等移动设备厂家所熟悉,为亿万大众提供高效、准确、方便的手写识别服务。灵云手写识别技术不仅支持92种语言,行/叠写支持中、英、日、韩等多国语言,支持中文、英文、字母、数字混合输入,并且支持50多种笔势识别,同时为了满足用户对笔迹的不同需求,还提供对钢笔、铅笔、毛笔等多种笔形的支持,力求将手写技术做到技术与艺术、文化的完美结合。
灵云光学字符识别(OCR):捷通华声核心团队早在上世纪90年代就在清华大学推出国内首款实现商品化的OCR技术产品。OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。目前灵云OCR以更优异的OCR识别能力,支持票据、证件、表格、图文等各类文件的扫描识别,在国内各大银行、通信等大型企事业单位得到广泛应用,大大提高了办公效率,降低人工录入失误率,是将来办公智能化的一个主要发展趋势。
灵云智能客服系统(NLU):该系统是在大规模知识处理基础上发展起来的一项面向行业应用的智能客服系统,它是一个涉及多种先进技术的综合体(大规模知识处理技术、自然语言理解技术、知识管理技术、自动问答系统、推理技术等等),具有行业通用性,不仅为企业提供了细粒度知识管理技术,还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段;同时还能够为企业提供精细化管理所需的统计分析信息。灵云NLU通过语音质检的升级与创新,可有效监测人工智能客服服务态度,并极大化降低人力物力成本。随着电商、物流、微商的快速发展和日益多元化,智能客服也是时代发展潮流一个主要趋势。
捷通华声灵云智能客服已成功为国内数十家银行提供智能客户服务,让数亿大众轻松了解银行各种服务信息,近日,又成功中标浙江高速公路,率先在国内公路交通系统提供智能客户服务,帮助用户及时了解交通拥堵情况,将极大方便大众出行,缓解公路压力。
灵云机器翻译(MT):旅游服务是智慧城市必不可少的展现,机器翻译就显得尤为重要。在清华大学的支持下,灵云在今年7月推出中英互译系统,一经推出就受到社会大众的广泛欢迎。机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理 (Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解( Natural Language Understanding) 之间存在着密不可分的关系。随着移动互联网的加速扩张,各个国家之间的联接更加简单和亲近,而MT充当着两者之间的桥梁,转换传达着双方的意图。
灵云智能平台自2013年向社会全面免费开放以来,灵云语音识别(ASR)、语音合成(TTS)、图像识别(OCR)、手写识别(HWR)、自然语言理解(NLU)、机器翻译(MT)等六大技术能力得到产业界、开发者的广泛认同,并助力百度导航、搜狗导航、导航犬、嘀嘀打车、快的打车,天行听书、汉字英雄成为家喻户晓的移动经典应用,也让超过3亿社会大众轻松体验到智能人交互技术的服务,感受人工智能无限的魅力。不仅在移动互联网领域,面对产业与行业应用,捷通华声推出了灵云智能语音、智能图像、智能客服等多种智能解决方案,并以广泛应用于金融、电信、能源、教育等领域。相信也一定会在中国智慧城市建设中发挥威力。
捷通华声灵云智能平台依托清华科技,为灵云智能平台全面服务中国智慧城市建设奠定了更加坚实的基础。2013年,清华大学产业基金入资捷通华声,捷通华声自此完成并确立与最高学府清华大学新的战略合作关系。未来发展,捷通华声将发扬清华大学在国家科技进步、国民经济建设中的强大推动力与影响力,全面推进灵云发展战略,共同实现“灵云科技 源自清华 服务全球”的发展规划,为中国人工智能产业的发展做出应有的贡献。
|