博客首页|TW首页| 同事录|业界社区
2019-06-13

北漂已久,身边接触的人其实大部分都是在说普通话,偶尔遇到一些老乡见面,才能听到一些乡音,其实也觉得亲切,只是这种机会越来越少了。不过大概因为年轻人交流说普通话越来越多,方言存在的场景越来越少,保护方言的声音才越来越强。只是如果大家不说,方言又能如何保护呢?越来越火的人工智能什么的,会对方言的保护有帮助么?阿里巴巴投资1亿推出方言保护计划,则让我们看到了一个新的可能。

“方言让你知道从何处出发,这就是家的感觉”

我是一个山东人,可以说也在一个方言大省,在大家的印象中,山东人的口音还是比较重的,而且地区之间的差异也比较大,在转变普通话这个环节,属于比较困难的省份,很多山东人都是因为普通话不太好,比较羞于开口跟人沟通。而遇到老乡的时候,则就是另外一种情绪的爆发了。不过,因为我是在石油企业长大,这里的人来自五湖四海,所以我反而没有什么乡音,只会说普通话。一方面,这让一些人感到羡慕,而另一方面,却让我少了很多归属,毕竟大家都是老乡,你却不会说人家的方言,感觉确实少了一种文化的归属。甚至,都可能很难让一些老乡相信你是山东人,觉得你是不是瞎编和我套近乎的。这个事情也算一个不大不小的困扰,毕竟我要说我是北京人或者东北人,也没有什么太大的问题。

一份《中国青年报》的调查表明,70.9%的受访者的家乡话是方言,而离开家乡后,就只有23.6%的受访者经常讲方言,剩下的人大部分都融入到了普通话的环境之中去了,而仅21.7%的受访者认为自己的方言讲得非常地道,所以总体看来,方言还是在不断消失的,比如从我这一辈再往下,家族里就很难有地方口音了,而我父母还都是有一些口音的。其实方言是地方文化最显著的特征,也是很多地方文化的唯一表达,有很多独特的词汇只属于某一种方言。而保护方言就是保护地方文化,也是保护我们的家乡,一旦一种方言不见了,这个方言背后的文化自然也就消失了。正如阿里巴巴副总裁陈丽娟表示:“语音不应该成为沟通的障碍,我很相信一句话,普通话让你走的更远,但方言让你知道从何处出发,这就是家的感觉。”对于方言的保护也引起了很多有识之士的关注,比如颇有语言天分的著名主持人汪涵,就曾经个人出资启动“響應”计划,保护湖南方言。 现在,他也加入到了天猫精灵方言保护计划之中,担任了方言保护的大使。

用人工智能做有温度的事情

尽管人工智能发展的如火如荼,但是其中有一个很重要的障碍就是方言。比如我说我用语音输入准确率超高,总有人恨恨的反驳说,那是因为你普通话好。言外之意,普通话不好的恐怕就没有办法享受到语音输入的好处了。相同的是,这种情况也出现在很多人工智能的互动上,虽然现在的语音识别非常厉害,人工智能产品都可以轻松地和人进行互动和沟通。但方言的障碍依旧存在,你普通话说得不标准,人工智能识别不出来你要表达的意思,自然也不会回复你想要的答案。从这个角度来说,方言其实是语音识别包括人工智能发展的拦路虎了。但是我们反过来去看,能不能让技术反哺文化,使其成为方言的保护者呢?而这个逆向思维带来的,就是天猫精灵方言保护计划了。

与其让更多人去纠正自己的普通话,倒不如训练人工智能去学方言,后者看似要麻烦些,但是训练一种方言就能惠及千百万人,其实也是划得来的。这次,天猫精灵就决定以四川方言为起点,开展一场轰轰烈烈的方言保护行动,让方言也能融入人工智能之中,去保护方言,不让方言消失。同时也能让更多人更轻松的使用语音识别和人工智能产品,这其实是开了一个好头。比如我的父母也是因为智能音箱识别方言的能力不强,导致一直没有办法使用人工智能的语音产品,让人非常着急。

5月24日,阿里巴巴人工智能实验室宣布,将于6月13日在四川举行方言大赛,届时,大赛的获胜者将获得一份特殊的工作——为智能音箱天猫精灵录制四川方言语音,成为四川方言版天猫精灵“声音模特”。这份工作报酬相当诱人,时薪就达到了700元,全录完的回报就要十几万,如果你四川话说的地道,这真是一个不错的发财契机。而这种鼓励,本身也是对方言的肯定,相信四川只是一个起点,其他地方未来也会有这样的机会的。

决战“天府之国”

选择四川作为这项活动的起点,我心里还是非常认同的。首先这是人口大省,其次也是人口输出的大省,显然普惠的人群也就更大。不过从另一个角度来说,我却觉得四川话是我最喜欢的几种方言之一,不但没有基础的人也能听懂,而且是少有的语音语调里就流露着幽默和乐观的方言。很多影视剧配上四川话之后,都会让你忍俊不禁,这种来自骨子里的幽默,其实特别吸引人。但实际上,爱吃辣的四川人不仅乐观,而且做事泼辣,在全国也颇有口碑和好评,所以选择四川话作为起点,相信大部分人也不会有意见的。

在过去三个多月的时间里,阿里从报名的1000多名应聘者中第一次海选出了5名选手,之后网友喊话官方要求参加,因此官方面向全川增加候选人名额,重启报名通道,所以最终共8名选手将在今晚的决赛集体亮相,角逐出“最四川”的声音,成为四川方言版天猫精灵声音模特。随着工程的加速,很快你就会发现天猫精灵可以说越来越多的方言了,让科技真正的去服务人,而无需人去迁就科技。这不仅会方便大家的使用,对于方言也是一个实质性的保护。最终全国说方言最地道的,恐怕就是天猫精灵了。就算你忘记了家乡话怎么说,都可以跟天猫精灵去学习巩固一下。以后挑战什么普通话的考试之类,估计都可以在天猫精灵完成了。据说天猫精灵APP还将在未来推出“方言博物馆”,对自己家乡方言感兴趣的用户可以在这个博物馆里上传自己的家乡话来建立保护方言的数据。

而且大家还可以亲自去观看体验天猫精灵方言大赛,在今晚8点开始,打开手淘,进入淘宝直播搜索“天猫精灵官方旗舰店”,看直播就能参与互动赢万元红包,这也是为方言事业贡献一份力量,期待你的参与。

2019-05-27

指数级存在的“摩尔定律”或许在芯片领域正在失效,可在人工智能领域,却在迎来第二春。

至少,对于商汤科技这个2014年才成立的人工智能公司来说,却非常有效。

作为全球估值最高的人工智能初创企业,商汤科技在5月15日的第二届人工智能峰会上,一口气发布了针对智慧城市、智慧健康、智慧零售、教育及AR五大行业的解决方案及11款产品。仅就产品数量上,较之去年峰会上的6款产品的发布量,几近翻了一番。

对于商汤来说,数量并非关键。这次发布关键点在于,其提出“将AI技术赋能百业”这一理念多年后,真正开始从试水走向全面进击。

刷存在感不是作秀,是基建

商汤科技的野心非常强烈,正如其联合创始人、首席执行官徐立的言语中,不断强调的一个关键词一般——存在感。

让人工智能技术真正在人们的生活中具有“存在感”,是商汤5大领域11款产品的核心卖点,但商汤却不想让存在感变成一次作秀。

比如此次发布的超轻薄设计的新一代SensePass工业级可视人脸识别门禁机,除了支持2万离线人脸库及0.3秒快速识别外,商汤要刷的存在感很简单:用最舒服的方式,让用户告别门禁卡。

顺便,也不用考虑手指上沾了水或弄脏了,就望着打指纹门禁各种不服了。

诸如这样的存在感,分散在其他10款产品之中,甚至还能相互关联。如徐立所言,“摄像头是打通的”,所以门禁后面的算法和技术完全可以和地产、交通等行业的需求打通,于是商汤科技的算法和产品可以赋能至城市生活的方方面面。

类似这样的存在感还有很多,因为商汤深谙AI技术未来将真正变成一种基础设施,不只在某一垂直行业起到作用,而是像水电煤一样渗透至各个行业。

在去年年末的中央经济工作会议上,就提出“基建的重心不再是房地产,而是城际交通、物流、市政基础设施,以及5G、人工智能、工业互联网等新型基础设施建设。”

而此次,商汤的人工智能显然不仅仅是作为数字化的基础设施而推出产品,更是在经济工作会提出的新基础建设领域进行了多元渗入:智慧城市涵盖了城际交通、物流、市政等基础设施,智慧健康、智慧零售和AR则和工业互联网、5G等息息相关。

而且,按照商汤的说法,此次发布的针对五大领域的标准化产品都是经过商业化验证的应用。

换言之,都是落地就能达成商用的“存在感”。但到底是什么,让商汤能够如此之快的完成落地试水到商业化验证的迭代呢?

“赋能百业”背后的秘密

商汤的秘诀在于算法,基于智能视觉的原创技术。这是一种进军百业的能力,也是技术的必然趋势。

去年9月,科技部宣布依托商汤集团建设智能视觉国家新一代人工智能开放创新平台,可以视作是一次官方认证。

至今,获得这一国家级认证的,除了商汤外,只有阿里、百度、腾讯和科大讯飞4家而已。

但这并不是商汤能够领先于其他AI平台,向百业赋能的关键。真正的秘技在于“视觉”二字。

人工智能很大程度上是在模拟人类的认知和决策。而国外研究表明,人们获取的信息中有83%是通过视觉接收的。

显然,选择智能视觉为突破口的商汤,在信息接收上,要大大超过其他感知模式的范畴(听觉、触觉、味觉和嗅觉)。

视觉这一概念也被商汤变成了一种理念。在徐立看来,商汤科技在其核心能力圈恰恰是极度聚焦的。“商汤拥有人工智能的底层训练平台和训练工具链,当面对新的应用场景,商汤可以用一种系统化、工业化的方式去生成针对场景的应用,甚至算法模型本身都能够做体系化的优化。”

商汤的招式看似简单,其实很考验基本功。因为任何一个领域的渗透,其背后都是依靠商汤的深度学习平台SenseParrots及其上搭载的算法迭代。简言之,就是基于视觉的算法,去各种未知领域学习和获得知识。

但商汤也并非盲目的切入。每一个垂直细分领域,对深度学习的要求均不相同。为此,商汤做了充分的准备。

比如AI医疗领域,商汤早早的就在专业领域做好了储备,在突破口上也颇为差异化。当下,在医疗领域的人工智能体验大多聚焦于诊断环节,主要是提高阅片的效率、减少漏诊误。换言之,想要在诊断上达成人工智能对影像科医生的直接替换。但在医学这一本身未知范围极多、经验和科学并重的领域而言,却显然无法达成“毕其功于一役”的终极体验,商汤的“存在感”则略微不同,其主要侧重于凭借着领先的深度学习算法与医学影像高级后处理技术,做到为全院临床科室提供赋能诊疗愈全流程的平台产品。如在骨肿瘤治疗等具体操作环境,传统的骨肿瘤3D打印治疗规划难度大且医工交互时间长,需影像科医生、骨科医生及3D打印工程师一起经过多番研讨后最终得出一套治疗方案,长达数周的讨论过程可能会延误病人治疗。而商汤所推出的SenseCare智慧诊疗平台后,绝大多数环节均由人工智能完成,只需要医生登录SenseCare平台在线确认AI结果,3D打印工程师即可异地直接进行模型打印,这使得治疗规划效率大大提高。

这恰恰是基于视觉的人工智能深度学习所能达成的,亦是帮助医生提高效能所迫切需要的。而类似这样的智慧诊疗,通过算法模型的快速迭代,以及不断在实践中采集各类临床案例,进而达成对经验和学科的模糊边界的更精准掌握。

“像这种老医生你要把他的知识传递给机器,那就不是一言两语能讲清楚的。”徐立的话语里,就透露出了智慧医疗所要深度学习的关键所在。

相似的,在此次商汤进军的另外4大领域,通过“视觉”学习和实践来达成落地和赋能百业的效果。正如徐立所说,AI会变成一种通用性的、工具性的东西,应用到行业当中去,用一条标准化往下赋能,一定是指数级别增长的,“我说赋能百业一点都不奇怪”。

经过商业化验证的应用,唯有落地,才能更好地找到自己的存在感。顺便,也让在主干线上进行深度学习的算法,能够通过百业里的百态,获得更多的交叉信息,真正形成百晓生一般的“超算”。

实现破界,商汤的下一个野心

商汤在进军百业赋能上的渴求,未必仅仅只是学习,或许还有破界的谋划。

在商汤的计划中,有三个阶段,分别是人才积累和算法打磨阶段、和垂直行业头部企业探索AI落地阶段,以及通过产品标准化和落地规模化、开启AI规模化赋能元年阶段。

当下商汤已然进入到了规模化阶段的初期,但此刻它已经在为第四阶段做准备。

破界,或许将是在本阶段,商汤赋能百业中深度学习的方向所在。这本是商汤科技创始人汤晓鸥所提出的“大爱无疆”理念中的关键词。

教育是一个显而易见的破界点。专为AI教育研发的学习平台SenseStudy AI实验平台,拥有了和《人工智能基础(高中版)》、《人工智能入门》教材配套的实验软件包和其他相关的课程实验软件包。

切入教育领域,一方面展示了商汤对于未来人工智能人才培养储备的前瞻性,一方面也体现了商汤平台战略在教育领域的赋能。通过学校场景,打通更多的细节,比如说校园门禁,又或者说融合在校园环境里的智慧场景,以及AR体验下的各种脑洞呈现……都可以是在教育领域形成跨界融合和垂直细分的新“知识点”。

更多的场景,更多的百业状态,以及在赋能百业中挖掘出来的更多跨领域的“结合地带”,就让商汤的算法有了更多深度学习和挖掘破壁可能的契机。

用徐立的比喻或许更能说明问题,商汤此刻在做的,是“书同文、车同轨”,即在算法上依靠智能视觉形成一定之规,并散布到百业之中;然后呢,在百业之中进行深度学习与吸收,在保持“书同文、车同轨”的主干线的前提下,进一步打破行业的壁垒,超越现在赋能百业以提升效率为主的形态,而进入到更多交叉领域的破壁之中,让“一定之规”成为过去难以开掘的交叉领域,能够快速实现存在感和获得感的精准法则。

“无疆是指人工智能本身不是一个点,它一定要融合。”徐立对商汤的布局毫不隐晦:无疆,就是它能够打破行业之间的壁垒和行业之间的点,并能够真正意义上作为生活中的基础元素,最终达成最大影响。