嗨,欢迎来到阿拉丁指数
  • 登录注册
  • 我的收藏
  • 管理中心
  • 免费
    收录

  • 众号

    扫码关注公众号


  • 程序

    扫码体验小程序

  • 在线
    客服
  • Top
小访谈 | PV超1000万,看科大讯飞如何用社群玩转语音黑科技(086期)
100000+浏览 · 2018-09-13

用社群玩转AI黑科技

语音识别可以说是科大讯飞的看家本领,在小程序领域它的表现如何?科大推出五个小程序,PV超千万,其中讯飞留声的卡片回流高达1带7。

本次访谈,我们邀请到科大讯飞音频娱乐事业部总负责人康融,为我们讲述她们小程序背后的故事。

731894056869730213.jpg

本科院校:西安电子科技大学(通信工程专业)

硕士院校:英国University of Southampton

以往就职:中国移动

目前职位:科大讯飞科大讯飞音频娱乐事业部总负责人康融

工作内容:在科大讯飞期间主导语音助手灵犀(中国版siri)的产品运营工作,并带领团队实现语音合成技术商业化,推出虚拟主播服务并广泛应用于媒体,广电,出版及智能客服领域,在人工智能行业具有丰富的经营管理经验。

「科大讯飞」

转变思维,用社群为科技开疆拓土

2017年9月,科大讯飞推出首款小程序「讯飞快读」,这个时间并不早,因为小程序早在2016年底上线。这款小程序主要运用讯飞多年研究的TTS语音合成技术,可将长文字进行高度拟人化朗读,朗读出来的效果媲美真人,广泛适用于订阅号朗读,商业配音,课件朗读,小说朗读,文档朗读。

为何要布局小程序?康融解释「主要是考虑将小程序作为展示讯飞黑科技的窗口之一。小程序由于体量更轻,会促使产品团队更加聚焦核心功能,从而快速迭代、快速验证。小程序好比是排头兵,会为讯飞其他形态的产品起到示范甚至试错的作用。」

但是这个排头兵在初始的半年里,表现一直很平淡。一直到2018年3月,讯飞快读才有了第一次小幅度增长,这主要得益于一次PR和功能调整。而这个调整主要是上线了留声的技术,音库和新闻板块。

而真正的大幅度转折是在6月-8月,用户环比增长40%。这次,科大转变了思维,开始关注小程序生态的关键增长点——社群。

对于社群的运用,康融谈到「首先是寻找核心用户。科大在此进行了创新,采用邀请码派送合作,邀请种子用户进驻,与社群群主和博主合作,进行邀请码的发放,同时建立自己的粉丝群,慢慢就知道用户在哪儿。通过这些社群,可以总结出来一些大家共同的诉求。」

产品矩阵.jpg

以下为本次采访的精彩部分:

灯妹儿:最近《中国新说唱》人气榜排名第一选手小青龙和「讯飞留声」合唱一曲工作之声——《中国新工作》,挺有意思的,能介绍下其中的留声技术吗?

康融(科大讯飞音频娱乐事业部总负责人):留声技术早在2017年底出现,依托的是个性化语音合成技术,而合成技术在科大讯飞早已十分成熟,也一直处于行业领先位置。我们今年又再次获得国际语音合成大赛的「全能冠军」,这已经是科大讯飞在这项赛事上的13连冠了,它能让花费2小时的数据量变成5分钟处理完毕。

也就是说,10段话,5分钟就可以让机器完成学习。普通人就可以留下小朋友变声前的声音,留下父母的声音,留下喜欢人的声音,像拥有了独家的声音博物馆。但是为什么这几年开始在C端市场初露鳌头,最大原因还是语音交互在整个消费市场的兴起,这几年有声电台FM,有声书,短视频的迅速发展给我们带来了很多机会。

99.jpg

讯飞快读的出现就是为了让更多喜欢有声内容的听众可以随意听他们想听的内容,讯飞留声则是为声音赋予个性化,只需要通过10句话就可以将一个声音复刻出来,随后授权到身边有声应用中,让万物有声,并赋予情感。

灯妹儿:说起「讯飞留声」,它的上线时间是6月底,和技术相比,时间似乎有点晚。

康融(科大讯飞音频娱乐事业部总负责人):任何高科技在不同载体上的落地都需要反复试错校验,所以它的开发时间并未像其它小程序那样,一两个月完成,而是整整半年的时间。

其实小程序的技术并不复杂,问题的关键在于小程序这个产品形态如何和黑科技融合。同一项技术,在不同场景下的成熟度完全不同。需要花大量时间去了解在小程序生态上。

人工智能需要达到怎样的水平?性能多高才好用?在哪个细分场景?这个场景有多少用户群?这是我们在开发过程中的思考,尽量保持客观理性。这也得益于公司内部的氛围,集团会定时让我们的产品开发人员聚集在一起,互相PK一下想法,冷静看待外界口中玄乎的人工智能。

灯妹儿:对于黑科技载体(APP、H5和小程序)的选择您是怎么考虑的?

康融(科大讯飞音频娱乐事业部总负责人):智能小程序是移动互联网发展的一个阶段,它降低了用户使用的难度,节省了用户时间,但我认为最重要的是它给予了开发者更多的机会。

在过去我们希望将一些好玩的黑科技展现给大众,而做APP面临着较大的开发成本和用户教育成本,做H5又无法很好的沉淀用户,小程序则是一个发布黑科技更优选择。

H5就像是百货的传单,很多传单给到客户还没了解就被摒弃,小程序则像一个试衣间,客户在试完衣后会留下自己的尺寸和爱好偏向,方便更好的进行下一次服务。在小程序沉淀用户时,我们很注重实用性和高频次,例如讯飞翻译,我们更多的是解决用户生活中常用的外语交流问题,工具属性很强。用户使用后就会把小程序钉在常用栏上,方便以后使用。

另外,讯飞留声是一款很特别的产品,它可以通过几句话的录音,模仿一个人的声音,因为声音的IP属性很强,很多制作完音库的用户会回平台上查看自己的声音,我们也定期开放一下语音包,让大家挑战一些在生活中说不出的话,例如绕口令,方言,小语种等,后面我们会绑定更多的语音应用。

44.jpg

科大讯飞团建

灯妹儿:既然选择了小程序,那么对于整个产品矩阵是如何考虑的?

康融(科大讯飞音频娱乐事业部总负责人):现在讯飞的小程序有讯飞快读、讯飞翻译、讯飞在线商城、讯飞留声、躺倒鸭人人测,前三者都是偏工具类的,希望能切实解决用户生活上面临的问题、提高工作效率等。

而讯飞留声是一款偏互动性的应用,目的在于让大家能更好的体验智能语音黑科技,玩出更多的花样。未来,讯飞留声会将娱乐性和实用性相结合,运用到各种生活场景中。

灯妹儿:您认为小程序产品矩阵能发挥怎样的优势作用? 

康融(科大讯飞音频娱乐事业部总负责人):小程序在跳转这块有着较大优势,但是现在的跳转很多都是以互相导量为主,不相关的产品进行用户互导,这很伤害用户体验。

我们希望小程序的矩阵是生态型的,比如讯飞翻译里面如果想切换音色,可以跳到讯飞留声。讯飞快读的用户需要翻译,可以跳到讯飞翻译。在这样一个有关联的生态下,逐渐地布局我们的C端应用。

灯妹儿:讯飞之前一直是面临B端的,对于C 端用户您有什么感悟和思考?

康融(科大讯飞音频娱乐事业部总负责人):讯飞有很多世界领先的技术,但很多新的技术仍需摸索,所以最初我们结合B端帮助行业进行商业化落地。这个阶段我们更注重成本与效率,不过中间也经历了很多为了发布技术而赶新品的情况。但对于C端用户来说,实用性和易用性才是他们短时间内可以接受一个产品最重要的因素。

赶新品的方式导致产品的用户体验比较粗糙,让用户误以为技术不过关,对新的科技产品失去信心,就失去了教育市场的作用了。所以我们做C端产品时,希望通过迎合用户习惯的使用模式,更低门槛地让用户在场景里感受黑科技,才是重点的方向。

讯飞留声.jpg

灯妹儿:对于面向C端的小程序,你们看重什么数据指标?

康融(科大讯飞音频娱乐事业部总负责人):讯飞翻译最看重用户的翻译使用频率以及分享率,从产品上线初期就考虑了一些可能带来传播和分享的点,比如我们会鼓励用户生成自己的翻译语音记录卡片到朋友圈,其他人长按扫码就可以进入小程序听到他分享的翻译语音和译文播报,可以很好的重现一句有趣的四川方言是如何被机器翻译成英语。为了提升分享卡片回流,我们设立阶段北极星指标集中优化卡片的交互和UI,目前卡片回流是1带7。

灯妹儿:说起分享,就想起微信对违规的惩罚,您能分享些经验吗?

康融(科大讯飞音频娱乐事业部总负责人):我们在新功能设计中,有两个经验可以分享,首先会参考是否有同类产品成功上架并运营,如果有,有什么可以值得借鉴的。另外,我们会去小程序开发者社区查看申诉帖子,查看哪些问题被多次提起,从而完善自己的产品。主要通过这两点避免新功能设计上的违规。

写在最后

感谢科大讯飞音频娱乐事业部总负责人康融为大家带来的干货分享,讯飞留声是基于讯飞全球领先的智能语音合成与个性化技术,为用户提供个人音库定制、音库应用等服务的专业化平台,未来留声可以广泛应用于车载导航、阅读、游戏娱乐、智能家居、早教玩具等与生活息息相关的领域。期待讯飞留声上线更多新功能,在现有的成绩中延伸更多的创新!

文章来源:阿拉丁指数

76085234430045026.jpg

THE END

本文章仅代表作者观点,不代表阿拉丁官方立场,本文系作者授权 阿拉丁指数平台 ( aldzs.com )、阿拉丁指数公众号发表,未经许可,不得转载。

小程序推荐