2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > “智能语音助手”的竞品分析 —— 你好小悟小爱同学(2)

“智能语音助手”的竞品分析 —— 你好小悟小爱同学(2)

时间:2020-05-16 15:09:52

相关推荐

“智能语音助手”的竞品分析 —— 你好小悟小爱同学(2)

关于难点

技术:

ASR:
对于ASR来说“远场”、“纠错”、“全双工”是3大难点;在“远场”上,是智能音箱们需要优化的问题,包括拾音后的预处理,以及对声源定位来保持对话的连续性是提升体验的关键;在“纠错”上,不同地区用户的口音各异,对AI数据、算法、算力都进行了考验,如何获得更多语料来建立不同口音的模型,如何以更高效的算法配合算力来快速识别出用户说的话并准确“纠错”,反应了产品的精准性,这非常重要;在“全双工”上,提前领先的厂家会以“全双工”作为其核心的竞争力之一,因为现在市面上大多的“智能语音助手”都是ONE-SHOT的能力,每次都要唤醒或操作的对话体验非常糟糕,“全双工”提供了相对流畅的多轮对话体验,但目前如何做好“全双工”还是比较困难的,这涉及了对话后该不该保持对话打断的灵敏度等因素。
NLP:
对于NLP来说应该就是语料库的积累以及建模,同时还有上下文理解的能力,时下因为大多的企业不具备足够海量的数据的累积,AI反应出来的格式化还是非常的明显的,同时回溯的能力基本上等于0;通过我的了解,不少做语音的公司起步时是以NLP来切入的,其他能力接第三方,而对于NLP的底层技术,用的是SVM这种浅层机器学习算法来分的,这意味着灵活性大打折扣,也很难具备自主学习的能力;所以在这一点,具备灵活性,同时能通过上下文理解的能力来理解,甚至引导用户,应该是优质的“智能语音助手”需要具备的能力,这一点国外的一个软件叫做“Replika”做得还是很不错的(它可以流畅地主动引导用户进行对话),至少国内没有一款我体验过的“智能语音助手”在闲聊式的对话体验上能够与其比肩。
TTS:
在TTS上,主流的是“合成法”来合成语音,这样成本更低,但是带来的体验还是机械感十足、不自然、不人性化,虽然这并不是用户选择产品的重要因素,但是随着智能化达到瓶颈,这一块或许也将成为一个竞争的差异化点,不能忽视;未来的趋势也必然是“合成法”来输出语音,所以难点还是在于“算法”上,如何模拟出对应语境、情感的机器声音,据说谷歌提出的一个TTS算法在这方面有很大的改善,是以深度学习算法来拟合声音的,所以国内在技术上还是可以基于深度学习的思路来在这一块上有很大提升空间的。

产品化:

在产品方面,难点还是如何提升用户数量,来增加行为数据;对于任一的单个公司的产品而言,时下的用户规模还是不够多的,需要在在技术上不断优化“智能语音助手”的前提下筑起壁垒,不断寻找更贴近用户的场景;对于已经落地的产品来说,不断打磨优化自身,来对应核心用户的不断演变的需求,与此同时还需要加入运营的手段了。

商业化:

对于商业化,难点则是在于如何让B端和C端用户买单;时下许多AI公司开始与IOT设备厂商合作,来借助IOT硬件的规模化来放大自身价值,也有开始搭建自己的OS平台,通过SAAS的方式提供给B端用户,这都是需要自身实力硬了之后去拉业务,应该还是比较难的,要说服对方为什么要选你而不是大厂,而其中小厂在定制化上的执行力、竞争力就非常重要;对于纯2C的“智能语音助手”,我暂时还没有看到有好的商业模式,只能设想一下,是否它们在接入第三方软件并实现用户操作或付款后,第三方会以佣金的方式回馈,其次我发现我将要竞品分析的纯2C的“你好小悟”有一个比较隐蔽的操作,就是在这个“智能语音助手”上进行的所有O2O都需要先在软件上充钱,重点是这笔钱不能提现,这是不是就意味着公司的盈利模式就是拿着大量用户充值的钱去做一些投资理财来赚钱?(假设有20万用户,每人100块,来保证这个动态的现金流在2000万,去放一些高利贷或者P2P等一些风险理财,10%以上的年化,只要操作得当也能实现正向的盈利,这对于公司的一条小的产品线来说,公司一年也能多赚几百万呢,还是不错的)。

(未完待续)

“智能语音助手”的竞品分析 —— 你好小悟&小爱同学(1)

“智能语音助手”的竞品分析 —— 你好小悟&小爱同学(2)

“智能语音助手”的竞品分析 —— 你好小悟&小爱同学(3)

“智能语音助手”的竞品分析 —— 你好小悟&小爱同学(4)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。