Aiello 犀动智能:一间台湾本土 AI 新创,要怎用「逐字稿」攻进智慧商业分析市场?

以 ChatGPT 为首的各式大型语言模型(LLM)与生成式 AI 正在席卷整个科技与网路业界 ,在这巨浪中,INSIDE 曾介绍过专精在自然语言处理的台湾 AI 新创「Aiello」犀动智能也没置身事外,打算从原本擅长的旅宿场景进入纯网路平台,在今年 5 月推出了线上语音转文字的 AI 平台「Vocol.ai」。

Vocol.ai 乍看之下跟不少逐字稿软体看起来相当类似,除了即时录音之外,使用者也可以上传是先录好的录音档,只要录音档音长十分之一的时间,Vocol.ai 就会自动整理出精准度颇高的逐字纪录与摘要内容给使用者,甚至连不同的讲话者讲了什麽,都能个别快速整理成摘要,十分方便。

而且根据笔者实测,Vocol.ai 也不能说成只是单纯的逐字稿软体,更是一组「线上协作」平台,不同使用者彼此之间可以互相开权限,让众人围绕在纪录文字上一起工作、纪录、下注解;不过,犀动智能创办人沈书纬对 Vocol.ai 的想像却不止如此。

从 BERT 走向混合模型

AI 处理自然语言在这几年的发展速度堪称搭火箭一样,从刚开始大众觉得很多语音助理还有点笨笨的、只能处理特定问题,到现在 ChatGPT 已经可以生成十分通畅、详尽(虽然不一定准确)的资讯。

作为一间处理语言 AI 的新创,犀动智能自然是站在海景第一排的位置亲身感受这一切,光是怎麽从专门处理旅宿场景的小犀智能音箱走到 Vocol.ai,就足以代表 AI 自然语言在这几年是怎麽进步的。沈书纬解释,2019 年创业之初所发表的小犀管家智能语音 AI 平台是基於 Google 在 2018 所提出的开源技术「BERT」所打造,犀动智能很直觉地将它作为单纯文本分类模型、不做复杂结构分析;再简言之,犀动只把 BERT 当作辨认关键字的工具,然後在资料库中找到事先预设好的题目,再用语音回答使用者。

Photo Credit:Aiello

Aiello 之前就以小犀管家智能语音 AI 平台,与各大饭店合作。

但语音转文字服务若想达到雅信达有皆有水准的境界,BERT 就不太够用了。因此在 Vocol.ai 这个新产品上犀动用上了具有 1,760 亿个参数的大型语言模型「BLOOM」,再跟自家的模型混合所打造。这麽一来,模型才能具备 Information Retrieval 的能力,可以在一段很长的对话去找出相符合的材料,然後生成相对应的文字给使用者。

OpenAI 全球第一批合作夥伴

在 ChatGPT 名声远播之前,犀动智能就已经是全球第一批获得 OpenAI 授权的 5 家公司之一,毕竟他们是一直是拿开源 NLU 在做产品的公司,所以本身就会对 OpenAI 里开源社群非常有兴趣,在 2021 年年初开始跟 OpenAI 进行官方合作,陆陆续续在两年内对开源社群出了不少力。

沈书纬特别回忆起 OpenAI 从 GPT-2 开发到 GPT-3 的过程:「我们当时有观察到 GPT-2 的自然语意理解(NLP)是很强,但是自然语言生成(NLG)却还差强人意;当时我们就意识到,如果 NLG 不够强,一般来使用者还是看不出来大型语言模型到底有什麽应用潜力、看不出来价值。」

「所以我们当时不只用 GPT-2,也用了开源的 BLOOM,两边都用;BLOOM 的好处是自己可以 host,但缺点是自然语言生成不够好,但 OpenAI 这里到 GPT-3 就回答得不错了,所以我们会把文本先在 BLOOM 摘要一次,要花费 token 时,再让 GPT-3 摘要一次,就能得到品质相当好的回答。」

沈书纬也笑称,等到台湾微软拿到 OpenAI 在台湾 approve partner list 时,才惊觉犀动智能其实就已经在上面了。

下一步:扩充至商业洞察

但就像很多新创会先推出 MVP 最小可行性产品、再不断扩充商业模式一样,对沈书纬来说Vocol.ai 当作语音转文字 AI 平台仅仅只是第一步而已,接下来的路是打入 B2B 的专业客服中心市场,并再从中摇身一变,成为专门从非结构化资料中,找出有用资讯的商业洞察平台。

▲Vocol.ai 理想中的商业模式发展图。

这种服务有种从 SaaS 变形而来的专有称呼,叫做 Contact center as a service(CCaaS),直译就是联络中心服务模式。大型企业通常有 500 到 1000 位客服,他们处理的问题分门别类、五花八门,专业程度也不一,除了要回应一般消费者的疑问之外,也有专门服务商业客户,或是直接回答技术问题。沈书纬解释但不管是哪种客服人员,都必须在每一通客服结束後用文字记录问题;因此导入 Vocol.ai 语音转文字,就起码可以省下每位客服人员至少一半的时间成本。

而且 Vocol.ai 是建立在 Azure 云上,每笔语音都能保留给客户,这麽做不仅能保护个资,也能用这些语音转出的大量文字与资料做巨量分析。「就算这个客户一个月有几千通电话好了,有了 Vocol.ai,就能在极短时间内,自动整理出客人最常抱怨、或是最喜欢的部分是什麽?又或是我们可以轻松找出今天这通电话跟三个月前某一通电话有所关联,这就可以把个案延续下去。」

不只是音档,Vocol.ai 甚至在公司员工同意之下挂在公司伺服器里,可以对所有像公司的 mail、合约、文字档进行统整分析,洞察出客户的底层需求;又或是像犀动之前深耕的旅宿产业,可以使用 Vocol.ai 去爬梳自家饭店与竞争者在 Google Map、Agoda 上的评价,然後做针对性的策略拟定。

「我们想做的,就是这种非结构资料的商机。」沈书纬最後说着,比起像众多软体大厂积极攻入的 B2C AIGC 市场,犀动此时却另辟战场,自己想用 AI 重新定义「云端客服中心软体」再开阔一片天。

openvpn是什么

About the Author

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论

You may also like these

0
希望看到您的想法,请您发表评论x