当前企业语音技术的发展现状:对Enterprise Connect的前瞻性分析

语音技术是一个范围广泛的话题,就像现在的许多其他事物一样,它正被人工智能所驱动和定义。可以说,人工智能已成为技术领域最被滥用的术语,但它仍在不断将语音技术提升到新的水平,远远超越了传统技术,而且所需的时间更短。这是我第六年在 Enterprise Connect 上对企业语音技术进行年度更新,自 2023 年以来的变化是我开始跟踪这一领域以来最深刻的。

我的更新一直侧重于语音技术的企业用例;这不仅是因为它与 Enterprise Connect 会议的主题一致,还因为这些用例不如联络中心的用例那么为人熟知,而联络中心正是大多数厂商关注的焦点。这种关注当然是有道理的:企业用例遍及整个组织,在人工智能的推动下,它们正在发挥比语音转录或虚拟助理更大的作用。

作为 UCaaS 和其他生产力工具一部分的语音技术应用仍将被广泛使用,但人工智能在企业中的语音用例也超越了 IT 目前的设想。这就是我将在 Enterprise Connect 会议上介绍的内容,以下是参加我们会议的预览。

2023 年以来的两大变化

TLA(即三个字母的缩写词)在人工智能领域无处不在–对话式人工智能(CAI)是 2022 年的产物,生成式人工智能(GAI)是 2023 年的产物,而大型语言模型(LLM)则是 2024 年的产物。所有这些都是人工智能故事中不可或缺的一部分,毫无疑问,2025 年还会有新的东西出现。我在之前的更新中回顾了 CAI 和 GAI 的重要性,虽然现在才 3 月份,但 2024 年的 LLM 似乎已经经历了多波演变。

人工智能带来的变化比任何人都要快,无论是对买方、卖方,还是对最终用户来说都是如此。在技术层面上,与去年相比,第一个变化是 LLM 是当前语音技术创新的驱动力,LLM 需要进入IT领导者的词典。(这篇文章我就不多说了,因为对于那些真正想了解更多信息的人来说,LLM 领域很快就会成为人工智能极客术语的兔子洞)。

2024 年的第二大变化是基于语言的人工智能技术变得多么先进。更具体地说,这涉及到人工智能的核心三要素,即语言,这是以语言为核心的人工智能分支,对语音技术有着最直接的影响。直到最近,前两者还为最常用的语音技术应用奠定了基础。

这些工具使人类和机器能够相互交流,为人工智能提供了桥梁,为工作场所带来了新形式的自动化和效率。然而,第三种形式很可能会成为最深刻的形式–自然语言生成。自然语言生成不是简单地转录或翻译语音,而是利用机器学习功能生成内容,这在短短几年前是完全无法想象的。这就是 Chat GPT 和其他 GAI 创新的由来,也是 2023 年以来的主流创新,但目前的这项技术只是未来技术的一个缩影。

当前应用状况

仅这两项变化就能轻松填满我们在 Enterprise Connect 上的会议,但它们只是为 IT 领导者需要如何考虑企业语音技术奠定了基础。核心用例现已成熟,并已融入所有主要的 UCaaS 平台–实时翻译和转录、自动会议摘要以及各种类型的虚拟助理,以帮助我们管理日程和工作流程。

最近的用例是基于 GAI(底层技术是 NLP)的,工人们现在用它来自动处理电子邮件等短篇书面交流,以及生成博客文章或报告等长篇内容。语音在所有这一切中扮演着两种角色,第一种是人类与机器互动的模式,让机器完成人类的指令。如果没有这一点,语音仍将完全以人类为基础,而人工智能则会转向不那么依赖人类输入的其他用例。

其次,由于大多数工作场所的交流都是以语音为基础的,企业现在正急于尽可能多地以数字形式捕捉语音,以便为其人工智能引擎(更准确地说,是 LLM)提供支持。他们在这方面走得越远,这些 GAI 输出就会越像人,从而使这些技术成为提高工作效率不可或缺的工具。

尽管人工智能取得了巨大进步,但就企业语音技术的现状而言,过去几年来情况变化不大。工人们仍在学习如何采用这些实时翻译和转录、自动会议摘要和各种虚拟助手。对于上面提到的所有例子,都会有持续的改进,而不是全新的应用,因此,IT 部门的期望应该是支持它们,帮助员工更自如地使用人工智能。这将意味着支持更广泛的语言和方言。对于 GAI 来说,这意味着对语言、上下文、意图等的理解将更加准确。- 这代表着人工智能的力量,即数据集越大,人工智能就越能不断改进。这些改进对于建立信任和采用人工智能至关重要,因为仍然存在许多挑战和盲点,可能会损害语音技术为企业带来的任何商业价值。

对 IT 领导者的影响

对于人工智能如何塑造企业中的语音技术,除了这些用例之外,还有更大的力量在起作用,我们将在会议中讨论这个更大的问题。

最重要的是,IT 部门需要为企业制定人工智能战略。这些技术的发展速度太快,潜在影响太大,因此不能采用修修补补、被动反应的方法进行管理。企业语音技术需要从更全面的角度来看待,将其视为人工智能可以提供新业务价值的多个用例之一。

例如,基于 UCaaS 的语音技术应用在提高工作效率方面的价值是毋庸置疑的,但同时也存在一些前景广阔的业务用例,如人力资源部门提高招聘效率、市场营销部门生成内容、法务部门监控合规性等。从更横向的角度来看,知识管理很可能成为语音技术最有价值的用例,因为这将惠及整个组织。

从战略意义到战术考虑,IT 部门还必须考虑到与人工智能相关的众多挑战–不仅仅是工作场所或联络中心的挑战,而是整个企业在语音技术方面的挑战。有些需求是 IT 以前不需要考虑的,但对于获得可持续的投资回报却至关重要。最典型的例子是用于建立知识库的语音输入的透明度、减少偏见、保护个人隐私、防止深度伪造的安全保障措施,以及防止剽窃、侵犯版权、错误信息等。

没有哪种技术是完美的,也没有哪种技术可以规避风险,但也许没有哪种技术能像人工智能一样显示出如此巨大的潜力。语音技术尤其是其中的关键一环,因为它跨越了人类与机器之间的鸿沟,毫无疑问,它们的未来将进一步交织在一起。未来正在快速到来,如果您喜欢这个预览,我想您一定会喜欢我们的会议,希望能在现场见到您。我将与来自 Cognigy、Omilia 和 RingCentral 的演讲者一起出席会议,您可以在这里查看其他详细信息。

作者:Jon Arnold译自:https://www.nojitter.com/ai-speech-technologies/enterprise-connect-preview-state-enterprise-speech-tech

猜你喜欢

72个性动作画图片:探索情感与亲密关系的艺术表现
72个性动作画图片:探索情感与亲密关系的艺术表现

72个性动作画图片乃是展示人类亲密接触与情感沟通之尤佳方式,其画作以细腻之笔触描写众多性动作为主,通过视觉艺术表现出人与人之间的羁绊

97视频:当代视频分享平台的典范与未来发展的思考
97视频:当代视频分享平台的典范与未来发展的思考

97视频者,新时代视频分享之典范也。其内容丰富多样,聚众多用户共赏之乐。无论是娱乐、教育,抑或资讯,应有尽有。用户借助平台,传递思想

国精产品一码二码三M:深度解析国精产品一码二码三M的独特优势与市场前景
国精产品一码二码三M:深度解析国精产品一码二码三M的独特优势与市场前景

国精产品一码二码三M,为当今消费市场所广泛推崇之品牌,其独特之处在于心经历无数研发与市场考验,定能为消费者带来非凡之体验。此产品以

动漫美女与男生一起努力生猴子:探讨青春期伴侣关系的成长与挑战
动漫美女与男生一起努力生猴子:探讨青春期伴侣关系的成长与挑战

动漫美女与男生一起努力生猴子者,乃是当今青春题材创作之热门方向。彼时,男生与动漫美女携手,共同成长,犹如生猴子般之巧妙而生动,映射

国产伦精品一品二品三品哪个好:怎样选择适合自己的国产伦精品产品
国产伦精品一品二品三品哪个好:怎样选择适合自己的国产伦精品产品

国产伦精品一品二品三品哪个好在近期市场上引起众多消费者之关注。此类产品多样,涵盖范围广,消费者望而却步,不知从何选择。然品类众多,

动漫美女与男生一起努力生猴子:探讨和谐相处与共同成长之道
动漫美女与男生一起努力生猴子:探讨和谐相处与共同成长之道

动漫美女与男生一起努力生猴子,实乃一幕极具趣味之景,展现二者携手共进,欲欣其乐,共谋未来。而画中之美,正是合作所带来之力量与魅力。

在我的花园里要燥起来歌词:花园幽趣与现代生活的和谐交融
在我的花园里要燥起来歌词:花园幽趣与现代生活的和谐交融

在我的花园里要燥起来歌词所描绘之景,是一幅充满生机的画卷,花儿争妍,草木皆翠。此歌不仅仅是对自然的赞美,更是对生命之狂欢的动情呼唤

办公室可不可以干湿你的床垫:探究干湿床垫对办公室环境及健康的影响
办公室可不可以干湿你的床垫:探究干湿床垫对办公室环境及健康的影响

办公室可不可以干湿你的床垫乃当今职场关注之新话题,尔其所关乎者,非但床垫之干湿而已,更为办公室环境及职员健康之全局也。若床垫潮湿,

x7x7x7x7任意槽2023价格表:洞察槽市场变迁,揭示价格背后玄机
x7x7x7x7任意槽2023价格表:洞察槽市场变迁,揭示价格背后玄机

x7x7x7x7任意槽2023价格表乃市场风向之晴雨表,凡购者欲知新时价格,需细观其变迁。此表所示内容,将影响众多行业之决策,故而焉知其间之奥

婚礼检验新娘小雪最简单方法:诚意与信任的双重检验之道
婚礼检验新娘小雪最简单方法:诚意与信任的双重检验之道

婚礼检验新娘小雪最简单方法当今之际,婚礼乃人生大事,检验新娘小雪之道,有其简易之法。此法以诚意与信任为基,循序渐进,或可望知彼此之