情感分析技术已经存在了几十年,最早的迭代以观点极性为中心,衡量某人对某事的观点是正面、负面还是中性。

如今,情感分析已成为计算机科学中研究最多、发展最快的领域之一。已经开展的工作将该技术从简单的极性检测转向了更复杂的细微情绪检测,例如,从简单的负面情绪检测到区分愤怒和悲伤。
不过,最重要的进步是将该技术从主要用于文本分析的工具转变为从语音交互中挖掘洞察力的工具。
语音情感分析是在过去几年中随着语音识别和机器学习的进步而出现的。如今,语音情感分析技术已经发展到可以通过音调、节奏和语调等特征,甚至复杂的上下文细微差别来分析口语中的情感基调。
语音情感分析工具还能从座席人员与客户的互动中自动提取主题、副主题、意图、紧迫感和趋势。有了人工智能,语音情感分析工具可以更加准确和细化,突破人类意见的主观性,并能实时执行。
语音情感分析目前已广泛应用于客户服务分析、市场研究和人机交互等各种应用中,使系统能够理解客户对话的情感基调,并做出相应的反应。
“情感是衡量客户体验的重要因素,”Verint 公司人工智能和分析市场战略副总裁 Daniel Ziv 说。“如果你服务的客户不满意,迟早会影响到你。”
Ziv说:”采取行动,改善客户情绪非常重要。但首先你必须对其进行衡量”。
这个目标由来已久,但直到最近才成为现实。
TTEC Digital 创新架构师高级总监 Robert Wakefield-Carl 表示:“几十年来,联络中心一直希望了解客户及其情绪,但直到 10 到 15 年前,我们才真正有了自然语言处理模型,能够正确地转录通话,并充分理解通话内容以及它如何表达客户的顾虑或感受。”
德克萨斯大学奥斯汀分校传播学系数字策略师兼助理教授 Natalie Bidnick Andreas 表示,新的语音情感分析工具还有其他好处。“语音情感分析的最新进展为理解情绪和态度开辟了令人兴奋的新途径。传统上,情绪分析植根于文本,但书面文字往往会忽略口语如此轻松传达的情感细微差别。我们说话的方式——我们的语调、音调、节奏,甚至停顿——增加了文本无法传达的多层含义。”
NICE 的 Enlighten AI 业务线负责人 Brett Forman 表示,在 AI 出现之前,语音情感分析是由相对严格的手动数据定义和查询定义驱动的。如果不同的客户对同一种情绪使用截然不同的术语,或者客户难以表达积极或消极情绪,情绪分数可能会有很大差异。
“现在我们引入的技术使公司能够利用大量数据构建情感模型,”Forman 说。“它更加系统化和程序化。”
Forman 补充说,更现代的语音情感分析工具还可以实现更大的定制化,并提供比以前更细致的洞察。
Ziv 也同意,通话后调查只能捕捉到一小部分客户情绪。“往往会存在偏见。非常高兴的人可能会回复,生气的人可能会回复,但处于中间状态的人中,大多数人可能不会回复。他们只是没有时间。使用语音更为客观。”
Ziv 表示,语音分析,特别是针对广泛对话的语音分析,可以帮助公司获得更真实的情绪分数,而且成本更低,因为它不需要在通话后调查中投入额外的精力。
安德烈亚斯表示,自然语言处理和机器学习的最新进展也使情感分析系统能够实时捕捉语音提示。“这是一个巨大的飞跃,尤其是对于客户服务、医疗保健和营销等行业而言。”
“例如,在客户服务中,语音情感分析可以帮助检测客户的挫败感何时加剧,从而促使客服人员在事态升级之前介入,”Andreas 说。“在医疗保健领域,它可以用于监测患者的情绪状态,提供可能被忽视的痛苦或抑郁的早期迹象。”
采用才刚刚开始Ziv 表示,尽管最新的情感技术比几年前的技术先进得多,但它仍处于早期采用阶段。“还有很大的增长空间。”
Forman 对此表示赞同。“虽然一些组织已经在尝试部署实时情绪,但广泛采用仍处于早期阶段。这种滞后主要是由于组织对面向客户的场景中 AI 治理和合规性的持续担忧,以及将情绪洞察转化为清晰、可操作的策略的挑战。许多企业仍在研究如何以增强而不是复杂化客户体验的方式来响应情绪数据。”
Forman 表示,为了提高采用率,语音情感分析工具供应商最近专注于量化改善情绪和体验的潜在价值。“长期以来,我们有能力创建情绪指标,可以汇总和衡量接触后调查中正面或负面的潜在可能性。”
Forman 称,供应商还在提供更精细的测量和分析服务。
Wakefield-Carl 解释说,直到最近,客户情绪的评分范围都是 -100 到 +100,由自然语言引擎预先确定为好或坏的特定短语给出的分数决定。然而,对于“我想和你的主管谈谈”这样的短语,短语前后的内容可以决定积极或消极的情绪。
同样的原则也用于确定客服人员的同理心——客服人员如何对待客户。Wakefield-Carl 补充说,声学分析和短语匹配的结合有助于识别语音音量、语速、音调和其他因素的变化,这些变化表明客服人员或客户的对话气氛正在升温。
然而,Wakefield-Carl 警告称,如果在通话过程中不显示趋势,而只使用这些因素,对口音浓重或非母语人士来说并不公平。“将传统情绪/同理心分析与声学标记相结合,将有助于创建一种整体情绪分析,这种分析将更符合人类对客服人员与客户之间沟通的评估,并有助于以正确的方式培训客服人员,引导通话,从而实现更好的结果。”
Gladia 首席执行官兼联合创始人 Jean-Louis Quéguiner 表示,区分情绪分析和情感分析非常重要。两者都可以基于文本或语音,但情绪分析仅将信息分为积极、消极或中性,通常无法理解语音通信的情感细微差别。对于用于客户服务、销售、质量监控或医疗环境的语音应用,上下文至关重要。
“这就是情感分析的作用所在,它通过观察节奏、语音节奏和声调等因素来评估更复杂的情绪和语调,”Quéguiner 补充道。“两者都需要保持高水平的准确性和质量。因此,集成情绪和情感分析的多模式系统将成为需要实时从音频数据中提取丰富见解的应用程序背后的驱动力。”
Forman 表示,该技术近期取得的其他重要进展包括多语言和多渠道能力。“过去,我们不得不为不同的渠道和不同的语言创建单独的指标,因为这些渠道表达事物的方式是独一无二的。”
Forman 表示,人工智能使企业能够跨渠道、跨语言持续测量情绪分析。“这是一个巨大的进步,”他说。“拥有多语言能力使企业管理变得容易得多。”
Forman 和 Ziv 表示,随着最近其他系统的升级,语音情绪分析现在已经足够复杂,可以在一次对话中检测到情绪的变化。
这种通话情绪分析使公司能够随着通话过程中情绪的变化向代理发送不同的提示。
语音情感分析工具供应商在其最新的一些技术介绍中融入了上述进步。
例如,亚马逊网络服务公司于 2023 年 8 月开始通过其 Connect Contact Lens 为一些企业提供实时语音对话分析。这使联络中心运营商能够在处理实时客户电话的同时接收转录、情绪分析、主管警报和其他功能。大多数部署了 Contact Lens 提供的对话分析的公司都使用它来识别主要联系人驱动因素、混淆敏感信息并在 Amazon Connect 中对其联系人进行本地分类。这些功能可帮助组织增强其 Amazon Connect 联络中心内的消费者、代理和主管体验。
不到一年前,NICE 推出了一款具有高级预测分析功能的基于云的语音分析工具。该平台的实时洞察可帮助公司缩短呼叫中心响应时间并增强客户体验。
8 月,Verint 推出了其最新的人工智能语音分析平台,具有实时客户情绪分析和自动通话转录等增强功能。
随后在 10 月,Mitel 宣布在全球范围内推出 Mitel Interaction Recording (MIR) Insights AI,它提供录音摘要和情绪检测功能,并提供 100 多种语言的语音录音记录。它利用了由 Microsoft Azure AI Services 和 OpenAI 基础模型支持的内置生成式 AI 引擎。AI 对话摘要和行动项目直接内置在 MIR 的波条中,使代理能够在几秒钟内进入对话重点,甚至可以向 genAI 驱动的聊天机器人提出针对具体案例的后续问题。
情感分析的挑战依然存在利用语音进行情感分析仍是一门不断发展的科学。Andreas 表示,理解不同人基于文化差异或地区语言模式等因素表达情绪的微妙方式可能很棘手。
“计算情绪的挑战之一是感知,”Forman 说。“如果你在听一段互动时,发现某人说话的方式发生了变化,那么直觉上就会知道情绪发生了变化。”
Forman 补充道,挑战不在于观察单一的互动,而在于衡量、汇总和创建数百甚至数千次互动中的情绪指标。不同地区的人说话方式可能不同,但世界其他地方的差异可能更加明显。例如,美国的讽刺表达方式与英国的非常不同。
音频保真度是另一个挑战。通过简单的麦克风录音通常会产生与使用更复杂的麦克风或多个不同麦克风阵列录音不同的音质。同样,来自智能手机的来电与来自固定电话或计算机的来电的音质也不同。这些差异可能会影响情绪指标。
“我们非常重视与客户的合作,确保他们尽可能准确地使用指标,”Forman 说道。“组织必须了解情绪是如何产生的,这样他们才不会对数据衡量的内容产生误解。”
Andreas 表示,隐私问题是另一个大问题。“现在公司会分析我们声音中的情绪基调,改善服务和侵犯个人空间之间只有一线之隔,”她说。
值得一提的是,户外服装零售商巴塔哥尼亚 (Patagonia) 因与一家人工智能和数据智能公司合作而被起诉,涉嫌违反加州隐私法,原告称这导致他们的通信在未经他们许可的情况下被第三方拦截、记录和分析。
Forman 表示,上述挑战是 NICE 倡导专用 AI 的原因。“这种 AI 专门针对不同的行业、地区和领域量身定制,无论是金融服务、英国监管要求还是客户服务运营,都考虑到了治理框架。这种方法可确保合规所需的透明度、问责制和适应性。它还确保负责任的部署,提供可靠、有效的解决方案,从而最大化业务价值,”他说。
专家预计,随着语音情感分析技术的发展和更广泛的应用,其商业价值将继续提高。事实上,最近的 Market Research Intellect 数据显示,2023 年全球语音情绪分析市场规模约为 36 亿美元,该公司预计到 2032 年,该市场规模将增长至约 107 亿美元,复合年增长率为 12.6%。
然而,准确性、偏见和用户隐私问题仍然存在,并且可能会在未来一段时间内困扰该行业。
作者:Phillip Britt源自speechtechmag.