Rokid 眼镜再度升级!引入多种 AI 大模型,并支持个性化配置功能

AI 大模型算得上是今年最火的话题,AR 眼镜作为 AI 最好的载体,Rokid 在 AI 方面的能力有了新的进展。

熟悉 Rokid 的朋友都知道 Rokid Glasses 是一款功能强大的 AR+AI 全天候智能眼镜,眼镜可以通过大模型能力实现搜索、识物、翻译等实用功能,去年发布会时我们也介绍 Rokid Glasses 搭载的是阿里通义大模型。

在如今 AI 大模型井喷的当下,只搭载一个 AI 大模型显然是不能满足用户对于 AI 的需求,所以 Rokid Glasses 再次进化。

截至目前,除通义千问外也集成了DeepSeek、豆包、智谱清言、纳米搜索等多个大模型,众多顶尖 AI 大模型的加入,让 Rokid Glasses 成为一个时刻待命的万能助理,以应对更复杂的任务。

Rokid Glasses 将这些大模型分类管理,分为基础模型、视觉模型、搜索模型等。

基础大模型负责整体 AI 能力,如对话,问答和调用产品功能等;视觉大模型负责处理视觉信息,如识别物体等;信息大模型负责搜索当下最新信息对所回答的问题进行信息整合与归纳。

每种模型都有自己的专长。Rokid glasses 会根据不同的场景将用户请求智能分发给不同的模型处理。

比如通义的风格是严谨客观,表现为专业的助理秘书的形象,豆包的风格更轻松俏皮,像一个好朋友,用户可以在 App 端选择自己偏好的大模型。

如果你对这些模型都不满意,也支持自定义配置自己的私有模型。

简单来说,Rokid Glasses 以强大的硬件和算法为底座,支持用户换“脑子”和“眼睛”。

举个例子,当用户选择 DeepSeek 为基础大模型,通义千问为视觉大模型时,在唤醒 AI 后是 DeepSeek 作为“脑子”在与你沟通。

当涉及到调用视觉识别功能时,通义千问作为“眼睛”去识别对应物体从而进行判断和反馈。

在大模型喷涌的时代,目前还没有一款能力覆盖全面的大模型,更多的是某大模型在特定领域内表现出色。

所以多模型的协同使用或许是更优解,这种使用方式可以为用户带来更加全面、高效且个性化的体验。

Rokid Glasses 支持不同模型手动配置

当然,基于 YodaOS – Sprite 系统打造的 Rokid Glasses,大模型的种类绝不仅限于基础和视觉大模型两类。

随着大模型的发展,可配置的“卡槽”也会越来越多,Rokid Glasses 支持的大模型数量也会不断增加,用户也可以通过 openAI 标准的 API 调用自己的私有大模型,满足更多科研和专业领域的需求。

多个大模型协同工作意味着 Rokid Glasses 的 AI 扩展性高,可根据用户场景和需求灵活配置不同大模型,同时也意味着对其系统的信息分发逻辑和意图分发算法要求更为严格。

在实际使用中,眼镜接收到的信息种类是多样且复杂的,如何保证快速准确地解读信息并给出反馈是研发团队首先要攻克的问题。

一般 AI 智能眼镜会把所有获取到的信息全部丢给云端大模型,让大模型自己判断,这种模式下大模型往往需要更多时间识别并做出回应,导致用户体验不佳,响应时间很长。

而 Rokid 凭借在 AI 语音交互领域的积累,在端侧集成自研的意图分类模型,可以在 2 毫秒内完成对意图的分类,再将请求分发给不同的模型。用户的体验就是 AI 响应速度快,处理效率高,交互体验丝滑顺畅。

举个例子,Rokid Glasses 搭载的意图分类模型,像一个机场入口的智能接待机器人,每一次信息的输入就像是机场来来往往的旅客。

当旅客拉着行李箱走进大厅的时候,这个接待机器人就开始工作了。

首先,它会扫描旅客的行李标签,这一步就是意图识别,识别旅客的行李是托运还是手提,从而决定给旅客指引到哪个方向。

也就是说在识别意图后,分类模型就会把对应的信息分发给所匹配的模型。

当然这个智能接待机器人还具备一些独特之处,它支持语言、图像或数据流等多模态的信号输入,也支持不用语言的意图理解,还能够根据实时负载情况动态调整服务窗口的开启数量。

这样一来的好处就是,来往的游客会秩序井然地办理业务,整个机场大厅不拥挤,效率也得到提升。

如果没有这个智能接待机器人,机场大厅中的旅客不知道自己需要做哪些动作,只能像无头苍蝇一样在各个窗口询问。

来往的旅客如果变多,那机场大厅会变得非常拥挤,且各个部门的运转效率低下。

Rokid Glasses 作为 AI 载体需要用更合理的处理逻辑和流畅的操作系统为不同 AI 提供展示实力的舞台,也能更好的让用户享受到 AI 带来的便利。

高效的分类模型配合不同种类的模型让 Rokid Glasses 处理效率得到很大提升,从而让用户的体验更顺畅。

同时凭借其具备 AR 显示的特性,结合 AI 能力,让它在科研、创作、办公还是日常生活中的各种场景中,都会提供前所未有的智能支持和流畅体验。

猜你喜欢

八戒八戒在线 WWW 观看:为何看不了?怎样解决?
八戒八戒在线 WWW 观看:为何看不了?怎样解决?

文章主要介绍了八戒八戒在线 WWW 观看的相关问题,包括为何看不了以及怎样解决。以下是对该主题的详细阐述:八戒八戒在线 WWW 观看:为

为什么纳西妲和丘丘人会繁殖后代?怎样解决这个问题?
为什么纳西妲和丘丘人会繁殖后代?怎样解决这个问题?

在提瓦特大陆的奇幻世界中,存在着许多神秘而奇妙的生物。其中,纳西妲是智慧之神,而丘丘人则是生活在野外的神秘族群。一个令人惊讶的问题

家有儿女黄化版是怎么回事?孩子看了会学坏吗?如何正确引导孩子观看?
家有儿女黄化版是怎么回事?孩子看了会学坏吗?如何正确引导孩子观看?

家有儿女是一部备受欢迎的家庭情景喜剧,以其幽默风趣的剧情和温馨的家庭氛围赢得了观众的喜爱。近年来,网络上出现了一种被称为“家有儿女

51 吃瓜网警花张津瑜为何被曝光?她的遭遇会对社会产生怎样的影响?
51 吃瓜网警花张津瑜为何被曝光?她的遭遇会对社会产生怎样的影响?

51 吃瓜网警花张津瑜为何被曝光?她的遭遇会对社会产生怎样的影响?在当今社会,网络信息传播迅速,各种事件和人物的曝光屡见不鲜。当涉及

名模王真黑毛秘密私拍:如何在游戏中打造个性化角色与沉浸式体验
名模王真黑毛秘密私拍:如何在游戏中打造个性化角色与沉浸式体验

在当今数字化的时代,游戏已经成为了人们生活中不可或缺的一部分。从最初的街机游戏到如今的虚拟现实技术,游戏的进化不仅改变了我们的娱乐

恐龙岛游戏内恐龙下蛋的作用与意义解析
恐龙岛游戏内恐龙下蛋的作用与意义解析

近年来,恐龙岛游戏热度持续攀升,其独特的生态系统和游戏机制吸引了大量玩家。其中,恐龙下蛋这一环节对于游戏的整体体验具有重要意义。据

花季传媒哟哟:探索游戏产业新趋势,拥抱未来的数字娱乐世界
花季传媒哟哟:探索游戏产业新趋势,拥抱未来的数字娱乐世界

在当今快节奏的生活中,游戏已成为我们日常生活中不可或缺的一部分。无论是深夜的单机游戏,还是与朋友共同竞技的网络游戏,这种娱乐形式不

为什么找不到伊甸园免费网站入口 2020?如何进入伊甸园免费网站入口 2020?
为什么找不到伊甸园免费网站入口 2020?如何进入伊甸园免费网站入口 2020?

近年来,随着互联网的快速发展,各种类型的网站如雨后春笋般涌现。其中,一些网站因其特殊的内容或服务而备受关注,伊甸园免费网站就是其中

天美传媒 MDAPP03TV 是什么?如何解决看视频卡顿问题?
天美传媒 MDAPP03TV 是什么?如何解决看视频卡顿问题?

天美传媒 MDAPP03TV 是一款视频播放软件,它提供了各种类型的视频内容,包括电影、电视剧、综艺节目、动漫等。用户可以通过该软件观看这

一区二区三区精密机械有什么不同?如何选择适合的精密机械?
一区二区三区精密机械有什么不同?如何选择适合的精密机械?

在现代工业制造中,精密机械扮演着至关重要的角色。不同地区的精密机械在技术、质量、性能和价格等方面可能存在差异。一区、二区和三区精密