解析temi机器人

似乎永远不可能,直到它完成。(N.曼德拉)

每个人问我的第二个关于temi的问题是,为什么这种产品还不存在?我的答案很简单:temi存在了很多年。

从个人电脑出现的那一天起,几百年来,个人机器人一直存在于我们的梦想、电影和想象中,唯一使它们无法成为现实的是技术和价格。为家庭制造机器人可能是最复杂和困难的挑战之一。创造一个像temi这样的智能自主机器人系统需要克服所有的技术领域——电气工程、软件、算法、IOS/Linux/Android、光学、人工智能、力学、语言处理、机器视觉、UX……你能想到的。我想和大家分享一下temi的工作原理,希望越来越多的工程师和创业公司进入个人机器人领域,我们相信这将成为继智能手机之后的下一波浪潮。

所以,如果你想了解个人机器人,这里有一些我的见解,欢迎你进入这个领域。

我在哪里?

当我们进入一个未知的领域时,我们做的第一件事就是试着了解我们在哪里。 基本上,我们在脑海中创造了一种地图,并在其中定位我们自己。当我们进入未知领域时,我们不断地更新这张地图和我们周围的物体。特米也在做同样的事情。在专业术语中,这被称为SLAM——同时定位和映射——这可能是机器人专家必须解决的最基本但也是最难的问题之一。例如,在客厅里就没有太多的空闲空间。temi需要知道它可以通过哪里,包括非常狭窄的区域。大多数机器人在SLAM过程中使用一个传感器,但这还不够,因为每个传感器都有其局限性。temi每秒数百次智能地融合来自各种传感器的数据!传感器,如激光雷达,3D相机,2D相机,编码器测量车轮的运动,IMU,考虑到每个传感器的不确定性和来自该传感器的数据,创建一个精确的亚厘米级地图和实时定位。第二部分,在构建地图之后,从语义上理解我们所处的位置。Temi Slam

我们人类本能地理解眼前发生的事情——一张椭圆形的大桌子,周围有8把椅子,大大的窗户,没有多少其他的家具——我们走进了一个会议室。另一方面——一张椭圆形的大桌子,周围有8把椅子,墙上挂着画,还有其他没有门的房间的入口——我们进入了一个餐厅。temi通过运行一套先进的深度学习算法来识别对象、区域、场景和所有对象之间的关系,从而理解它所看到的东西。temi将信息保存在结构化的知识图中,以建立对所见内容的理解,并随着时间的推移不断改进对环境的感知。

如何去到那里?

为了从房间的一头走到另一头,我们人类本能地选择了最容易走的路,不费力气,跨过小障碍,绕过大障碍。这对机器人来说是一项复杂的任务。更精确地说,简单地选择从点A到点B的最佳路径的时间复杂度是与要遵循的可能边的数量成指数关系的。

temi不仅在几分之一秒内选择了一条有效路径,它还选择了最自然的路径。从技术上讲,机器人可以通过非常奇怪的区域。最短的路不一定是最快的。例如,当你从厨房搬到客厅时,你可以穿过沙发,穿过厨房里所有的椅子,或者你可以绕过它们,这将是快速和自然的方式。temi正在学习人类的自然道路,以便在这种情况下以自然的方式移动,并且每次自我都在提高自己。

dog sleeping

另一个方面是低能量运动

例如,在厚厚的地毯上跑步比在光秃秃的地板上跑步更难。temi能够动态分析它所移动的表面,以适应它的控制系统,并选择尽可能低的能量和最快的路径。上面描述的所有事情都需要在移动的过程中不断地重复。如果突然毛茸茸的狗跑到特米前面会发生什么?特米需要迅速行动。这就是为什么temi监视所选择的路径来检测新的障碍,更新它对世界的知识,并调整它的路径来避免这些动态障碍。

仅仅是进入一个房间,然后从一边穿过另一边,就需要多年的专业知识、数百万行代码、几十个传感器和最好的工程师来实现所有这些。由于过去几年的计算性能和成本革命,这已经成为可能。

Temi Tech

如何服务与你?

为了让机器人帮助你,它必须了解你想要什么,

你在哪里,你是谁。

temi有许多特性和功能。它既复杂又简单——就像开灯一样简单。temi只有两个选择——“和你在一起”或“不和你在一起”。轻拍它的头或说:“嘿,temi”,temi就会进入互动模式,随时为你服务。要使用上面描述的所有功能以及更多功能,只需要简单地说“嘿,temi,给妈妈打电话”。

temi将锁定你的位置,计划一个有效和自然的路径来接近你,并跟随你到视频你,决定最好的通信层和质量,并开始视频通话。是的,temi也会认出你是谁,叫你妈妈而不是你配偶的妈妈。temi采用多模型的人识别算法来建立高置信度的身份,利用语音数据中的说话人识别和摄像机中的人脸识别来生成高置信度的识别。

Call Grandpa

temi为我们提供了一种简单直观的方法来与之交互——语音。

temi理解我们什么时候给它打电话,我们告诉它什么,并分析我们真正想要的意图。temi总是在低功率模式下运行,准备让我们打电话给他。这被称为“唤醒词检测”,并直接在HW上实现,以保持低功耗。一旦检测发生,temi就会启动ASR(自动语音识别)和NLU(自然语言理解)层,以理解用户说了什么和想要做什么。

temi使用RGBD算法来检测和理解用户实际在做什么——坐着、站着、与他人交谈等等,以便充分理解用户的意图,并为他的真实需求提供答案。这被称为“活动识别”,这不能仅仅使用语音传感器来完成。

当你离开他的时候,temi也可以为你服务。我们开发了iOS和Android应用程序来远程控制temi。1对1的配对需要物理存在,以确保高级别的安全性。这款手机应用程序允许temi用户将自己的联系人列表与temi同步,并可以从世界任何地方连接到temi。通过远程连接,主人可以在家中自由导航,“亲临现场”。与以前不同的是,temi提供了没有操纵杆的导航功能。你不需要成为一个硬核玩家去厨房。你只需点击手机应用程序上的厨房图标,temi就会自动导航到那里。你还可以点击摄像头的提示,temi就会向你告诉它的方向移动,使用避障算法来确保它不会翻倒你为婚礼准备的花瓶。

temi实现了实时MQTT(消息队列遥测传输),以确保通过低带宽、高延迟或不可靠的网络与移动应用程序连接。

The new way to connect全新的连接方式

与我们所爱的人联系的最好方式就是亲自去那里。其次是temi。

目前的视频聊天应用程序和设备不能满足我们的需求。我们想要免提,自然地移动,我们不想担心把自己放在相机的中央,这样另一边就能看到我们。temi提供了一种特殊的远程呈现体验。

Hands free

首先,temi能够通过听到他或她的声音来判断这个人在哪里。它使用一个全方位的麦克风阵列系统来捕捉声音。声波在很短的时间内到达每个麦克风,使得temi能够计算出准确的人的方位和估计的距离。这使得temi能够确保一个伟大的声音体验与回声消除,能够消除背景噪音,并专注于人的声音。

其次,temi正在调整它的位置,通过智能地融合RGB相机、3D相机和激光雷达,捕捉那个人的最佳图像。然后,它在融合的数据上运行我们专有的个人检测和跟踪算法,从而在这个人在房间里自由走动时对他或她产生准确的跟踪。

此外,temi使用机器学习算法来识别用户移动时所穿的衣服,并在不与周围的其他家庭成员或同事混淆的情况下继续有效地跟踪他。

为了保证良好的视频体验,temi团队使用自适应比特率机制实现了P2P (P2P)通信,该机制对捕获的视频和音频进行多种质量的编码。然后,temi根据通信线路的质量、带宽和负载使用最优编码。所有这些都是在视频通话期间实时完成的。

当我们使用temi时,我们从一个房间移动到另一个房间。我们都经历过不同房间互联网连接质量的剧烈变化。为了让你的整个家庭都能很好地工作,temi包括802.11ac Wi-Fi连接(最新一代的双频无线技术)与LTE (4G)蜂窝网络连接,所以它永远不会失去连接,并将提供一个可怕的体验。4g LTE的美妙之处在于,不需要设置,你可以享受你打开temi盒子的瞬间。

对无限可能性保持开放

我们人类有一种非凡的能力,能够从观察中学习,并立即应用这种学习。这种能力叫做智力。智力的正式定义是一个人获得新知识和技能并将其应用于现实世界的能力。特米不断了解我们的日常生活,为我们提供更好的服务。

temi正在自主学习如何更好地移动,谁是家庭成员,人们通常坐在哪里,等等。所有这些都使temi能够改进它为我们服务的方式以及它与我们交互的方式。更好的语音识别,更好的理解,更多的关于世界的知识和更好的习惯了特mi家庭的礼仪。改善也意味着带来新的体验。

temi的操作系统开放给第三方开发者(Android),并为应用程序提供了一个全新的可移动平台,说话和与你交流——自主导航,流动性,视频和音频捕捉、语音交互和先进的人工智能提供一个新的注重创造性和独特的平台允许开发者达到和影响人们前所未有的新体验。例如:游戏应用程序可以和你互动,像捉迷藏,教育应用程序可以让你站起来,让学习变得有趣,远程医疗,安全等等,这些都是无限可能的。

play guitar

创新者和开发者的社区将使temi成为一个不可或缺的产品。因此,temi的开发工具包括一个简单的基于Android的SDK和API,它易于使用,提供了很多功能,并确保无论开发人员在做什么,交互都是安全的。可以在Android Studio上开发temi技能,将开发环境的技术提升降到最低。

安全第一

没有人想看到机器人跌倒或从脚上碾过。

为了达到这个目的,temi包括了几层安全特性——temi使用深度摄像机和激光距离传感器来监视temi前方的空间,从而探测地面上方的物体,以便围绕它们进行机动。它可以检测表面边缘(就像地毯一样),并在台阶或洞的情况下减速或停止。

temi还实现了一个严格的控制安全机制,可以直接连接到安全传感器,并允许机器人只有在空间空闲时才能前进,所以即使是一个错误的命令也不会导致temi从你的脚上开过去或从楼梯上摔下来。当你或者你3岁的孩子推temi的时候,你不会想让他摔倒的。这种质量是通过创建一个非常低的COM(质量中心)在设计过程中实现的。所有的重型组件都位于temi的底部,而所有的顶部组件都被选择为非常轻。

安全也意味着黑客无法篡改temi。temi通过智能技术组件提供最高的监管和质量标准,保护设备免受黑客威胁。当您的数据通过互联网发送并存储在我们的云存储平台时,我们会对其进行加密。我们利用Amazon Web服务来帮助创建一个安全的云平台。

对一些人来说,这可能看起来像魔法。

对我们来说,这只是办公室里的又一天,就像活在梦想中一样。