智能家居是当下一个十分热门的物联网行业,自从苹果发布了Homekit和谷歌收购Nest之后,将智能家居彻底引爆。但目前国内的智能家居市场两极分化明显:智能家居厂商这边是热闹非凡,地产公司、家电公司、互联网公司和AI公司纷纷进入到这个行业;但是消费者这边,却冷清了很多。相关数据显示,目前欧美国家智能家居的渗透率已超过35%,日本和韩国的渗透率超过25%,而在中国,这个数字还未达到5%。那么,智能家居究竟离我们还有多远,需要怎样的“智能”?
多模态
必须要承认,智能家居与其他AIOT行业有不一样的地方,它要求多模态的交互方式和多模态的协作(物物之间)。所谓多模态交互,即多种本体交互手段结合后的交互,例如将多种感官融合,比如文字、语音、视觉、动作、环境等。
人是一个典型的多模态交互的例子,在人与人交流的过程中,表情、手势、拥抱、触摸,甚至是气味,无不在信息交换的过程中起着不可替代的作用。
显然,智能家居的人机交互势必不止语音一个模态,而是需要多模态交互并行。举个例子,智能音箱如果看到人不在家,那就完全不需要对电视里误放出的唤醒词进行响应,甚至可以把自己调到睡眠状态;一个机器人如果感觉到主人在注视他,那么可能会主动向主人打招呼并询问是否需要提供帮助。
多模态处理无疑需要引入对多类传感器数据的共同分析和计算,这些数据既包括一维的语音数据,也会包括摄像头图像以及热感应图像等二维数据。这些数据的处理无不需要本地AI的能力,也就对边缘计算提出了强力的需求。
身份鉴别
智能家居系统目前普遍无法识别你是你,反而有一些智能单品能够识别。
目前,通过智能门锁或者摄像头能够确认身份,但是智能门锁只在出入口,摄像头一般用于周界和出入口(虽然也有甲方曾经要求室内安装大量监控摄像头的);而如果在室内,又该如何鉴别身份呢?
在智能家居系统中,是存在不少能够识别你的设备,比如带摄像头的电视机、智能音箱。
与身份鉴别的场景有很多,比如回到家中,背景音乐或者智能音响包括照明都会根据你个人的喜好进行调整,这个调整是根据你的日常行为、性别、爱好、回来的时间、天气等因素并结合特定日期(生日、纪念日等)经过自我学习完成的,这个的目标是个性化。
当晚上布防之后,如果你起来活动,智能家居系统能辨识到你在活动,在你活动区域附近的安防传感器将自动屏蔽,当你离开该区域后,智能家居系统会解除屏蔽——这样做的好处是避免你去手动布撤防。
定位
上述提到的那个安防的场景其实与定位是有一定的关系,毕竟智能家居系统不仅要认出你还要认出你在哪(卧室、厨房、客厅)。
笔者的一个想法是:可以为智能家居系统赋予3D建模功能,让其能够掌握整个家居的结构,可以将这个结构赋予其他设备,比如扫地机器人,或者智能音箱等可能移动的设备。
相关场景有非常多,以来访为例:当你在厨房一边做饭一边听智能音箱播放的音乐,此时智能音箱突然插播了一段语音“前门有陌生人来访”,并且智能音箱的屏幕上显示门口监控图像。你通过监控图像看到原来是邻居或者某个朋友,甚至可能是外卖、快递小哥等等。你对智能音箱说打开门让他进来或者对智能音箱说“快递小哥,帮我把快递放到门口,一会儿我去拿”。此时,智能音箱会将这段话通过门铃(假定带语音功能)告知门口等待的人。
同样,如果在客厅看电视时,客厅电视上将出现一个小窗口显示门口监控,客厅的智能音箱通过语音提示“门外有人来访”的提示音,其他房间的电视和智能音箱并不会发出相应提示;甚至当多个电视、智能音箱在使用时,智能家居系统能够判断到底让哪个地方的电视或智能音箱发出提示(比如年轻人优先,其次是老人和小孩)。
如果屋里没人,那么当有人按门铃时,无论电视或者智能音箱都不会提供有人来访的提示。
连接
智能家居是人与物的连接,智慧小区是服务与人、与各家智能家居系统的连接。小区通过各类软硬兼施设施提供更人性化的服务给小区的业主。
以一个场景为例:你设定了明天9点到某地与客户洽谈的日程安排。智能系统根据你的日程为你设定了早晨7点起床的闹钟,7点30分外卖送到,8点下楼(楼下有车辆送到小区东门),8点10分东门上车。智能系统根据住所到目的地距离选择了乘车出行方式,行程是40分钟。由于你的车辆限号,于是智能系统根据你的叫车习惯选择了滴滴出行,并根据你的喜好选择了专车(不是快车也不是出租)。鉴于小区内提供了免费接送的服务,于是智能系统告知小区8点到楼下等你。依次类推,到闹钟设定——原本你设定的闹钟是7点30份,那么由于智能系统判断你需要7点起床才能赶上行程,因此智能系统将会屏蔽明天7点30分的闹钟(对后天没有影响)。
去中心化和中心化
根据纳什均衡原理,一个组织当中有一个稳定的状态,这时候群体做出的决策是最优的,任何其他的选择都会打破这样的均衡状态。人类社会恰恰存在着多种的纳什均衡——有时偏向集权,有时又偏向分权。
纳什均衡其实告诉我们,群体的组织形式会在单一中心和去中心化中找到平衡点,而且这样的平衡点不止一个。那么在智能家居行业中,到底是中心化还是去中心化呢?
目前的趋势还是中心化,就算将来每个设备都是智能设备甚至都有边缘计算的能力,那将来可能还是有一个中心去负责协调。为什么这么说?如果把每个传感器、每个终端设备当作一个个人来看,把家居当作一个会议室,每个人都在自说自话,那么,会有结论吗?不会。这个互相传递的命令,就像是闹市中的各类声音一般;所以很大程度上还是会有一个中心,并且允许其他中心的存在。比如某个传感器发现地面脏了,可以发送命令给扫地机器人扫地。
另外再举一个例子说明:当机器人发现主人不在家后自动进入了休眠状态。那么问题来了,机器人怎么发现主人不在家的?方式一:机器人在所有房间里转了一圈,没有发现主人在家,于是回到之前位置然后进入休眠并告知其他设备进入休眠。方式二:机器人在屋里喊了一嗓子“你们谁看见主人了?”(广播),所有设备告诉它没有看到或者某个设备告诉它主人外出了(比如摄像头或者音箱),于是机器人进入休眠。方式三:智能家居系统发现主人不在家后,将消息告知了机器人,于是机器人进入休眠。
方式一和方式二可以看作是去中心化;方式三是中心化。
数据分析
前阵子看了一下热播剧《都挺好》,里面有一个情节是:苏明成在卧室里留意到苏大强晚上去了好几次厕所,推断出苏大强身体有问题。那么,如果某个智能马桶发现某个人最近一段时间每晚都要去好几次厕所,它能够推断出这个人的身体有问题吗?
目前的答案是:不能判断。原因是:现在的智能马桶并不能对自己产生的数据进行分析,且目前也不能判定使用者的身份。但是,一些医疗产品已经具备了基础的数据分析,他们能够根据用户的生理状态提供一些建议或帮助。由此推断:智能硬件或者智能系统有必须主动分析本设备或本系统产生的数据的能力,并提供相关建议给用户。
隐私和数据保护
如果智能马桶发现某个人身体可能有问题,将该信息传到厂家云平台进而告知相关药店或者医院,导致这个人一段时间内看到很多关于如何治好xx的广告或商品,甚至莫名其妙接到某些推送。这样的情况,是否允许发生呢?
此外,由于智能设备或智能系统保有用户大量的个人数据,并且无论智能设备或智能系统都需要定期与云平台通讯,如果通讯内容被不法分子获取,那么可能会被某些别有用心的人利用。
为此,每个厂家都应该切实保护数据——无论是数据传输过程中,或者是存储数据的云平台,再或者是产生的数据的设备。我们知道:如果想实现智能,需要大量数据;但是出于隐私和数据保护的缘故,智能硬件或者智能系统又不能将个人隐私和数据直接传递到某个云平台,那么该如何进行模型训练呢?
个人的数据是隐私,但是一群人的数据特征就不再是隐私。比如某个人喜欢买智能硬件和某个地区80%的男人喜欢购买智能硬件,前者涉及个人,后者不涉及个人(是可以公开的)。因此可以将个人化的数据脱敏后上传到云端,但是这个过程务必取得消费者的认同。
而对于模型训练的做法,可以利用边缘计算,将数据在数据本地进行初步训练,然后将结果返回到云平台进行再次训练,最终将模型下发至相应终端设备或系统。 (任仁)