浅谈情感计算——人机交互技术新前景

浅谈情感计算——人机交互技术新前景
浅谈情感计算——人机交互技术新前景

2015-2016学年第一学期

《人机交互的软件工程方法》

课程大作业

学生姓名熊利

学号5011213509

所属学院信息工程学院

班级计算机17-5

授课教师范振岐

塔里木大学教务处制

浅谈情感计算——人机交互技术新前景

摘要:情感在人类的认识和人机交互中起着关键性的作用.具有情感能力的计算机就是让计算机能够在和人类相处时更有智能、更为敏感和更为和谐和亲切。情感研究的进展与展望如何,情感计算的应用等都将是本文探讨的内容。

关键字:情感计算;人机交互;应用;展望

目录

1引言................................................................ - 1 - 2情感计算的发展与展望................................................ - 1 - 3情感计算的具体研究内容.............................................. - 2 - 4情感计算的基本内容.................................................. - 4 - 5情感模型的描述语言.................................................. - 6 - 6情感计算在人机交互设计中的应用...................................... - 8 -

6.1人机界面设计................................................... - 8 -

6.2人机接口设计................................................... - 8 -

6.3智能型教学代理人............................................... - 8 - 7情感计算的延伸应用.................................................. - 9 - 8总结............................................................... - 10 - 参考文献............................................................. - 10 -

1引言

情感计算的概念是在1997年由MIT媒体实验室Picard教授提出,她指出情感计算是与情感相关,来源于情感或能够对情感施加影响的计算。中国科学院自动化研究所的胡包刚等人也通过自己的研究,提出了对情感计算的定义:“情感计算的目的是通过赋予计算机识别、理解、表达和适应人的情感的能力来建立和谐人机环境,并使计算机具有更高的、全面的智能”。

2情感计算的发展与展望

情感计算研究的提出最早可以追溯到20世纪90年代初,耶鲁大学心理系的Salovey 教授提出了情感智能的概念,开展了一系列的研究。该概念随后被Goleman发展为与智商(IQ)相对的情商(EQ),并随着Goleman的畅销书而迅速流行,在心理、认知、计算机等领域掀起了一个研究情感智能的小高潮。MIT的Picard教授根据这些新的概念和研究方向,于1997年出版了《情感计算》一书,希望赋予智能机器感知、理解和表达情感的能力。

很显然,开展认知科学研究不仅仅是为了满足人类智慧上的好奇心,更重要的是服务于人类,提高人类的生活质量。情感计算有广泛的应用前景。计算机通过对人类的情感进行获取、分类、识别和响应,进而可以帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们理解自己和他人的情感世界。计算机的情感化设计能帮助我们增加使用设备的安全性,使经验人性化,使计算机作为媒介进行学习的功能达到最佳化。在信息检索中,通过情感分析的概念解析功能,可以提高智能信息检索的精确度和效率。在电子商务领域,在设计购物网站和股票交易网站等时充分利用人的情感因素的作用,以改变客流量。针对人的肢体运动,可以设计一系列运动和身体信息捕获设备,例如,将智能座椅应用于汽车的驾座上,用于动态监测驾驶人员的情感状态,并提出适时警告。多模式的情感交互技术能构筑更贴近人们生活的智能空间或虚拟场景,而机器人、智能玩具、游戏等产业则能构筑出更加拟人化的风格和更加逼真的场景。

情感计算是一个高度综合化的研究和技术领域。通过计算科学与心理科学、认知科学的结合,研究人与人交互、人与计算机交互过程中的情感特点,设计具有情感反馈的

人与计算机的交互环境,将有可能实现人与计算机的情感交互。情感计算研究将不断加深对人的情感状态和机制的理解,并提高人与计算机界面的和谐性,即提高计算机感知情境,理解人的情感和意图,作出适当反应的能力。

进入新世纪以后,特别是近年来,随着普适计算、人本计算、社会计算等概念和研究方向的提出,自然的人机交互日益成为各研究领域的研究内容和目标,情感计算也自然地成为各学科共同关注的热点、焦点。中国国家自然科学基金委也不失时机地支持了“情感计算理论与方法”的研究。

情感计算从本质上,是一个典型的模式识别问题。智能机器通过多种传感器,获取人的表情、姿态、手势、语音、语调、血压、心率等各种数据,结合当时的环境、语境、情境等上下文信息,识别和理解人的情感。在实际的自然交互系统中,智能机器还需要对上述信息作出及时的、恰当的、情感化的反应。情感之间距离的定义和计算方法是情感计算的核心问题,例如需要定义和计算“微笑、笑、大笑、狂笑”之间的距离,以便把它们分别聚类,从而使系统能够识别出不同程度的笑。遗憾的是,目前情感计算的研究还只能对情感进行粗分类,即识别7种典型的情感。

目前,我国在情感计算这一领域的研究主要在人脸识别。这一方面是因为人脸表情容易获取,易于分析处理,其成果具有重要的应用前景等;另一方面,也反映了情感计算研究的一个普遍的问题,即尽管人类是通过表情、语言、动作等各种信息的融合,识别和理解情感,但是,当前多模态情感数据获取、分析、融合、识别和理解,以及情景等上下文信息的融合依然是情感计算研究中富有挑战性的课题。实现具有情感反馈的自然的人机交互是情感计算研究的最终目标,这需要在上述情感理解的基础上,研究人类情感反馈和表达的机制,建立模型。

目前国内的研究成果已有基于已有的情绪模型,提出了虚拟人的认知结构,建立了一种新的基于动机驱动的自主情绪模型。清华大学戴振龙的论文则介绍了一种人脸表情的合成方法,能够生成具有细微表情动作的虚拟说话人。可以看出,这方面的研究在国际上依然是自然交互领域的一个新兴的方向,面临着许多挑战性的问题,具有广阔的发展前景。

3情感计算的具体研究内容

让计算机具有情感能力首先是由美国MIT大学Minsky教授(人工智能创始人之

一)提出的。他在1985年的专著《The Society of Mind》中指出,问题不在于智能机器能否有任何情感,而在于机器实现智能时怎么能够没有情感。从此,赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著《Affective Computing》中提出并给出了定义,即情感计算是关于情感、情感产生以及影响情感方面的计算。

目前情感计算的研究普遍受到学术界和企业界的关注,国际知名公司,如IBM和British Telecom等均成立了专门的情感计算研究小组。国际知名大学也纷纷建立情感计算研究小组。总的来说,情感计算的研究均处于起步阶段。MIT目前的工作侧重于有关情感信号的获取(如各类传感器的研制)、情感计算的应用和可穿戴计算机。日本学者的研究侧重于感性信息处理方面。在情感计算的研究过程中,与之密切相关的可穿戴计算机的研究近几年来也得到了迅猛的发展(于1997年10月在美国波士顿召开第一次国际研讨会后已连续举行多次国际会议)。这种计算机的特点是可以巧妙地构成日常穿戴的一部分(如眼镜、手表、项链、手镯、腰带、鞋、帽、服装等),使计算机和其穿戴者始终保持形影不离。可穿戴计算机可为情感计算的研究提供一个很好的研究平台,另外情感计算的最终表现形式可能是可穿戴计算机或植入人体的芯片,从而将情感计算、移动计算和计算机融合而真正成为个性化的人机融合。虽说情感计算是一门新兴学科,但以往的研究也为其提供了一定的知识积累。从情感方面来讲,人类心理学和生理学的研究为情感计算提供了坚实的基础;从相关研究内容来讲,如人脸及面部表情识别、人脸及面部表情合成、手语识别与合成、气味识别等也是学术界一直研究的重点;同样各种医学器械、测谎仪等的研制成功也为情感计算提供了一定的依据。

目前人工智能的研究发展已经达到了较高的水平,同时它的研究内容也在逐步扩展和延伸。对人的情感和认知的研究是人工智能的高级阶段,它的研究将会大大促进拟人控制理论、情感机器人、人性化的商品设计和市场开发等方面的进展,为最终营造一个人与人、人与机器和谐的社会环境做出贡献。心理学家认为,人工智能下一个重大突破性的发展可能来自与其说赋予机器更多的逻辑智能,倒不如说赋予计算机更多的情感智能。对人的情感和认知的研究是在人工智能理论框架下的一个质的进步。因为从广度上讲它扩展并包容了感情智能,从深度上讲感情智能在人类智能思维与反应中体现了一种更高层次的智能。对人的情感和认知的研究必将为计算机的未来应用展现一种全新的方

向。在这个领域的研究中主要包括情感计算(Affective Computing)、人工心理(Artificail Psychology)和感性工学(Kansei Engineering)等。

根据情感计算的过程.可将情感计算的研究内容分为以下九个方面:情感机理、情感信息的获取、情感模式识别、情感的建模与理解、情感的合成与表达、情感计算的应用、情感计算机的接口、情感的传递与交流和可穿戴计算机。

从人类情感的交流过程来讲,情感计算的研究可分为四步:通过传感器直接或间接与人接触获得情感信息:通过建立模型对情感信息进行分析与识别;对分析结果进行推理达到感性的理解;将理解结果通过合理的方式表达出来。也就完成了情感交流的全过程。

根据上述过程,情感计算的研究内容主要应包括:情感信号的获取、情感信息的分析与识别、情感信息的理解和情感的表达。

情感信号的获取现在主要通过一些采集输入设备提取人的面部表情、语音语调和肢体动作,也就是特征提取。此外通过测量人的一些生理反应包括心率、血压的舒张压和收缩压、脉搏、瞳孔扩大、呼吸、皮肤导电、荷尔蒙胆汁的分泌以及皮色和体温等用于情感状态的识别理解。

情感信息的分析和识别主要是对所提取到的信息进行预处理、模式分类。

情感信息的理解就是根据上一步的分类结果和数据库中的模板进行比对判断。把所提取到的情感以最大概率确定出来,然后合成表情。

情感的表达就是把上一步理解的结果呈现出来进行交互。在这四个方面的研究中情感的识别和合成是目前的关键部分,也是我们研究的重点

4情感计算的基本内容

人们期盼着能拥有并使用更为人性化和智能化的计算机。在人机交互中,从人操作计算机,变为计算机辅助人;从人围着计算机转,变为计算机围着人转;计算机从认知型,变为直觉型。显然,为实现这些转变,人机交互中的计算机应具有情感能力。情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统。

情感被用来表示各种不同的内心体验(如情绪、心境和偏好),情绪被用来表示非常短暂但强烈的内心体验,而心境或状态则被用来描述强度低但持久的内心体验。情感

是人与环境之间某种关系的维持或改变,当客观事物或情境与人的需要和愿望符合时会引起人积极肯定的情感,而不符合时则会引起人消极否定的情感。

情感具有三种成分:⑴主观体验,即个体对不同情感状态的自我感受;⑵外部表现,即表情,在情感状态发生时身体各部分的动作量化形式。表情包括面部表情(面部肌肉变化所组成的模式)、姿态表情(身体其他部分的表情动作)和语调表情(言语的声调、节奏、速度等方面的变化);⑶生理唤醒,即情感产生的生理反应,是一种生理的激活水平,具有不同的反应模式。

概括而言,情感的重要作用主要表现在四个方面:情感是人适应生存的心理工具,能激发心理活动和行为的动机,是心理活动的组织者,也是人际通信交流的重要手段。从生物进化的角度我们可以把人的情绪分为基本情绪和复杂情绪。基本情绪是先天的,具有独立的神经生理机制、内部体验和外部表现,以及不同的适应功能。人有五种基本情绪,它们分别是当前目标取得进展时的快乐,自我保护的目标受到威胁时的焦虑,当前目标不能实现时的悲伤,当前目标受挫或遭遇阻碍时的愤怒,以及与味觉(味道)目标相违背的厌恶。而复杂情绪则是由基本情绪的不同组合派生出来的。

情感测量包括对情感维度、表情和生理指标三种成分的测量。例如,我们要确定一个人的焦虑水平,可以使用问卷测量其主观感受,通过记录和分析面部肌肉活动测量其面部表情,并用血压计测量血压,对血液样本进行化验,检测血液中肾上腺素水平等。

确定情感维度对情感测量有重要意义,因为只有确定了情感维度,才能对情感体验做出较为准确的评估。情感维度具有两极性,例如,情感的激动性可分为激动和平静两极,激动指的是一种强烈的、外显的情感状态,而平静指的是一种平稳安静的情感状态。心理学的情感维度理论认为,几个维度组成的空间包括了人类所有的情感。但是,情感究竟是二维,三维,还是四维,研究者们并未达成共识。情感的二维理论认为,情感有两个重要维度:⑴愉悦度(也有人提出用趋近-逃避来代替愉悦度);⑵激活度,即与情感状态相联系的机体能量的程度。研究发现,惊反射可用做测量愉悦度的生理指标,而皮肤电反应可用做测量唤醒度的生理指标。

情感是一种内部的主观体验,但总是伴随着某种外部表现,即表情。面部表情、姿态表情、语调表情三种表情被称之为体语,构成了人类的非言语交往方式。面部表情是指通过眼部、颜面和口部肌肉的变化来表现各种情感状态。面部表情不仅是人们常用的较自然的表现情感的方式,也是人们鉴别情感的主要标志。研究表明,人脸的不同部位

具有不同的表情作用,例如,眼睛对表达忧伤最重要,口部对表达快乐与厌恶最重要,前额能提供惊奇的信号,而眼睛、嘴和前额等对表达愤怒很重要。使用特定的仪器可以对面部的微小表情变化进行研究,甚至可以区分真笑和假笑:人在真笑时面颊上升,眼周围的肌肉堆起,大脑左半球的电活动增加;而人在假笑时仅有嘴唇的肌肉活动,下颚下垂,大脑左半球的电活动不明显。脸部运动编码系统FACS通过不同编码和运动单元的组合,可以在脸部形成复杂的表情变化,其成果已经被应用于人脸表情的自动识别与合成。还有MPEG-4 V2视觉标准,定义了3个重要的参数集,即人脸定义参数、人脸内插变换参数和人脸动画参数,其表情参数具体数值的大小代表人激动的程度,可以组合多种表情以模拟混合表情。目前面部表情的研究侧重于对三维图像的更细致的描述和建模,也注重使用复杂的纹理和较细致的图形变换算法,以达到生动的情感表达效果。人的姿态即身体表情,一般伴随着交互过程而发生变化,并表达着一些信息。而语调表情是通过语音的高低、强弱、抑扬顿挫来表达说话人的情感。在人际交往中,语音是人们最直接的交流通道。通过语音人很容易就能感受到对方的情感变化,就像“你真行!”这句话,既可以表示赞赏,也同样可以表示讽刺或妒忌。情感语音研究目前主要侧重于情感的声学特征的分析。语音中的情感特征往往通过语音韵律的变化表现出来(如当一个人发怒时,讲话的速率可能变快,音量变大,音调变高等),但也可同时通过一些音素特征(如共振峰、声道截面函数等)表现出来。中国科学院心理研究所、中国科学院自动化研究所、清华大学计算机系等机构都在从事相关研究。

在人机交互研究中已使用过很多种生理指标,例如,皮质醇水平、心率、血压、呼吸、皮肤电活动、掌汗、瞳孔直径、事件相关电位、脑电EEG等。生理指标的记录需要特定的设备和技术,在进行测量时,研究者有时很难分离各种混淆因素对所记录的生理指标的影响。情感计算研究的内容包括三维空间中动态情感信息的实时获取与建模,基于多模态和动态时序特征的情感识别与理解,及其信息融合的理论与方法,情感的自动生成理论及面向多模态的情感表达,以及基于生理和行为特征的大规模动态情感数据资源库的建立等。

5情感模型的描述语言

智能型计算特性大多采用无所不在的分布式计算模型,因此使用者状况及环境等情境数据有多方的来源.而系统所推导出的情感模型,也需要通过网络传递到其它有兴

趣的模块。因此如何建立外显的情感模型描述语言,并通过适当的网络协议将情感状态完整表达并传递出去,是一个重要的研究课题。目前大部分的情感模型描述语言都是虚拟人体描述语言的一部分。以下就几种包含情感标记的人体描述语言作进一步的说明。

AML(Avatar Markup Language)是一种基于XML的多形式脚本语言.设计的重点之一是希望它可以容易地被动画师了解.也可以容易地由软件产生。AML将脸部动画和肢体动画封装在一个附加同步化信息的表示法中。例如,在MPEG 4标准中.定义了一套关于脸部和身体的低阶动画参数,但并没有提供任何对于代理人的高阶控制方式。在此环境下的系统,中介层(Middleware Layer)显得特别有价值.它提供智能型的软件代理人可以轻易控制三维空间的图像表现,而不需要担负每次产生所有低阶设定的重担,3D内容制作者因此能简易快速地制作与分享丰富的代理人动画,AML的作用就是充当这一中介层。

CML(Character Markup Language)是一种基于XML语言的动画语言,为代理人的结合与在线应用软件或虚拟世界提供帮助。CML使用由上而下的方式,分开描述动作跟虚拟人的功能制定.角色动作、模型和语音定义在一个设定档,将情感等虚拟人的状态定义在另外一个设定档,定义角色特质、情感和行为等高阶属性.整合这些高阶属性,产生具备同步能力的动画脚本。而新的或者未被指定的行为可以由调和基本元素或属性形成。提供开发者一个具有弹性的动画语言。

VHML(Virtual Human Markup Language)是一个逐步形成标准且基于XML的语言,主要控制银幕上的虚拟人。使用VHML的虚拟框架是结合很多技术提供对网站拟人般的互动。VHML对每个型式提供子语言,如GML用于姿势、SML用于说话、BAML

用于身体、FAML用于面部;也提供比较高阶的子语言,如EML用于表情、DMML用于对话。以此实现使用者和虚拟代理人的互动简易化。

PAR(Parameterized Action Representation参数化行为表示)。PAR认为要表示一个行为,构成的要素应当包括行为的核心语义(状态变化、运动、力量)、行为的参与者、应用条件、准备条件、终止条件、后果状态、持续条件、行为目的、父行为、子行为、前行为、后行为、并发行为、开始时间、持续时间、优先级、运动轨迹、行为方式等。它描述了行为的诸多方面的特征.同时给出了行为的主要语义构成以及行为的时间信息,从而一方面可以根据语义对行为分类,另一方面便于实现行为的推理。

6情感计算在人机交互设计中的应用

6.1人机界面设计

情感计算可以用在一般人机界面的设计上,以提升应用的有效性。自然和谐的智能化人机界面的沟通能力特征包括:(1)自然沟通:能看,能听,能说,能触摸;(2)主动沟通:有预期,会提问,并及时调整;(3)有效沟通:对情境的变化敏感,理解用户的情绪和意图,对不同用户、不同环境、不同任务给予不同反馈和支持。而实现这些特征在很大程度上依赖于心理科学、认知科学和计算机科学对人的智能和情感研究所取得的新进展。我们需要知道人是如何感知环境的,人会产生什么样的情感和意图。人如何做出恰当的反应.从而帮助计算机正确感知环境,理解用户的情感和意图,并做出合适反应。因此,人机界面的“智能”不仅应有高的认知智力.也应有高的情绪智力,从而有效地解决人机交互中的情境感知问题、情感与意图的产生与理解问题,以及反应应对问题。以语音接口为例,具有警示作用的语调与速度,对吸引使用者的注意力,有相当大的帮助。而在轻松的情境下,感性缓慢的语调或动画接日将有助于使用者进入舒缓的状态。

6.2人机接口设计

在心理学上.人类通过语言、表情、肢体动作等方式将八个主要类别的情感表达出来。目前分辨人类情感的研究中能从表情中精确辨别出哪一类情感的仍属少数,而且辨别率约在70%左右。通过多模方式提高辨别率是一个新兴的研究方向。然而,情感计算的目的是了解使用者与环境互动过程中的意向或困难.因此是否能精确辨别出标准的情感状态.不是解决问题的必要过程。反而是能根据应用特性,检测出使用情境的感情状态,进而将此情境因素设计在人机接1:1的程序中.应是目前较为有效而值得探讨的作法。

6.3智能型教学代理人

在智能型教学代理人的应用上.一个具有情感功能的教学代理人,比一般的计算机教学软件更能真正根据使用者的情感了解学习情况.进而提出有效的表达方式.提高使用者的学习兴趣。按照教学系统的四大模块,智能型教学代理人可分为下述几个角色:使用者接口模块是与学习者进行互动的沟通者:学生模块是了解学习者认知状况的分析者;教学模块是选取最佳教学法的教学者:教材模块是提供适当教材的编辑者。

沟通者肩负询问、诊断、展示及记录责任。询问的责任是了解有关学习者的基本资料.诊断的责任是获得学习者的能力、认知状况及知识结构等的信息,展示的责任是将

教材呈现在输出装置上供学习者学习,记录的责任是记录学习者在学习时与系统互动的所有历程的信息。因此,沟通者是由询问代理人、诊断代理人、展示代理人及记录代理人所组成。沟通者由接口数据库,取得与学习者交互的方式及画面。分析者分为数据查核代理人、评价检查代理人及学习检查代理人,经询问、诊断及记录代理人取得的数据,由分析者进行分析。分析后,分别将结果储存于学生模块基本数据库、学习成就数据库及学习数据库。

7情感计算的延伸应用

情感计算及其相关研究对电子商务的发展也有较为明显的推动作用。实践表明,图片的差异能引起人类不同的情感认知。例如:老虎,蟑螂,子弹之类的图像较容易引起用户的恐惧心理,而印有大量人民币的图片则会让人类产生十分强烈的欲望反应。将此特征应用到电子商务的模式中,比如在大型线上购物网站上充分考虑这些因素所带来的人类情感认知变化,能很好的控制用户流量,某种程度甚至能影响用户的操作,起到一个统筹全局的作用。在现代化电器和智能设备的设计中,若也能恰如其分的加入人类情绪状态这一因素,能帮助用户更好的进

行对设备的使用。信息检索方面,通过对情感的概念分析,能够有效提高信息检索的准确度和效率。针对时下十分流行的远程教育平台,情感计算能很好的帮助用户解决情感流失问题,吸引学习者的眼球,达到更好的教学效果。通过各种方式的情感交互技巧,帮助用户构建更加贴近生活的场景和智能空间。除此之外,情感计算也可深入机械设计,智能玩具,网络游戏等众多领域,为更加人性的服务打下扎实的基础。

8总结

情感计算为计算机科技发展提出了一个新的课题。情感计算是建立和谐人机环境的

基础之一,同时情感计算是融多学科为一体的学科,它的发展必将带动相关科学的发展。

可穿戴计算机和后PC时代的芯片式计算机将为情感计算提供方便的研究平台和表现形

式,无论从科学意义、学术价值,还是事实需求,情感计算将有巨大的发展潜力和应用

价值。

情感计算是一个多学科交叉的崭新的研究领域。这包括传感器技术、计算机科学、

认知科学、心理学、行为学、生理学、医学、哲学、社会学等。情感计算的最终目标是

赋予计算机类似于人一样,并能够被人所控制的情感能力。要达到这个目标,有许多基

本科学问题有待解决,并具有很大的难度。另一方面,新世纪之中人类对自身的研究将

成为科学探索的重点。情感作为人们心理活动的主要内容之一.存在许多待解之迷。可

以认为,围绕情感计算产生的科学突破将对我们人类生活质量产生重大影响。

参考文献

[1]陈飞翔,杨崇俊,申胜利. 基于LBS的移动GIS研究[J]. 计算机工程与应用,2006,

42(2):200-202.

[2] 孙名奎,王直杰,张珏. 基于PDA-GPRS/GPS/GIS的移动查询监控导航警务系统的设计[J]. 测

绘与空间地理信息,2005,28(5):70-73.

[3] 李晓丽,王晓军. 移动学习模式探讨及系统架构设计[J]. 北京邮电大学学报(社会科学版),

2007,9(5):10-13.

[4] 罗仕鉴,龚蓉蓉,朱上上. 面向用户体验的手持移动设备软件界面设计[J]. 计算机辅助设计与

图形学学报,2010,22(6):1033-1041.

[5] 马月.网站界面设计[M].北京:北京理工大学出版社,2006

[6] 吴玲达,老松杨,王晖,张茂军.多媒体人机交互技术[M].长沙:国防科技大学出版社,1999

[7] 施奈德曼(Shneiderman,B.)著,《用户界面设计:有效的人机交互策略(第三版)》[M]. [美],2004

[8] 数字报刊的人机交互与界面设计[J],G210.7

[9] 李方园 ,《人机界面设计技术》[M]. 化学工业出版出版,2010

[10] (美)Alan Cooper,软件创新之路[M], 电子工业出版社,2008

智能机器人的现状和发展趋势

智能移动机器人的现状和发展 姓名 学号 班级:

智能移动机器人的现状及其发展 摘要:本文扼要地介绍了智能移动机器人技术的发展现状,以及世界各国智能移动机器人的发展水平,然后介绍了智能移动机器人的分类,从几个典型的方面介绍了智能移动机器人在各行各业的广泛应用,讨论了智能移动机器人的发展趋势以及对未来技术的展望,最后提出了自己的建议和设想,分析我国在智能移动机器人方面发展并提出期望。 关键词:智能移动机器人;发展现状;应用;趋势 1引言 机器人是一种可编程和多功能的,用来搬运材料、零件、工具的操作机,或是为了执行不同的任务而具有可改变和可编程动作的专门系统。智能移动机器人则是一个在感知 - 思维 - 效应方面全面模拟人的机器系统,外形不一定像人。它是人工智能技术的综合试验场,可以全面地考察人工智能各个领域的技术,研究它们相互之间的关系。还可以在有害环境中代替人从事危险工作、上天下海、战场作业等方面大显身手。一部智能移动机器人应该具备三方面的能力:感知环境的能力、执行某种任务而对环境施加影响的能力和把感知与行动联系起来的能 力。智能移动机器人与工业机器人的根本区别在于,智能移动机器人具有感知功 能与识别、判断及规划功能[1] 。 随着智能移动机器人的应用领域的扩大,人们期望智能移动机器人在更多领 域为人类服务,代替人类完成更复杂的工作。然而,智能移动机器人所处的环境 往往是未知的、很难预测。智能移动机器人所要完成的工作任务也越来越复杂; 对智能移动机器人行为进行人工分析、设计也变得越来越困难。目前,国内外对 智能移动机器人的研究不断深入。 本文对智能移动机器人的现状和发展趋势进行了综述,分析了国内外的智能 移动机器人的发展,讨论了智能移动机器人在发展中存在的问题,最后提出了对 智能移动机器人发展的一些设想。 1

人机交互技术的发展与现状

人机交互技术的发展与现状 一.什么是人机交互技术? 二.人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、 输出设备,以有效的方式实现人与计算机对话的技术。人机交互技术包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题及提示请示等。人机交互技术是计算机用户界面设计中的重要内容之一。它与认知学、人机工程学、心理学等学科领域有密切的联系。也指通过电极将神经信号与电子信号互相联系,达到人脑与电脑互相沟通的技术,可以预见,电脑甚至可以在未来成为一种媒介,达到人脑与人脑意识之间的交流,即心灵感应。二. 人机交互技术的发展人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。 1959年美国学者B.Shackel从人在操纵计算机时如何才能减轻疲劳出发,提出了被认为是人机界面的第一篇文献的关于计算机控制台设计的人机工程学的论文。1960年,Liklider JCK首次提出人机紧密共栖(Human-Computer Close Symbiosis)的概念,被视为人机界面学的启蒙观点。1969年在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业杂志国际人机研究(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。在1970年成立了两个HCI研究中心:一个是英国的Loughbocough大学的HUSAT研究中心,另一个是美国Xerox公司的Palo Alto研究中心。 1970年到1973年出版了四本与计算机相关的人机工程学专着,为人机交互界面的发展指明了方向。 20世纪80年代初期,学术界相继出版了六本专着,对最新的人机交互研究成果进行了总结。人机交互学科逐渐形成了自己的理论体系和实践范畴的架构。理论体系方面,从人机工程学独立出来,更加强调认知心理学以及行为学和社会学的某些人文科学的理论指导;实践范畴方面,从人机界面(人机接口)拓延开来,强调计算机对于人的反馈交互作用。人机界面一词被人机交互所取代。HCI中的I,也由Interface(界面/接口)变成了Interaction(交互)。人机

人机交互发展历史

人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。交互的信息也由精确的输入输出信息变成非精确的输入输出信息。 一、简单的人机交互界面 由于受到制造技术和成本等原因限制,早期的人机交互在设计上较少考虑人的因素,一味强调输入输出信息的精确性,因而使用不够自然和高效。 1.早期的手工作业。 当时交互的特点是由设计者本人(或本部门同事)来使用计算机,他们采用手工操作和依赖机器(二进制机器代码)的方法去适应现在看来是十分笨拙的计算机; 2.作业控制语言及交互命令语言。 这一阶段的特点是计算机的主要使用者—程序员可采用批处理作业语言或交互命令语言的方式和计算机打交道,虽然要记忆许多命令和熟练地敲键盘,但已可用较方便的手段来调试程序、了解计算机执行情况; 3.图形用户界面(GUI)。 GUI的主要特点是桌面隐喻、WIMP技术、直接操纵和“所见即所得(WYSIWYG)”。由于GUI简明易学、减少了敲键盘、实现了“事实上的标准化”。因而使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群。它的出现使信息产业得到空前的发展; 4.网络用户界面。 以超文本标记语言HTML及超文本传输协议HTTP为主要基础的网络浏览器是网络用户界面的代表。由它形成的WWW网已经成为当今Internet的支柱。这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、网络加速、多媒体动画、聊天工具等; 二、自然的人机交互界面 随着网络的普及性发展和无线通讯技术的发展,人机交互领域面临着巨大的挑战和机遇,

传统的图形界面交互已经产生了本质的变化,人们的需求不再局限于界面的美学形式的创新,现在的用户更多的希望在使用多媒体终端时,有着更便捷、更符合他们的使用习惯,同时又有着比较美观的操作界面。利用人的多种感觉通道和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,使人们从传统的交互方式的束缚解脱出来,使人们进入自然和谐的人机交互时期。这一时期的主要研究内容包括:多通道交互、情感计算、自然语言理解、虚拟现实、智能用户界面等方面。 (1)多通道交互 多通道交互(Multi Modal Interaction,MMI)是近年来迅速发展的一种人机交互技术,它既适应了“以人为中心”的自然交互准则,也推动了互联网时代信息产业(包括移动计算、移动通信、网络服务器等)的快速发展。MMI是指“一种使用多种通道与计算机通信的人机交互方式。通道(modality)涵盖了用户表达意图、执行动作或感知反馈信息的各种通信方法,如言语、眼神、脸部表情、唇动、手动、手势、头动、肢体姿势、触觉、嗅觉或味觉等”。采用这种方式的计算机用户界面称为“多通道用户界面”。目前,人类最长使用的多通道交互技术包括手写识别、笔式交互、语音识别、语音合成、数字墨水、视线跟踪技术、触觉通道的力反馈装置、生物特征识别技术和人脸表情识别技术等方面。 (2)情感计算 让计算机具有情感能力首先是由美国MIT大学Minsky教授(人工智能创始人之一)提出的。他在1985年的专著“The Society of Mind”中指出,问题不在于智能机器能否有任何情感,而在于机器实现智能时怎么能够没有情感。从此,赋予计算机情感能力并让计算机能够理解和表达情感的研究、探讨引起了计算机界许多人士的兴趣。这方面的工作首推美国MIT媒体实验室Picard教授领导研究小组的工作。情感计算一词也首先由Picard教授于1997年出版的专著“Affective Computing(情感计算)”中提出并给出了定义,即情感计算是关于情感、情感产生以及影响情感方面的计算。 MIT对情感计算进行全方位研究,正在开发研究情感机器人,最终有可能人机融合。其媒体实验室与HP公司合作进行情感计算的研究。IBM公司的“蓝眼计划”,可使计算机知道人想干什么,如当人的眼瞄向电视时,它竟知道人想打开电视机,它便发出指令打开电视机。此外该公司还研究了情感鼠标,可根据手部的血压及温度等传感器感知用户的情感。CMU 主要研究可穿戴计算机。日本在对感性信息处理的研究中,有众多研究单位参与,主要集中在研究所和高校。特别值得一提的是,日本欧姆龙公司研制生产的机器玩具曾风行一时,最

仿生机器人关键技术

仿生机器人关键技术 “仿生机器人”是指模仿生物、从事生物特点工作的机器人。,涉及到机械设计、计算机、传感器、自动控制、人机交互、仿生学等多个学科。因此,机器人领域中需要研究的问题非常多。主要研究问题包括以下五个方面: 1 建模问题 仿生机器人的运动具有高度的灵活性和适应性。其一般都是冗余度或超冗余度机器人,结构复杂,运动学和动力学模型与常规机器人有很大差别,且复杂程度更大。为此,研究建模问题,实现机构的可控化是研究仿生机器人的关键问题之一。 2 控制优化问题 机器人的自由度越多,机构越复杂,必将导致控制系统的复杂化。复杂巨系统的实现不能全靠子系统的堆积,要做到整体大于组分之和,同时要研究高效优化的控制算法才能使系统具有实时处理能力。 3 信息融合问题 在仿生机器人的设计开发中,为实现对不同物体和未知环境的感知,都装备有一定量的传感器。多传感器的信息融合技术是实现其具有一定智能的关键。信息融合技术把分布在不同位置的多个同类或不同类的传感器所提供的局部环境的不完整信息加以综合,消除多传感器信息之间可能存在的冗余和矛盾,从而提高系统决策、规划、反应的快速性和正确性。 4 机构设计问题 合理的机构设计是仿生机器人实现的基础。生物的形态经过千百万年的进化,其结构特征极具合理性,而要用机械来完全仿制生物体几乎是不可能的,只有在充分研究生物肌体结构和运动特性的基础上提取其精髓进行简化,才能开发全方位关节机构和简单关节组成高灵活性的机器人机构。 5 微传感和微驱动问题 微型仿生机器人有些已不是传统常规机器人的按比例缩小,它的开发涉及到电磁、机械、热、光、化学、生物等多学科。对于微型仿生机器人的制造,需要解决一些工程上的问题,如动力源、驱动方式、传感集成控制以及同外界的通讯等。实现微传感和微驱动的一个关键技术是机电光一体结合的微加工技术。同时,在设计时必须考虑到尺寸效应、新材料、新、工艺等问题。

人机交互的未来论文(精)

虚拟的现实 ----人际交互的未来 序言:回顾人类的历史,人类生存空间中的信息最开始是存贮在纸张、大脑、物体等介质上。是计算机构建了一个01空间,它像一个有强大引力的黑洞,将人类生存空间中的各式各样的信息都逐渐吸进去变成010101,黑洞用这些010101通过一些基本运算产生新的010101, 并可将这些010101组成一些虚构的图象呈现在人们面前,甚至将人类生存的世界也开始建成010101的代码. 人机交互研究已经历了两个界限分明的时代,第一代是以文本为基础的交互, 如菜单、命令、对话等,难用且不灵活。第二代则是直接操作界面,它引出更自然的视觉通信交互。是交互多媒体集成方法,需要大量使用语言,自然语言和高级图形,也可使用其它交互媒体,如人的动作、手势和三维图像等. 随着虚拟技术的发展,在某一天图形用户界面也会被新的虚拟界面淘汰,新一代的用户界面将向用户提供身临其境和多感觉通道体验,在你烦恼的时候,想吹海风、听海浪、看雪山、小桥流水、将卧室的窗户推开,而不论你在哪里!计算机都将会为你完成这一切,计算机模拟人类感觉的世界而生成一种世界,这里的“世界”是指具有真实感的立体图形,它既可以是某种特定现实世界的真实再现,也可以是纯粹构想的世界。操作者可以通过视觉、听觉、触觉、力觉等与之交互,从而能产生“身临其境”场景. 简介:这种虚拟的现实是以用户对界面的需求变化为出发点,使用户界面的外在形式和内部机制能符合不同用户的需要,这就是以用户为中心的设计思想。非特定人的连续语音识别技术将使计算机能理解人们的要求,是一种重要的输入界面和手段。现在我们已经有的鱼眼技术使屏幕观察(或光标位置附近的内容被放大,便于用户观察。在传统的人机系统中,人被认为是操作者,人去适应机器;在一般的人机系统中,人被称为用户,能与机器对话,但无主动控制能力;而在虚拟现实系统中,人才是主动的参与者,机器将对人的各种动作做出反应。

(完整word版)第五代移动通信的关键技术

第五代移动通信的关键技术 5G 是面向未来的通信发展需求的移动通信系统,第五代移动通信技术兴起的主要驱动力为互联网和物联网,将来人机交互和数据共享是人们日常生活的一部分,在这种交互下,人们的生活将会更加高效舒适。第五代移动通信系统不仅通信容量大,速率高,其可靠性和安全性也比第四代移动通信有了更好的改进,具有很大的发展空间,下面简单介绍几种第五代移动通信的关键技术。 1.Massive MIMO技术 大规模MIMO技术是指基站端采用大规模天线阵列,天线数超过十根甚至上百根,并且在同一时频资源内服务多个用户的多天线技术。大规模MIMO技术将传统的时域、频域、码域三维扩展为了时域、频域、码域、空域四维,新增维度极大的提高了数据传输速率。大规模MIMO天线技术提供了更强的定向能力和赋形能力如图1,大规模MIMO的空间分辨率与现有MIMO相比显著增强,能深度挖掘空间维度资源,使得网络中的多个用户可以在同一时频资源上利用大规模MIMO提供的空间自由度与基站同时进行通信,从而在不需要增加基站密度和带宽的条件下大幅度提高频谱效率。大规模MIMO可将波束集中在很窄的范围内,从而大幅度降低干扰,大幅降低发射功率,从而提高功率效率,减少用户间干扰,显著提高频谱效率。 当基站侧天线数远大于用户天线数时,各个用户的信道将趋于正交,小区内同道干扰及加性噪声趋于消失,系统性能仅受限于邻区导频的复用,这使得系统的很多性能都只与大尺度相关,与小尺度无关。大规模MIMO的无线传输技术将有可能使频谱效率和功率效率在4G 的基础上再提升一个量级。 图1. 大规模MIMO天线技术方向图

2. 非正交多址接入技术(NOMA) 5G的无线接入技术目前还有的观点关注多载波调制,如滤波器组多载波(FBMC,_ lter _bank based multicarrier),其天然的非正交性和不需要先前的分布式发射机同步。一种新的调制方式,被称为通用滤波后的多载波(UMFC)被提出。开始是OFDM信号,通过滤相邻子载波组,以减少时间/频率同步造成的旁瓣水平和载波间干扰。要解决OFDMA正交的时间窗口的缺点,即需要较大的保护带CP,使用多载波滤波器组就可以允许大的传输时延和任意高的频率补偿。日益发展的软件无线电,FFT块的大小,子载波间隔和CP长度可根据信道条件改变。因此,OFDMA允许一些参数可调,可以很好地适应5G的要求。 3. 射束分割多址技术(BDMA) 有限的频谱资源对于移动和无线技术而言是一个重大的挑战,即如何把有限的频率和时间分配给不同用户。由于这个情况,要实现提高系统的容量和质量,目前使用的多址技术包括频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)、正交频分多址(OFDMA)等。然而,现在使用的所有多址技术中,通信系统容量依赖于时间和频率。如何发展多址接入系统,提高有限频率的系统容量是一个新的挑战。 目前发明的BDMA技术,根据MS的位置分配天线波束,实现多址接入,从而显著增加系统的容量。按此观点,MS和基站在视距(LOS)的状态,因此他们明确知道彼此的位置。在此条件下,他们能够将波束直接传送到彼此的位置以通信,而不受移动台在小区边缘的干扰。 为了在5G中适应BDMA,就要发展相位阵列天线,智能天线要能够调整波束。调整波束天线通过收集从基站和MS到达角(AOA)信息设置无线配置。自适应天线阵列的使用,是提高能力的一个可能性。 4. 全频段技术 5G网络通信技术将会以智能化、宽带化和多元化为主要的发展方向。未来网络数据业务的发展方向主要在热点密集地区和室内,而当前网络数据的流量如果在少数人使用状态下不存在延迟、低网速等问题,但一旦放开使用用户数量,网络延迟和网络速度都将会是一个巨大的问题,而物联网和智能终端所依赖的移动通信网络将会处于堵塞状态,很难发挥物联网和智能终端的优势。目前5G移动通信技术所研究的超密集组网,可以针对高度使用移动数据的地区提升流量容量1000倍,很好的解决了网络数据使用密集地区的数据传输和数据容量问题。该技术的发展,虽然在数据流量方面提升率非常高,但是由于其拓扑结构也更加复杂,各网络之间的信号干扰也是一个很大的麻烦,大家都知道一旦同一个区域的无线网络过多,就会相互之间产生干扰,影响网络的传输。因此,该技术还需要进一步的研究以适用

人机交互的新进展

人机交互的新进展 刘强 摘要:本文阐述了人机交互的概念和地位,分析了当前人机交互领域的一些进展情况。 关键词:人机交互;识别技术;感知;融合;Virtual Reality(虚拟现实); 1人机交互的概念和地位 人机交互,简单来说,就是人类与计算机交流互动。两者之间有这样一个传导链:通过人机接口技术,使人能够与计算机发生联系;而计算机则通过一种界面,使人能了解联系后的效果。 人机交互是计算机系统的重要组成部分,是当前计算机行业竞争的焦点,它的好坏直接影响计算机的可用性和效率。计算机处理速度和性能的迅猛提高并没有相应提高用户使用计算机交互的能力,其中一个重要原因就是缺少一个与之相适应的高效、自然的人-机界面。人机交互是未来IT的核心技术,也是目前国际上计算机科学研究领域中的一个热点。随着计算机在人们日常生活和工作中的作用越来越大,人机交互技术变得越来越重要。 2 人机交互的现状 目前,在国际上人机交互研究的内容主要包括以下几个方面:单一模式的识别技术研究;多模式人机交互技术研究;多感知信息的融合机理研究等。其中,最重要的是多模式人机交互技术研究和多感知信息的融合机理研究。 2.1 多模式人机交互 多模式人机交互实际上是人与人之间的交互的模拟。它的目标是将人与人之间的自然交互方式移植到人与计算机的交互中,即将人的各种行为通过键盘、鼠标、麦克风及摄像机等转换成计算机能感知到的位置、运动及听觉、视觉等信息。感知过程是人机交互的基础,但其实现也是非常困难的。特别是视觉感知部分尚未很好地得到解决,在处理诸如人体感知、手势识别、表情识别等感知行为时,目前的技术尚处于实验室研究阶段。 多模式人机交互的研究主要包括以下几个部分: 2.1.1语音识别技术 通过语音与计算机交互是人机交互过程中最自然的一种交互方式,也是未来最被看好的人机交互方式。目前,在此领域内可用的技术包括:语音识别、自然语言理解、自然语句的生成及自然语言对话等。语音识别的研究工作可以追溯到20世纪50年代贝尔实验室的Audry系统,此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。目前,国内外已经出现了一些商业化的产品,比如语音识别在身份确认上的应用,准确率已经达到99%,一句“芝麻开门”打开房门已经不是传说。 2.1.2手势识别技术 在人与人之间的交互过程中,手势一般是伴着语音同时进行的。在语言交流存在困难的情况下,手势的理解是非常重要的。而在大部分场合下,手势是对语言交互的补充。比如,我们在介绍一个物体的模糊的大小时,往往要利用手势。在人机交互过程中,手势分为两种:一种是基于笔输入的二维手势,另一种是真正用手作出的三维手势。目前比较常用的是基于笔输入的手势,这是因为这种手势的识别处理相对容易一些。而三维手势,由于计算机视觉技术存在的困难,目前实用化的系统不多。有些系统虽然采用了三维手势技术,但大多是利用数据手套完成的。而这一方面系统成本较高,另一方面,交互起来也不自然。最近,在ieee的模式识别与机器智能杂志上,连续发表了几篇有关三维手势的识别研究,他们采用的方法主要有隐马尔可夫模型(hmm)及彩色petri网模型。 2.1.3人脸识别技术 表情是人类交流信息的一种重要手段。因此,表情识别可以大大增强计算机的友好程度,提高其智能感知水平。另外,人脸的方向、人眼的跟踪都表达着交互的信息。视点的变化既能反映心理活动,又能反映注意方向,正所谓眼睛是心灵的窗户。通过视点跟踪,可以检测目光在屏幕上的所及之处,并作出恰当的响应。这尤其可帮助某些行动不便的残疾人使用计算机。因此,有关人脸的研究,在新一代人机交互中非常重要。相应的

高铁新城发展现状及未来可能发展方向

“施工现场尘土飞扬,高铁一开黄金万两。”在安徽北部城市蚌埠高铁站,这幅标语曾在周边的施工现场悬挂多时。 如蚌埠一样,在京沪高铁、京广高铁沿线,很多地方都以高铁站为核心,规划建设了大面积的高铁新城,意图拉动经济快速增长,拉开城市发展骨架。 理论上,高铁站点建设将加速城市产业升级和极化布局,提升周边土地价值,引发城市空间格局的转变。但是,中国上一轮高铁建设对于周边土地价值的提升和城市空间布局的优化作用,并没有体现出来。 中国城市规划学会秘书长石楠直言不讳:“最大的问题是高铁站点建设大干快上,没有和周边的土地开发相结合。” 规划窘境 从北京西站乘坐京广高铁,仅用时40分钟就到了保定东站。气派的大站房,宽阔的站前广场,与全国其他很多高铁站点面貌相似。 除候车大厅内一间小店外,站前广场及周边没有任何的商业配套。大量农地绵延环绕,远处可见依稀分散的村落,几座高楼孤零零地耸立其中。 保定市规划局负责人告诉《财经国家周刊》记者,随着京津冀协同发展上升为国家战略,保定市目前正在结合新形势、新情况、新需要,“对原有高铁新城规划进行审视修改”。 另一个位于京沪高铁线上的德州东站,虽距北京仅一个多小时车程,但从德州东站乘坐公共交通到德州城区,仍需约一个小时。高铁带来的便捷性大打折扣。 德州市经济技术开发区规划分局提供的资料显示,德州市高铁新城规划占地面积56平方公里,计划打造成“科技引领、产业支撑、产城融合、宜居宜业”的新城。 然而德州市国土局相关负责人坦言,德州高铁站的影响力并未显现。高铁站点距城区较远,且存在土地利用总体规划调整等问题,真正与城区的接轨有一定难度。因此,对周边地价尚未产生显著的影响。 保定和德州面临的窘境,几乎出现在上一轮高铁站点坐落的大部分二三线城市。 “高铁站点红线内外土地综合开发的增值利益显而易见,但是由于规划没有协同,数以千亿元潜在的土地收益已被白白浪费。”国家发改委综合运输研究所运输管理研究室主任刘斌对此表示痛心。 他认为,对于已建成的高铁线,出于高铁运行安全考虑,红线内铁路用地变更属性进行商业开发已不可能,而红线外土地增值收益的实现,仍需要“一个较长时间的培养过程”。

2019智能汽车人机交互现状及发展趋势研究报告

2019智能汽车人机交互现状及发展趋势研究报告

目录 一、研究背景和意义 (5) (一)人机交互与人机交互界面 (5) (二)人机交互发展趋于人性化、高效化 (5) 1、早期手工作业阶段 (6) 2、作业控制语言及交互命令语言阶段 (6) 3、图形用户界面(GUI)阶段 (6) 4、网络用户界面阶段 (6) 5、多通道人机交互阶段 (6) (三)人机交互已成为智能汽车的发展的核心问题 (7) 二、智能汽车人机交互设计现状 (7) (一)人机交互研究呈多学科融合特征 (7) (二)以用户为中心的设计理念和设计流程 (8) (三)智能化趋势对人机交互提出更高的要求 (9) (四)国内外典型的人机交互系统 (10) 1、宝马iDrive 系统 (11) 2、奔驰COMAND 系统 (11) 3、奥迪MMI 系统 (11) 4、安吉星系统 (12) 5、福特MyFordTouch 系统 (12) 6、沃尔沃SENSUS 系统 (13) 7、日产CARWINGS 系统 (13) 8、丰田G-book 系统 (14) 9、荣威inkanet 系统 (14) 10、比亚迪DiLink 智能网联系统 (15) 三、智能汽车人机交互发展趋势 (15) (一)交互内容和场景的扩展 (15) 1、智能汽车与环境充分交互 (16)

2、智能汽车的多场景化交互 (16) 3、车内及车外信息显示与分析 (17) 4、智能汽车人机共驾交互设计 (17) (二)交互方式的创新和新技术的应用 (18) 1、显控一体化交互 (18) 2、多通道协同交互 (19) 3、基于生物识别和感知技术的人机交互 (19) 4、基于智能化技术的情感交互 (20)

项目名称人机交互力反馈遥操作机器人关键技术及应用

项目名称:人机交互力反馈遥操作机器人关键技术及应用 完成人:宋爱国,宋光明,李会军,唐鸿儒,崔建伟,赵国普,徐宝国,吴涓,李建清,卢伟,包加桐 完成单位:东南大学,扬州大学 项目简介: 人机交互力反馈遥操作机器人系统将人的知识智慧与机器人的适应性相结合,通过人与机器人之间传感与控制信息的交互,可以实现各种远地环境或危险环境中的复杂作业任务,是当前各发达国家竞相发展的高技术。随着人机交互遥操作机器人在远程作业、远程监控、远程制造、远程医疗等领域的应用,迫切需要解决多个技术难题与技术瓶颈。本项目针对人机交互力反馈遥操作机器人的力感知、力反馈、大时延控制和人机交互界面设计等关键技术,经过十多年系统深入的研究,突破了多项核心技术,研制成功人机交互遥操作的关键支撑设备,填补了国内空白,并在多个重要领域得到成功应用。 本项目的技术创新点:(1)提出了一种自解耦的机器人多维力传感器的敏感单元设计方法,从传感器的结构设计上有效降低了多维力传感器的维间耦合效应;提出了一种基于误差建模的多维力传感器解耦算法,提高了多维力传感器的测量精度,测量精度可达1%F.S.。(2)提出了一种基于磁流变液控制的无源力觉再现方法,解决了大量程力反馈人机交互设备的体积大、惯性大与不安全问题,实现了大量程安全柔性的力触觉人机交互。提出了一种基于并联机构的异构式机器人力反馈手控器设计方法,解决了力反馈手控器三维平动和三维转动之间运动与力的耦合问题,六维运动位置测量精度达1%F.S.,力反馈精度达2%F.S.。(3)针对人机交互力反馈遥操作机器人在双边通讯环节上存在的短时延(≤2 秒)造成的不稳定问题,提出了力反馈遥操作机器人的多模式控制技术和自适应阻抗匹配无源控制算法,解决了短时延情况下力反馈遥操作机器人的稳定性和操作性问题;针对人机交互力反馈遥操作机器人在双边通讯环节上存在的大时延(>2 秒)造成的不稳定难题,提出了基于虚拟环境建模的力反馈遥操作机器人预测控制技术,给出了基于滑动最小二乘法的环境动力学参数在线辨识算法和模型滚动修正方法,解决了大时延情况下力反馈遥操作机器人稳定性和操作性问题。(4)提出了以提高人的感知能力为目标的交互式力反馈遥操作机器人的多感知界面设计方法,并针对人机交互界面力触觉感知与视觉感知的协调同步问题,提出了一种分布式力触觉交互的快速计算算法和无源稳定性判据,实现了多感知通道人机交互方式下具有力觉临场感的遥操作。 本项目获国家发明专利授权33项;获实用新型专利授权5项;获计算机软件著作权2项。发表论文186,其中SCI收录65篇,EI收录107篇,论文被他人引用1200多次,其中SCI他引375次,并在国际遥控机器人会议上作大会特邀报告。本项目相关成果曾获2010年国家知识产权局中国专利优秀奖、2012年与2013年日内瓦国际发明金奖等。

现代人机交互技术最新情况

现代人机交互技术最新情况 普适计算 1.IBM研发的BlueBoard (蓝板)技术,BlueBoard是一片薄薄的屏幕板,使用者只用其胸前挂着的看上去与普通员工卡没什么两样的小卡片,对准蓝板一下,就可以显示出其个人主页及定制好的其它内容。其后的一切操作和任务都只靠使用者的手指在蓝板上指指划划就全部搞定了,包括查阅资料、共享文件、与同事实时互传信息、发送指令、布置任务、协同工作等。 2. Informedia 数字图书馆系统,Informedia采用了多模态输入方式,用户 可以用语音提出查询请求。当用户要求从数据库中查找指定的电视新闻资料时,系统将根据用户的请求返回相应的视频片段。In formedia集成了语音、图像和自然语言理解技术,在目前的原型系统中,系统可以自动地分析视频数据,从中提取出摘要信息并编加索引。视频数据的分析过程结合了针对视频的镜头检测、 图像分析,以及字幕文本(Close Caption )和伴音信息分析。与仅采用单一模态数据的分析方法相比,这种合成方式能够更好地提取视频的语义。 3. MIT的Galaxy系统,Galaxy系统向人们展示了系统如何与用户相协调, 从而提供对多种异构数据源的无缝访问。对于用户的请求,系统不仅仅是返回来 自各方面的答案,而且还尽可能地找出不同领域中的相关答案,并根据用户感兴趣的程度排序。随后,用户与系统进行更进一步的对话,最终获得尽可能准确的结果。这种带有联想性质的交互过程使得用户感觉不是在跟一个死板的计算机系 统打交道,而是与一个聪明的代理人交互。 可穿戴计算 从谷歌、苹果、RIM相继发布的智能眼镜系列产品,到Fitbit 、Jaw bone、耐克相继推出的智能腕带,可穿戴计算逐步成为了IT界的热词。iwatch,可以 给智能手机和其他小型电子产品充电的太阳能比基尼,随行键盘牛仔裤,可以使聋人和盲人发送短信的移动框架手套,能更新Facebook状态的社交牛仔裤,能在衣服上呈现任何图案的内置电流回路K服饰,可以打电话的移动手套,电子鼓机T恤,乐器节拍手套,能通过行走的热能给智能手机充电的充电鞋,对饮食和睡眠状态进行跟踪的智能腕带,,,可穿戴计算设备层出不穷,不断丰富着新一代IT产品市场。盛大、百度等企业也不甘落后,近期已相继出手,分别推出了geak智能手表和咕咚健康手环等产品。 多点触控 1. 微软:Surface电脑,5月,《华尔街日报》的“ D:AII Things Digital ”会议上,微软演示了一种Surface Computing(表面计算)技术,并由此组建了一个

智能机器人关键技术及其发展趋势

智能机器人的关键技术及其发展趋势 机器人是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。按联合国标准化组织采纳了美国机器人协会给机器人下的定义,即为:一种可编程和多功能的,用来搬运材料、零件、工具的操作机;或是为了执行不同的任务而具有可用电脑改变和可编程动作的专门系统。 而智能机器人有相当发达的“大脑”。在脑中起作用的是中央计算机,这种计算机跟操作它的人有直接的联系。它给人的最深刻的印象是一个独特的进行自我控制的“活物”。其实,这个自控“活物”的主要器官并没有像真正的人那样微妙而复杂。到目前为止,在世界范围内还没有一个统一的智能机器人定义。大多数专家认为智能机器人至少要具备以下三个要素:一是感觉要素,用来认识周围环境状态;二是运动要素,对外界做出反应性动作;三是思考要素,根据感觉要素所得到的信息,思考出采用什么样的动作。 智能机器人根据其智能程度的不同,又可分为三种: 传感型机器人,又称外部受控机器人。机器人的本体上没有智能单元只有执行机构和感应机构,它具有利用传感信息(包括视觉、听觉、触觉、接近觉、力觉和红外、超声及激光等)进行传感信息处理、实现控制与操作的能力。受控于外部计算机,在外部计算机上具有智能处理单元,处理由受控机器人采集的各种信息以及机器人本身的各种姿态和轨迹等信息,然后发出控制指令指挥机器人的动作。目前机器人世界杯的小型组比赛使用的机器人就属于这样的类型。 交互型机器人,机器人通过计算机系统与操作员或程序员进行人-机对话,实现对机器人的控制与操作。虽然具有了部分处理和决策功能,能够独立地实现一些诸如轨迹规划、简单的避障等功能,但是还要受到外部的控制。 自主型机器人,在设计制作之后,机器人无需人的干预,能够在各种环境下自动完成各项拟人任务。自主型机器人的本体上具有感知、处理、决策、执行等模块,可以就像一个自主的人一样独立地活动和处理问题。机器人世界杯的中型组比赛中使用的机器人就属于这一类型。全自主移动机器人的最重要的特点在于它的自主性和适应性,自主性是指它可以在一定的环境中,不依赖任何外部控制,完全自主地执行一定的任务。适应性是指它可以实时识别和测量周围的物体,根据环境的变化,调节自身的参数,调整动作策略以及处理紧急情况。交互性也是自主机器人的一个重要特点,机器人可以与人、与外部环境以及与其他机器人之间进行信息的交流。由于全自主移动机器人涉及诸如驱动器控制、传感器数据融合、图像处理、模式识别、神经网络等许多方面的研究,所以能够综合反映一个国家在制造业和人工智能等方面的水平。因此,许多国家都非常重视全自主移动机器人的研究。 下面就机器人的控制技术以及列举几种常见的机器人对当前智能机器人的关键技术进行分析。

2020年人机交互畅想

2020年人机交互畅想 一、人机交互的现状 自苹果公司推出装配有独特的iOS操作系统的iPhone、iPad、iPod touch系列高端电子产品之后,21世纪的不分国别和种族的人们得以亲身体验高科技带来前所未有的感官体验。iOS系统正是采用了可支持更复杂姿势识别的多触点电容式触摸屏技术,以及基于传感器的捕捉用户意图的隐式输入技术。这些新技术的使用寓意着人机交互技术在不久的将来必将成为IT行业的后起之秀,它给人类社会带来的变革将会是历史性和革命性的。因此,人机交互必将拥有广阔的发展前景。 目前,人机交互技术正处于多通道、多媒体的智能人机交互阶段。苹果公司推出的系列产品也足以说明该阶段已经取得了一定的研究成果。多通道技术方面,“汉王笔”手写汉字识别系统、微软的Tablet PC 操作系统中数字墨水技术、广泛应用于Office/XP的中文版等办公、应用软件中的IBM/Via V oice连续中文语音识别系统、以摄像机、图像采集卡作为输入设备的手势识别技术等都是在该领域具有代表性的研究成果;多媒体技术方面,触摸式显示屏实现的“桌面”计算机、能够随意折叠的柔性显示屏制造的电子书、从电影院搬进客厅的3D显示器、使用红绿蓝光激光二极管的视网膜成像显示器等也都是在该领域具有代表性的新产品。 基于现阶段,人们在人机交互领域所取得的成就以及人们对未来人机交互的高度期待,我们应该不难得到这样的论断:未来的更先进

的人机交互技术的可操作性将更加简洁,实用性更加完善,更易为普通用户接受以及熟练使用,更加友好的人机界面能给用户带来超越功能和形式的束缚,享受更积极、美好、和谐的生活乐趣。 二、人机交互技术畅想 首先,何为人机交互? 简单来说,人机交互就是人类与计算机的交流互动。如上所述,如今的人机交互技术正处于起步阶段,对于更普通的用户来说,其操作仍然是复杂难懂的,并且也还没达到很高的智能化。在我的畅想中,2020年的人机交互技术将在给人们带来的视觉冲击、体感交互、语音交互等方面取得很大的进步。 视觉冲击: 2010年电影《阿凡达》上映接近尾声之时,索尼公司在中国首次展出了3D电视机,给大家带来了极大的视觉冲击,它实现了将3D 技术从电影院搬进了客厅。随后,夏普公司也推出了裸眼3D手机,这使得3D技术得以通过移动设备加以普及和运用。但是,这些都还是局限于有形的设备上技术。2020年,人机交互不再是局限于有形的设备,而更多的是基于虚拟设备。可以想象一下,每天回到家中,当你想看电视节目的时候,你要做的只是说一句简单的口令:“我要看电视。”然后你的语音信息将通过传感器传递到智能家庭设备控制中心,通过语音识别系统分析执行指令,并将下一步运行指令下达到

人机交互技术的发展与现状定稿版

人机交互技术的发展与 现状精编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

人机交互技术的发展与现状 一. 什么是人机交互技术 二. 人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输 入、输出设备,以有效的方式实现人与计算机对话的技术。人机交互技术包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息,回答问题及提示请示等。人机交互技术是计算机用户界面设计中的重要内容之一。它与认知学、人机工程学、心理学等学科领域有密切的联系。 也指通过电极将神经信号与电子信号互相联系,达到人脑与电脑互相沟通的技术,可以预见,电脑甚至可以在未来成为一种媒介,达到人脑与人脑意识之间的交流,即心灵感应。二.人机交互技术的发展人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史。 1959年美国学者B.Shackel从人在操纵计算机时如何才能减轻疲劳出发,提出了被认为是人机界面的第一篇文献的关于计算机控制台设计的人机工程学的论文。1960年,Liklider JCK首次提出人机紧密共栖(Human-Computer Close Symbiosis)的概念,被视为人机界面学的启蒙观点。 1969年在英国剑桥大学召开了第一次人机系统国际大会,同年第一份专业杂志国际人机研究(IJMMS)创刊。可以说,1969年是人机界面学发展史的里程碑。在1970年成立了两个HCI研究中心:一个是英国的Loughbocough大学的HUSAT研究中心,另一个是美国Xerox公司的Palo Alto研究中心。 1970年到1973年出版了四本与计算机相关的人机工程学专着,为人机交互界面的发展指明了方向。 20世纪80年代初期,学术界相继出版了六本专着,对最新的人机交互研究成果进行了总结。人机交互学科逐渐形成了自己的理论体系和实践范畴的架构。理论体系方面,从人机工程学独立出来,更加强调认知心理学以及行为学和社会学的某些人文科学的理论指导;实践范畴方面,从人机界面(人机接口)拓延开来,强调计算机对于人的反馈交互作用。人机界面一词被人机交互所取代。HCI中的I,也由

福州宝龙城市广场业态分析

宝龙·城市广场 ――福州新航母商业迪斯尼 第一步先来认识宝龙城市广场 宝龙城市广场位于福州市台江区工业路与二环路交汇处,东至宁化路,南至宁化小区,西至西二环路,北至工业路。位于大福州的几何中心,与福州两大传统商业街区东街口和中亭街的黄金分割点——洋头口近在咫尺。 1 为什么说宝龙城市广场是地标式的商业中心? 2004,中国最具投资价值的商业地产 商业零售业专业人士一致看好宝龙城市广场地段的现有购买力和该商圈的前景 房地产业内人士一致看好宝龙城市广场地段前景 (投资建设一年,区域周边地价从100万元/亩,提升至387万元/亩。) 宝龙城市广场进一步完善福州的城市配套功能,五星级电影城、高档娱乐、大型一站式购物中心极大提高了福州的商业档次,独特的建筑景观提高了福州的建筑层次。 位于大福州商业核心区,辐射市区200万人口,该商圈人均GDP超过3000美元,在10分钟车程内延及南北江滨众多高尚社区,聚集人流和消费力的潜力惊人,宝龙城市广场必将成为该区域范围内最重要的生活配套。其商业服务半径必将覆盖至整个福州市区及五区八县、莆田、南平、宁德等城市。 2为什么说宝龙城市广场的经营模式上比福州以往传统商场更有优势? 宝龙城市广场的经营模式: ONLY ONE一站式消费+EPTC体验型消费,是目前国际驻留商业模式,是国内最现金商业模式,领先福州同业50年,在国外有1>50定律,即该商业模式仅占商业总量的1%,但却占有50%的商业市场份额。相比传统零售商业以“购”为主,功能配套只是围绕“购”而展开,存在功能配套不健全的先天不足。 哪个商场能统一购物、休闲、娱乐、餐饮等业态,用专业公司统一管理,同样只有宝龙城市广场。这就是宝龙城市广场不同于传统商业的地方,也正是它会较传统商业成倍地吸引人流的地方,是投资、经营的保障。 宝龙城市广场的经营优势:

人机交互发展状况深度分析及前景预测分析汇总

人机交互发展状况深度分析及前景预测分析 一、人机交互概念 人机交互(Human-ComputerInteraction,HCI)主要是研究用户与系统之间的信息交换,它主要包括用户到系统和系统到用户的信息交换两部分。系统可以是各种各样的机器,也可以是智能电视机、智能手机以及计算机系统和软件。用户可以借助操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等各类穿戴设备,用手势、声音、姿势或身体的动作、眼睛甚至脑电波等向系统传递信息,同时,系统通过各类机器、显示器、音箱等输出或显示设备给人提供信息。 理想状态下,人机交互将不再需要依赖机器语言,在没有键盘、鼠标以及触摸屏等中间设备的情况下,实现随时随地实现人机的自由交流。从而实现人们的物质世界和虚拟网络的最终融合。 从本质上,人机交互技术是一个典型的模式识别问题,智能机器通过多种传感器,获取人的表情、姿态、手势、语音、语调、血压、心率等各种数据,结合当时的环境、语境、情境等上下文信息,识别和理解用户的情感。这包括传感器技术、计算机科学、认知科学、人机工程学、多媒体技术和虚拟现实技术、心理学、哲学以及人类学等诸多学科领域有密切的联系。 二、人机交互发展阶段 从以设备为主到忽略设备存在,是人机交互的基本发展思路。交互建立初始,从按键到触控屏的转变是关键,重点是提高触控性能和扩大触控范围;同时显示质量从VGA至UHD (4K);工业设计方面则是更纤薄的曲面显示。之后,专注于用户的个性化交互还是被广泛应用,变革的标志是密码的使用正在减少,取而代之的是生物识别(用户独有的特征)。这将推动移动支付的普及,但仍需要协调银行,支付机构,商家,技术提供商等各个环节,因此需要FIDO(线上快速身份验证)联盟来制定标准。接下来,专注于环境的情景识别交互是必然趋势,这个阶段的目标是让设备能够了解环境情况,能够预知用户的潜在需求。这需要不同类型的传感器一起工作,增强现实感。最终,个人设备将退居幕后,甚至消失在信息基础设施中,取而代之的是纤巧尺寸的传感器将无处不在。这是通过全方位感知来获得终极用户体验的阶段。 三、人机交互产业链

浅析我国城市规划的现状及发展趋势 包玥

浅析我国城市规划的现状及发展趋势包玥 发表时间:2018-12-05T11:14:26.753Z 来源:《建筑学研究前沿》2018年第24期作者:包玥 [导读] 城市规划是规范城市发展建设,研究城市的未来发展、城市的合理布局和综合安排城市各项工程建设的综合部署,是一定时期内城市发展的蓝图,是城市管理的重要组成部分,是城市建设和管理的依据。 北京奥科兴源科技企业孵化器有限公司北京 100000 摘要:城市规划是规范城市发展建设,研究城市的未来发展、城市的合理布局和综合安排城市各项工程建设的综合部署,是一定时期内城市发展的蓝图,是城市管理的重要组成部分,是城市建设和管理的依据。本文详细阐述了目前现阶段传统理念与超前意识的矛盾,生态平衡破坏现象严重,城市建设风格雷同,千城一面,区域化规划或协调机制不健全,传统的大而全、小而全思想仍占上风等城市规划现状,针对于不同的发展现状提出了几点有效策略,希望能为未来的城市规划建设工作提供参考。 关键词:城市规划;现状;发展趋势 1城市规划相关概述 城市规划属于一种社会性规划,涉及内容较多、范围较广是一项系统性工程,其内容可包括人口规模的调整、公共设施、住房、广场、交通运输、园林绿化、消防安全、医疗及教育等多方面。城市规划是进行城市建设的重要前提及科学依据,可使城市内的资源得到合理配置,是实现城市经济高速发展、可持续发展的重要途径。科学化、低碳化、个性化、系统化地进行城市规划有助于促进城市建设管理,有助于促进城市经济可持续发展。 2现阶段我国城市规划建设的现状 2.1传统理念与超前意识的矛盾 城市规划作为城市未来空间发展的安排意图,其意在长远。如城市总体规划是考虑城市20 年左右的城市土地及空间利用的宏观安排,需要具有超前的规划意识,而在许多城市规划方案及对规划的管理控制过程中,不仅缺乏长远的规划意识,反而受到传统思想左右,造成城市建设出现了诸多问题[1]。如河南夏邑县曹集乡政府办公楼、内蒙古鄂尔多斯市康巴什广场等,都存在因受讲排场、求大气等传统思想左右,出现建成后受人诟病的情形。 2.2生态平衡破坏现象严重 城市规划以空间规划为主要形式,以全面塑造公共生活空间,提高城市现代化水平,促进城市可持续发展为目的。然而纵观当前城市规划现状,其性质已慢慢发生了转变,城市规划已逐渐衍生成了促进城市发展、获取高效利益的一项工具。相关部门由于缺乏生态经济观念,不计后果,盲目追求短期发展目标,导致城市的生态环境遭到了严重的破坏,制约了城市的可持续发展。除此之外,过份的追求发展速度及局部利益,居住环境混乱、活动空间小、人口密集等现象严重,使得城市居民生活质量受到严重影响[2]。例如一部分城市规划部门为了获取短期的经济利益,而对传统的城市建筑以及城市的生态环境造成了大规模的破坏,最终严重影响城市的长远发展能力。 2.3城市建设风格雷同,千城一面 盲目追求城市变大、变新、变洋,热衷于建设“标志性”建筑,大广场、宽马路、大草坪、豪华办公楼、景观房产、欧化建筑席卷全国。“千城一面”是中国城市无可回避的尴尬,很多地方在规划过程中只重视总体规划和建设规划等硬规划,对产业规划、特色规划等软规划缺少关注,缺乏对城镇资源环境、地理区位、交通状况的具体化分析。而当前越来越多的城市打造自身专属的“城市名片”则令人看到了摆脱这种尴尬的希冀。因此,例如大都市的CBD,在区域模式和建筑设计的方面,势必会走向一定的相似性,即便视觉上努力地进行区别,除非是名载史册的摩天大楼,人们还是很难分辨两个城市核心区。 2.4区域化规划或协调机制不健全,传统的大而全、小而全思想仍占上风 一些规划部门仍拘泥于“城市规划”的旧框框,忽视了城市与周边城镇的协调发展,这种“只见单个城市,不见区域城市群”的传统思维,使城市发展的良性循环受到破坏。 2.5监管力度有待加强 城市规划过程本来就是一个动态变化的过程,需根据现实情况灵活变动,不定期对城市布局进行适当的调整。然而这一特点却给部分工作人员留下了缺口。有些工作人员利用职位之便谋求私利,随意变动规划方案,使得城市规划的科学性不高。导致这一现象的根本原因就是规划管理部门未严格执行其职责,管理力度不够,使得相关人员有机可乘。此外,由于缺乏规范的管理,管理层人员常有身兼数职的现象,难以将其监督职责落到实处。 3针对城市规划现状提出的建议和对策 3.1规划思想转变 城市规划应具有前瞻性,发展应与时俱进,同时预测城市未来发展的多种变化与可能性,在进行城市用地及空间布局时,必须考虑与土地利用总体规划及国民经济与社会发展规划相衔接,以达到更好地促进本地社会经济全面发展的目的。同时,基于社会发展的需要,应将生态优先、尊重历史与文化、多元化决策等理念融入城市规划全过程。此外,城市规划应由单一的技术手段向综合多样的决策和博弈过程转变,切实增强城市规划的控制作用,坚决维护规划的法律效力,有效进行城乡空间开发利用管制,明确区分城乡规划中严禁建设开发的地段及限制、适宜开发建设的地段。政府从上级至下级应对专项规划编制经费给予充足保障,在经费充足的基础上,力邀高水平的正规单位进行规划编制工作,坚决避免蓝图式规划,有效做到规划刚性与弹性的有机统一;在保证规划成果水平的基础上,还能维护当地规划设计市场的良好运转秩序[3]。 3.2坚持可持续发展战略 从城市规划管理角度分析,坚持可持续发展目标需要做好以下几方面工作:(1)做好经济效益与生态效益的处理。从城市的未来发展角度考虑,如何实现经济与生态效益的双向吸收是城市发展的重要支持,为此政府要加大对一些无偿公共生态事业的投入,使城市的生态发展能够与经济发展保持平衡。(2)科学调节局部资源与整体资源管理。在对城市资源开发过程中,政府部门必须要做到有计划、有步

相关文档
最新文档