基于知识图谱的图像语义分析技术及应用研究

Computer Science and Application 计算机科学与应用, 2018, 8(9), 1364-1371

Published Online September 2018 in Hans. https://www.360docs.net/doc/e516800951.html,/journal/csa

https://https://www.360docs.net/doc/e516800951.html,/10.12677/csa.2018.89148

The Research of Image Semantic Analysis

Technology and Application Based on

Knowledge Graph

Liqiong Deng, Guixin Zhang, Xiangning Hao

Department of Command Information System and Network, Air Force Communication NCO Academy,

Dalian Liaoning

Received: Aug. 24th, 2018; accepted: Sep. 6th, 2018; published: Sep. 13th, 2018

Abstract

The semantic analysis technology of image has always been a difficult point in image field. As an intelligent and efficient way of organizing, knowledge graph can help users accurately query the information. This paper firstly puts forward an image semantic analysis process based on know-ledge graph, then adopts deep learning model to describe image’s features. Image semantic know-ledge fusion and processing is studied on this basis; a multilevel image semantic model con-structed has ability to manage entity triples and support automatic construction. Finally, applica-tions in semantic retrieval, association and visualization are analyzed, which has some guiding significance for information organization and knowledge management of media semantic.

Keywords

Knowledge Graph, Deep Learning, Image, Semantic Analysis, Semantic Retrieval

基于知识图谱的图像语义分析技术及应用研究

邓莉琼，张贵新，郝向宁

空军通信士官学校指挥信息系统与网络系，辽宁大连

收稿日期：2018年8月24日；录用日期：2018年9月6日；发布日期：2018年9月13日

摘要

图像的语义分析技术一直是图像领域的研究难点之一，知识图谱作为一种智能的知识组织方式，可以帮

邓莉琼等

助用户迅速、准确地查询到所需要的信息。本文首先提出了一种基于知识图谱的图像语义分析流程，然后采用了深度表达模型对图像的机构化语义信息进行描述和抽取，在此基础上研究了基于知识图谱的图像语义知识融合和加工技术，构建后的多层次图像语义模型具备管理实体关系三元组的能力、支持图谱的自动构建与多模式查询。最后基于该思路分析了图像语义分析技术在语义检索、关联分析及可视化方面等的应用，对媒体语义中的信息组织和知识管理有一定的指导意义。

关键词

知识图谱，深度学习，图像，语义分析，语义检索

This work is licensed under the Creative Commons Attribution International License (CC BY).

https://www.360docs.net/doc/e516800951.html,/licenses/by/4.0/

1. 引言

图像作为一种内容丰富、表现直观的媒体信息，越来越受到人们的青睐，如何有效地描述和检索这些图像信息成为研究者们所关心的热点问题。尤其是随着近几年深度学习技术的日趋完善，传统的计算机视觉任务得到了前所未有的发展，提升了图像信息提取的能力。然而图像语义理解和语义分析等研究领域还停留在传统的图像信息抽取和图像标注技术上。

由于知识是对信息的进一步组织和抽象，符合人类活动的语义和逻辑。知识图谱技术在增进信息的组织、管理和理解领域具有巨大的应用潜力，是对图像视觉语义理解的一个行之有效的途径。相对于信息，知识能更直接地指导人的决策和行动。因此本文提出了一种基于知识图谱的图像语义分析的思路，将知识图谱技术用于构建图像的语义概念关系之中，能将完整的图像内容转换成可直观理解的结构化语言表达及可视化分析，在图像理解中起着至关重要的作用，同时还为基于语义的图像检索和多媒体关联提供了一定的解决思路。

2. 相关工作

图像语义分析的难点主要集中在两方面：1) 图像的视觉表达和语义之间很难建立合理关联，描述实体间产生巨大的语义鸿沟(Semantic Gap)；2) 语义本身具有表达的多义性和不确定性。目前，越来越多的研究在关注上述瓶颈，并致力于有效模型和方法以实现图像理解中的语义表达。目前的解决思路可大致分为三类，第一条思路侧重于图像本身的研究，通过构建和图像内容相一致的模型或方法，将语义隐式地融入其中，建立文本-图像的有向联系，核心在如何将语义融于模型和方法中；第二条思路从语义本身的句法表达和结构关系入手，分析其组成及相互关系，通过建立与之类似的图像视觉元素结构表达，将语义描述和分析方法显式地植入包含句法关系的视觉图中，建立图像-文本的有向联系；第三条思路面向应用，以基于内容图像检索为核心，增加语义词汇规模，构建多语义多用户多进程的图像检索查询系统。

图像的语义分析是建立在图像的信息抽取技术上的，图像信息抽取研究经历了三个阶段：1) 利用文本来描述图像特征；2) 图像底层视觉特征；3) 图像的语义内在特征。早期的图像信息抽取是利用底层图像特征，如方向梯度直方图HOG和尺度不变特征转换SIFT [1]。基于机器学习的方法从最简单的像素级别阈值法、基于像素聚类的分割方法到基于图论划分的分割方法[2]。基于机器学习的方法，先将输入图像分为一些独立的区域块，并提取每个区域块的特征，然后根据一定的规则建立图像特征与语义类别之

邓莉琼等

间的概率模型，建立起能量函数，并通过手工标注的特征库，迭代计算对能量函数进行优化，得到最优的参数，最终得到图像信息模型。这种机器学习的方法过于依赖手工标注的特征库，难以广泛表示图像特征，在实际应用中有很大的局限性。

面对海量的图像信息，人们期望以更加智能的方式组织图像资源。为了满足这种需求，知识图谱应运而生。它们力求通过将知识进行更加有序、有机的组织，对用户提供更加智能的访问接口，使用户可以更加快速、准确地访问自己需要的知识信息，并进行一定的知识挖掘和智能决策[3]。知识图谱技术的出现使得信息可以在语义层面上进行整合，这种语义层次的关联技术能够为图像的语义分析研判提供强有力的支撑。知识图谱即为用图对知识和知识间关系进行建模。知识图谱的功能主要体现在知识组织、展示与搜索方面[4]：第一，在一定程度上克服自然语言的歧义性; 第二，把经过梳理、总结的知识提供给用户; 第三，提供更深入更广阔的知识，知识图谱尝试通过对其他用户相关的搜索记录进行推理，激发用户对知识的搜索兴趣，从而进行一次全新的查询操作。

3. 基于知识图谱的图像语义分析流程

针对图像的语义分析，本文所提出的基于知识图像的图像语义分析流程图如图1所示，分析流程包括数据获取、信息抽取、知识融合加工、知识存储、知识应用和可视化结果6个部分。

图像数据获取是采集原始的图像数据，即可以包含结构化数据，如标注文本等信息，也可以包含半结构化和非结构化的图像特征信息等；图像的信息抽取是将图像数据进行抽象归纳为更具有语义特点的单元，例如实体抽取、实体之间的关系抽取以及实体的属性抽取等，为后续的知识提取做铺垫；图像的知识融合和加工是在图像信息抽取的基础上将信息升级为知识，例如具有相同表达但不同信息的实体消岐、具有相同意思但不同表达的知识合并、对知识进行概念归纳的本体构建以及丰富语义内涵的知识推理；图像的知识存储是利用知识图谱的三元组表达方式，结合前面两步获取的知识，将其存储在数据库中并进行知识更新；可视化结果则是利用知识图谱的可视化工具将图像的知识图像语义分析记过以网状可视化方式直观的展现出图像知识组成。

4. 基于深度表达模型的图像结构化语义信息抽取技术

图像信息抽取是通过一定的方法将图像中的每个像素分为不同的语义类别，最终得到不同的实体、关系、属性等信息。传统的图像语义特征的提取是以图像低层视觉特征为基础的，即首先通过相关的图像特征提取方法提取出图像的颜色、纹理、形状、轮廓等低层特征信息，然后寻找图像低层特征与高层语义的相关性，最后建立低层特征与高层语义的映射关系[5]。

Figure 1.Image semantic analysis flow based on knowledge graph

图1. 基于知识图谱的图像语义分析流程

邓莉琼等

近年来深度卷积神经网络(DCNNs) [6]的发展，使得计算机视觉任务中的许多问题得到了巨大的突破。由于深度卷积网络可以从大量样本数据中提取出图像的特征，比手工标注特征更好，在图像分类和物体检测等高层计算机视觉任务上获得了巨大的成功。LinG等[7]通过多尺度图像作为输入产生不同尺度的特征图，应用DCNN的图像信息抽取模型，可以通过大量的样本自主学习特征，打破了手工标注特征的局限性。本文首先提出了面向知识图谱构建的图像语义层次描述框架，然后利用深度学习技术实现图像的主要信息提取。

4.1. 图像语义层次描述框架

该框架主要包括四个层次，第一层关注整体感官信息，着重描述图像中整体的基础特征。例如，图像的纹理、色彩、形状、空间分布；第二层从整体转移至局部，开始关注图像中的实体与场景。实体的判断主要包括人物、动物、物体等。场景的信息抽取是交代图像整体的语义背景，同时提供依赖情境，是增加图像纵向关联不可缺少的基础数据。

第三层聚焦于实体的关系和属性上，主要是识别其与其他实体之间的交互位置关系。交互位置是立足于实体相对位置的描述，判断实体关系及实体交互位置关系是图像语义关联中的重要组成部分。实体的属性是描述实体包含的具体参数，例如种类、大小、颜色等信息，识别在该情境下各个实体的内涵。最后建立在属性与交互位置关系之上的行为交互语义。充分挖掘实体之间的横向关联和纵向关联；第四层是一种整体语义的回归，是判断完所有局部和聚焦信息后的语义概括，是全部对象行为的语义整合(图2)。

4.2. 实体抽取

人类视觉系统对复杂的场景结构具有较强的感知能力，例如场景中的物体类别、物体的空间位置、物体间的组合关系等。如何将上述具有明显结构的语义信息融入到深度模型的设计中，是视觉研究领域广泛关注的问题。神经网络的出现，使端到端的图像处理成为可能，而卷积神经网络(CNN)便是深度学习与图像处理技术相结合所产生的经典模型。本文采取的具体方法是文献[8]所提出的融合结构化语义的深度表达模型，即CNN-RNN的混合神经网络图像语义表达。该模型把一系列带有结构的语法知识融入到深度表达学习中，借助递归神经网络的特性对图像中的物体、物体间的关系等进行结构化的组合与表达。最终模型实现图像的深度层次化语义解析。

Figure 2. Image semantic hierarchy framework

图2. 图像语义层次框架

邓莉琼等

该网络包含了2个相互连接的神经网络结构，底层是深度卷积神经网络(CNN) [9]，上层是递归神经网络(RNN)。在CNN-RNN混合模型中、CNN模型和RNN模型将协同工作。其中，CNN模型能够生成具有判别能力的图像特征表达，被广泛地应用于图像分类与物体识别任务中，因此将其用作物体类别的表达学习；RNN模型则被一系列工作[10]证明能够对图像或者自然语言中的结构化组合关系进行预测，其原因在于该类网络能够同时对语义和结构化表达进行递归地学习，故而利用RNN模型把CNN模型产生的特征表达作为输入，用于进一步生成场景的结构化配置。该算法经实验验证，对图像实体语义抽取的准确度较高，具体算法实现过程如图3所示，由于该算法不是本文关注主要问题，不在文中详细阐述。

4.3. 关系和属性抽取

在CNN-RNN混合模型中，RNN模型将利用CNN模型所输出的每个语义类别的特征表达来生成图像的解析树，从而对图像进行内容上的分层表达，同时预测语义实体之间的交互关系。这里的RNN模型包含5个子网络，分别是中间转换网络、节点合并网络、语义解释网络、关系分类网络和合并分数网络。

在关系和属性抽取时，第一种方法是基于词法模式的原理根据语句构成成分之间的语义关系来预测语句整体的意义。比如通过对文本句法的分析，对于一个以动词为核心的短句，可以抽取出实体之间的潜在关系；另外一种是共现分析方法，这是一种定量与定性相结合的分析方法，其具体步骤为，先将待处理文本转化为数字形式表达的信息，然后使用不同的数学方法对文本进行定量计算和分析，最后结合定性分析的结果对文本中的分类关系进行综合分析；最后，还有基于开放链接数据和基于在线百科的方法，该方法通过百科类等网站规则的知识分类体系，定义或者学习知识分类的规则和特征，从而对隐藏的分类关系和属性进行准确地抽取。

5. 图像语义知识融合和加工技术

通过信息抽取获取的这些结果中可能包含大量的冗余和错误信息，有必要对其进行清理和整合。

5.1. 知识合并

为了剔除冗余信息，首先需要进行实体对齐与消歧。实体对齐是知识图谱构建过程中的重要步骤之一，通过实体对齐，将同一个知识图谱内部的实体进行精简，从而实现知识图谱之间的链接与合并，由此构建一个规模更大，服务范围更广泛的知识图谱系统。实体对齐是对于物理世界中的同一个对象，要识别出它在不同语言，不同地域，不同数据源下不同的表示形式，之后用一个全局唯一的编号来标识。

实体对齐算法的主要过程是根据具体的知识图谱的特点和处理方法，利用不同的实体识别方法，例如传统概率模型的方法、以及机器学习的方法，来完成实体对齐的任务[11]。

Figure 3. Image structured semantic realized process based-on CNN-RNN model

图3. 基于CNN-RNN模型的图像结构化语义实现流程

邓莉琼等

实体消歧是专门用于解决同名实体产生歧义问题的技术。通过实体消歧，就可以根据当前的语境，准确建立实体链接。同义关系是指在概念层面上相同或相似的实体。同义关系抽取的目标是寻找那些字面不同但是指代同一概念、实体或属性的术语。传统的基于模板的同义关系抽取方法灵活性不够，模板的覆盖率不高，导致该方法的正确率和召回率都比较低。孙霞等人[12]提出了一种自动抽取同义关系的机器学习算法。该方法具有领域自适应性，可以将训练好的分类器应用到不同的领域文本中，与基于模板的方法相比较，抽取结果的精度有了普遍提高。随着统计语言模型和深度算法的逐渐成熟，对于寻找自然语言中的同义关系的任务通常可以取得较满意的正确率。

5.2. 本体构建

在图像语义领域中，本体在某种意义上就是知识模型。图像语义的本体构建就是在领域专家的帮助下，建立基于领域概念知识的领域本体，收集信息源中的图像，并参照已建立的领域本体，把收集来的图像按规定的格式存储在元数据库(关系数据库、知识库等)中。图像本体是对图像的一种描述模式，任何一幅图像都是图像本体的一个实例，并可以用本体语言形式化地表示。

对于图像领域本体的构建，本文采用形式概念分析和Word2vec神经网络工具，结合结构化和非结构化资源，利用结构化资源概念层次明确、非结构化资源语义丰富以及容易获取的特点，有效降低领域图像本体构建的复杂度，节省时间人力成本，能提高图像领域本体的构建效率，挖掘出隐含的概念以及概念间关系，丰富图像领域本体的语义信息，能较好地反映图像领域的知识结构[13]。

5.3. 知识演化推理

图像中语义的演化与上文提出的基于表示过程的层次描述框架是密不可分的(见图2)。基于表示过程的层次框架本身是面向于用户解读过程，是一个语义抽象层次不断上升的过程。在该过程中，由于被添加新的解读信息，下层的语义将演化成更具意义的新内容。其次，语义的演化需要各种视觉信息，视觉信息在理解加工后才会具有更符合人类认知的概念和语义表达。

知识推理包含对实体属性的推理和对实体关系的推理。实体属性的推理主要是对会发生变化的实体属性值进行实时发现、推理、更新或者为实体创建新的属性；实体之间关系的推理是对实体之间潜在的关系进行推断和扩充。知识的推理方法可以分为基于逻辑的推理和基于图的推理。基于逻辑的推理主要包括一阶谓词逻辑、描述逻辑以及基于规则的推理，推理规则包含针对实体属性的规则和针对实体关系的规则；基于图的推理方法主要有基于神经网络模型或路径规划算法。

6. 图像知识图谱的应用

6.1. 语义检索

基于语义的检索对于克服图像信息中的语义鸿沟具有重要的作用，基于知识图谱生成的图像语义框架可以更好的服务于语义检索领域，这是由于与传统的基于关键字匹配的搜索引擎工作原理不同的是，知识图谱利用概念、实体的匹配度返回给用户与搜索相关的更全面的知识体系。

语义检索是基于之前的语义组织体系，实现知识关联和概念语义检索的智能化检索方式。知识图谱中的语义检索包含两类核心任务：一是利用相关性在知识库中找到相应的实体；二是在此基础上根据实体的类别、关系及相关性等信息找到关联的实体[14]。通过对知识库进行深层次的知识挖掘与提炼后，检索系统为用户反馈出具有重要性排序的准确且完整的知识，并推荐用户感兴趣的相关知识。

6.2. 语义关联分析

语义关联分析的基本任务是根据主题、形式、自然属性、社会属性等，链接具有相似语义信息的图

邓莉琼等

像等视觉媒体。在各种跨媒体关联类型中最关键的是关联数据模型。传统的数据模型着重解决的是数据个体的存储组织与管理问题，而关联数据模型不仅要能够存储组织和管理非结构化媒体数据，还要能够存储组织和管理媒体数据之间的逻辑关联，能够存储组织和管理每个媒体数据的多维属性以及每个关联的多维属性，能够反映跨媒体数据及其关联的时空属性、语义涵义、权重、概率等特性。知识图谱为基础构建数据模型，能够更好地实现传统数据模型所不能支持的多种智能分析，时空关联分析、逻辑关联分析、语义相似性搜索、数据世系管理与分析、数据溯源与核查等，提升多媒体信息之间关联分析能力。

6.3. 知识可视化

知识图谱可视化将知识库中的信息转化为更方便用户理解的方式进行呈现，用户可以一目了然地了解到他需要的知识；同时提供了更加丰富的文本信息，增加了更多的用户交互元素，提升用户体验，引导用户在短时间内获取到更多的知识。美国德雷克塞尔大学研发出的可视化软件Citespace为知识图谱研究提供了极大的便利，Citespace是基于JAVA开发的可视化软件，可以免费下载，使用起来也很便利。

Citespace软件有强大的词汇分析能力，可用于做知识图谱的可视化分析，推荐选用Citespace5.1.R6 版本。

7. 结论

基于知识图谱技术实现的图像语义分析方法可以使人们更便捷、准确地获取到自己所需要的图像语义信息并增强对图像的理解，具有重大的研究意义和使用价值。在未来信息爆炸的世界中，知识图谱将作为人们访问知识信息的接口，在知识组织和展现上扮演越来越重要的角色。

目前利用知识图谱实现对图像等视觉媒体的语义分析研究还处于初级阶段，仍然存在很多的挑战和难题需要解决，例如图像语义知识库的自动扩展，推理规则的学习等。另外，利用知识图谱跨媒体分析同样是一大挑战。相信本文提出的基于知识图谱的图像语义分析方法将为多媒体语义分析领域提供一定的解决思路和参考价值。

参考文献

[1]Zhou, H., Yuan, Y. and Shi, C. (2009) Object Tracking Using SIFT Features and Mean Shift. Computer Vision and

Image Understanding, 113, 345-352. https://https://www.360docs.net/doc/e516800951.html,/10.1016/j.cviu.2008.08.006

[2]Krahenbühl, P. and Koltun, V. (2011) Efficient Inference in Fully Connected Crfs with Gaussian Edge Potentials. Ad-

vances in Neural Information Processing Systems. MIT Press, Massachusetts, 109-117.

[3]曹倩, 赵一鸣. 知识图谱的技术实现流程及相关应用[J]. 情报理论与实践, 2015, 38(12): 13-18.

[4]Zhang, X.L., Du, C.L., Li, P.S., et al. (2011) Knowledge Graph Completion via Local Semantic Contexts. Database

Systems for Advanced Applications, 9642, 432-446. https://https://www.360docs.net/doc/e516800951.html,/10.1007/978-3-319-32025-0_27

[5]Shotton, J., Winn, J. and Rother, C. (2009) Texton Boost for Image Understanding: Multi-Class Object Recognition

and Segmentation by Jointly Modeling Texture, Layout, and Context. International Journal of Computer Vision, 81,

2-3. https://https://www.360docs.net/doc/e516800951.html,/10.1007/s11263-007-0109-1

[6]He, K., Zhang, X., Ren, S., et al. (2016) Deep Residual Learning for Image Recognition. IEEE Proceedings of the

Conference on Computer Vision and Pattern Recognition, Piscataway, 770-778.

[7]Lin, G., Shen, C., van den Hengel, A., et al. (2016) Efficient Piecewise Training of Deep Structured Models for Se-

mantic Segmentation. IEEE Proceedings of the Conference on Computer Vision and Pattern Recognition, Piscataway,

3194-3203.

[8]张瑞茂, 彭杰锋, 吴恙, 林倞. 融合语义知识的深度表达学习及在视觉理解中的应用[J]. 计算机研究与发展,

2017, 54(6): 1251-1266.

[9]Long, J., Shelhamer, E. and Darrell, T. (2015) Fully Convolutional Networks for Semantic Segmentation. Proceeding

of 2015 IEEE Conference on Computer Vision and Pattern Recognition, Piscataway, 3431-3440.

https://https://www.360docs.net/doc/e516800951.html,/10.1109/CVPR.2015.7298965

[10]Sharma, A., Tuzel, O. and Jacobs, D.W. (2015) Deep Hierarchical Parsing for Semantic Segmentation. Proceeding of

邓莉琼等2015 IEEE Conference on Computer Vision and Pattern Recognition, Piscataway, 3128-3137.

https://https://www.360docs.net/doc/e516800951.html,/10.1109/CVPR.2015.7298651

[11]庄严, 李国良, 冯建华. 知识库实体对齐技术综述[J]. 计算机研究与发展, 2016, 53(1): 165-192.

[12]孙霞, 董乐红. 基于监督学习的同义关系自动抽取方法[J]. 西北大学学报, 2008, 38(1): 35-39.

[13]李跃鹏, 金翠, 及俊川. 基于Word2vec的关键词提取算法[J]. 科研信息化技术与应用, 2015(4): 54-59.

[14]杨思洛, 韩瑞珍. 知识图谱研究现状及趋势的可视化分析[J]. 情报资料工作, 2012, 33(4): 22-28.

1. 打开知网页面https://www.360docs.net/doc/e516800951.html,/kns/brief/result.aspx?dbPrefix=WWJD

下拉列表框选择：[ISSN]，输入期刊ISSN：2161-8801，即可查询

2. 打开知网首页https://www.360docs.net/doc/e516800951.html,/

左侧“国际文献总库”进入，输入文章标题，即可查询

投稿请点击：https://www.360docs.net/doc/e516800951.html,/Submission.aspx

期刊邮箱：csa@https://www.360docs.net/doc/e516800951.html,

图像语义分析与理解综述

*国家自然科学基金资助项目(N o .60875012,60905005) 收稿日期:2009-12-21;修回日期:2010-01-27 作者简介高隽,男,1963年生,教授,博士生导师,主要研究方向为图像理解、智能信息处理、光电信息处理等.E m a i:l gao j un @hfut .edu .cn .谢昭,男,1980年生,博士,讲师,主要研究方向为计算机视觉、智能信息处理、模式识别.张骏,女,1984年生,博士研究生,主要研究方向为图像理解、认知视觉、机器学习.吴克伟,男,1984年生,博士研究生,主要研究方向为图像理解、人工智能. 图像语义分析与理解综述 * 高隽谢昭张骏吴克伟 (合肥工业大学计算机与信息学院合肥 230009) 摘要语义分析是图像理解中高层认知的重点和难点,存在图像文本之间的语义鸿沟和文本描述多义性两大关键问题.以图像本体的语义化为核心,在归纳图像语义特征及上下文表示的基础上,全面阐述生成法、判别法和句法描述法3种图像语义处理策略.总结语义词汇的客观基准和评价方法.最后指出图像语义理解的发展方向.关键词图像理解,语义鸿沟,语义一致性,语义评价中图法分类号 T P 391.4 I m age Se m antic Anal ysis and Understandi ng :A R eview GAO Jun ,XI E Zhao ,Z HANG Jun ,WU Ke W ei (S chool of C o m puter and Infor m ation,H e fei University o f T echnology,H efei 230009) ABSTRACT Se m antic ana l y sis is the i m portance and diffi c u lty of high level i n terpretati o n i n i m age understandi n g ,i n wh ich there are t w o key issues of text i m age se m an tic gap and tex t descri p ti o n po lyse m y .Concentrating on se m antizati o n o f i m ages onto logy ,three soph i s tica ted m et h odolog ies are round l y rev ie w ed as generati v e ,d iscri m ina ti v e and descriptive gra mm ar on the basis of conc l u d i n g i m ages se m antic fea t u res and context expression .The ob jective benchm ark and eva l u ation for se m an tic vocabu lary are i n duced as w e l.l F i n ally ,the summ arized directions fo r furt h er researches on se m antics i n i m age understand i n g are discussed i n tensively .K ey W ords I m age Understanding ,Se m antic G ap ,Se m an tic Consistency ,Se m an tic Evalua ti o n 1 引言图像理解(I m age Understandi n g ,I U )就是对图像的语义解释.它是以图像为对象,知识为核心,研究图像中何位置有何目标(what is w here)、目标场景之间的相互关系、图像是何场景以及如何应用场景的一门科学.图像理解输入的是数据,输出的是知识,属于图像研究领域的高层内容[1-3] .语义(Se 第23卷第2期模式识别与人工智能 V o.l 23 N o .2 2010年4月 PR &A I A pr 2010

6个方面分析知识图谱的价值和应用

6个方面分析知识图谱的价值和应用知识对于人工智能的价值就在于，让机器具备认知能力和理解能力。构建知识图谱这个过程的本质，就是让机器形成认知能力，理解这个世界。一、知识图谱无处不在说到人工智能技术，人们首先会联想到深度学习、机器学习技术；谈到人工智能应用，人们很可能会马上想起语音助理、自动驾驶等等，各行各业都在研发底层技术和寻求AI场景，却忽视了当下最时髦也很重要的AI技术：知识图谱。当我们进行搜索时，搜索结果右侧的联想，来自于知识图谱技术的应用。我们几乎每天都会接收到各种各样的推荐信息，从新闻、购物到吃饭、娱乐。个性化推荐作为一种信息过滤的重要手段，可以依据我们的习惯和爱好推荐合适的服务，也来自于知识图谱技术的应用。搜索、地图、个性化推荐、互联网、风控、银行……越来越多的应用场景，都越来越依赖知识图谱。二、知识图谱与人工智能的关系知识图谱用节点和关系所组成的图谱，为真实世界的各个场景直观地建模。通过不同知识的关联性形成一个网状的知识结构，对机器来说就是图谱。形成知识图谱的过程本质是在建立认知、理解世界、理解应用的行业或者说领域。每个人都有自己的知识面，或者说知识结构，本质就是不同的知识图谱。正是因为有获取和形成知识的能力，人类才可以不断进步。知识图谱对于

人工智能的重要价值在于，知识是人工智能的基石。机器可以模仿人类的视觉、听觉等感知能力，但这种感知能力不是人类的专属，动物也具备感知能力，甚至某些感知能力比人类更强，比如：狗的嗅觉。而“认知语言是人区别于其他动物的能力，同时，知识也使人不断地进步，不断地凝练、传承知识，是推动人不断进步的重要基础。”知识对于人工智能的价值就在于，让机器具备认知能力。而构建知识图谱这个过程的本质，就是让机器形成认知能力，去理解这个世界。三、图数据库知识图谱的图存储在图数据库（Graph Database）中，图数据库以图论为理论基础，图论中图的基本元素是节点和边，在图数据库中对应的就是节点和关系。用节点和关系所组成的图，为真实世界直观地建模，支持百亿量级甚至千亿量级规模的巨型图的高效关系运算和复杂关系分析。目前市面上较为流行的图数据库有：Neo4j、Orient DB、Titan、Flock DB、Allegro Graph等。不同于关系型数据库，一修改便容易“牵一发而动全身”图数据库可实现数据间的“互联互通”，与传统的关系型数据库相比，图数据库更擅长建立复杂的关系网络。图数据库将原本没有联系的数据连通，将离散的数据整合在一起，从而提供更有价值的决策支持。四、知识图谱的价值知识图谱用节点和关系所组成的图谱，为真实世界的各个场景直观地建模，运用“图”这种基础性、通用性的“语言”，“高保真”地表达这个多姿多彩世界的各种

语义图像检索研究进展

语义图像检索研究进展【摘要】本文探讨了基于语义图像检索相关技术，并且通过对语义图像检索技术的了解，我们讨论了语义图像检索存在的问题与其的发展方向。本文的研究具有重要的理论价值，同时为语义图像检索的发展起到启迪的作用。【关键词】语义；图像检索；研究；进展一、前言在当今社会发展不断快捷的今天，人们有时候需要快速地检索出自己需要的图像，但是现在的图像信息是巨大的，这时候我们就需要某项技术能够帮助人们更快的找到我们需要的图像，基于语义的图像检索技术就是检索图像的方式之一，相信通过对其的研究能够达到更好的图像检索效果。二、基于语义图像检索相关技术 1、图像语义模型由于人们对图像内容的理解有着不同的层次，有人从图像的颜色去理解，有人从图像的对象去理解，也有人从图像所表现出来的行为去理解，也就是说图像的语义是具有不同层次的。王惠锋、孙正兴在他们的文章中给出了一个图像语义层次模型所示。他们把图像的语义定义为六个层次，从上到下依次为，特征语义，是指图像低层物理特征(颜色、形状、纹理)及其之间的相互组合，如蓝色的天空、红色的太阳；对象语义，是指图像当中出现的具有一定意义的对象，如一条狗、一座山；空间关系语义，是指图像各个对象之间的空间关系，如人旁边有条狗，狗旁边有只猫；场景语义，是指所有图像中对象所在的背景环境，如学校、森林；行为语义，是指图像内容所表现出的某种行为。 2、图像语义表示如何描述图像的语义对语义的提取以及检索的效率有着十分重要的影响。语义的表示不仅要把图像的内容准确而客观的描述出来，对不同的内容有着不同的抽象，而且表示形式应当尽量简单、直观，同时考虑不同用户的不同需求。目前图像语义的表示方法大概有以下几种。（1）文本形式。文本形式是最简单，也是最直观的图像语义表示方法。它是用关键字对整幅图像或图像的区域进行注解，另外还可以利用WordNet[26]将关键字之间的语义关系联系起来，而且它具有一定地同义词解析以及模糊匹配的能力。目前大多数的图像检索系统都是采用这种方法来表示图像语义的，比如IRIS 系统。但其不足之处也相当明显，它对具有复杂丰富内容的图像显得无能为力，而且自动获取这些关键字也存在着相当大的困难。（2）知识表示方法。它是基于人工智能中的一些知识表示方法，如语义网

从视频到语义：基于知识图谱的视频语义分析技术

Computer Science and Application 计算机科学与应用, 2019, 9(8), 1584-1590 Published Online August 2019 in Hans. https://www.360docs.net/doc/e516800951.html,/journal/csa https://https://www.360docs.net/doc/e516800951.html,/10.12677/csa.2019.98178 From Video to Semantic: Video Semantic Analysis Technology Based on Knowledge Graph Liqiong Deng*, Jixiang Wu, Li Zhang Air Force Communication NCO Academy, Dalian Liaoning Received: Aug. 6th, 2019; accepted: Aug. 19th, 2019; published: Aug. 26th, 2019 Abstract Video understanding has attracted much research attention especially since the recent availability of large-scale video benchmarks. In order to fill up the semantic gap between video features and understanding, this paper puts forward a video semantic analysis process based on knowledge graph, and adopts random walk to quantify semantic consistency between semantic labels. Then video semantic reasoning based-on knowledge graph is studied. The experimental results prove that knowledge graph can improve semantic understanding effectively. Finally, a constructed mul-tilevel video semantic model supports applications in video classifying, video labeling and video abstract, which has some guiding significance for information organization and knowledge man-agement of media semantic. Keywords Knowledge Graph, Video, Classify, Semantic Analysis 从视频到语义：基于知识图谱的视频语义分析技术邓莉琼*，吴吉祥，张丽空军通信士官学校，辽宁大连收稿日期：2019年8月6日；录用日期：2019年8月19日；发布日期：2019年8月26日 *通讯作者。

智能视频分析系统

目录一、项目背景及建设目标 (3) 1.1 项目背景 (3) 1.2 技术优势 (4) 二、厂区智能视频分析整体设计方案 (5) 2.1传统对射系统与智能视频分析系统比较 (5) 2.2厂房周界入侵报警系统 (6) 2.2.1 周界入侵检测 (7) 2.2.2 周界警戒线警戒区预警 (7) 2.3厂房仓库物资看护 (8) 2.3.1 可疑人员接近仓库提醒 (8) 2.3.2 仓库物品看护 (8) 2.3.3 夜间停车场、厂区内部、附近可疑逗留检测 (9) 2.4夜间厂区办公楼内可疑人员检测 (9) 2.5生产车间危险区域或者夜间下班后人员检测 (10) 2.6系统拓扑结构 (10)

一、项目背景及建设目标 1.1 项目背景慧视科技智能视频分析系统是以软件的形式实现智能视频分析功能，拥有自主的软件知识产权，可满足各行业的需要，也满足各厂家设备的接入，同时可以与各种监控平台进行二次对接。传统报警设备的误报多漏报多操作复杂不直观已经成为行业共识，且传统的视频监控系统数量庞大画面单一，工作人员很难从视频中发现问题，往往更多用于事后取证，智能图像分析通过图像中目标的识别和规则运用来进行预警，报警速度快且精确度高，可辅助工作人员从繁琐重复的工作中解放出来，真正体现科技为人服务的理念。国内现有厂房的视频监控系统主要由摄像机、光缆、矩阵、硬盘录像机和电视墙等组成。由于视频监控图像数量大，内容枯燥，现有系统即使配备值班人员，在大多数情况下仍处于无人观看的状态下。当犯罪事件发生时，从硬盘录像机中调取录像回放、取证变成系统主要的价值之一。即使值班人员在岗，由于人的生理特点，不可能长时间有效观察多路图像，很可能造成遗漏可疑事件，对安全形式产生错误判断。智能视频监控技术可以理解为用计算机来帮助值班人员"看"监控录像。现代计算机的高可靠性可以提供24小时不间断地保护。从根本上杜绝由于人员疲劳造成的遗漏问题。同时也可以防止出现监控人员内外勾结的可能性。现有的智能视频分析技术还不能替代人，它仍然需要人来辨识报警的性质，进而决定处置方式。它的价值在于大大降低了监控人员的工作强度，使监控质量有了质的提升。和传统视频监控系统相比，智能视频分析可以及时发现、甚至阻止犯罪行为的发生。这对厂房等重要设备、贵重材料的意义是显而易见的。

情感语义图像检索技术研究

１引言情感计算是一门新颖的而且富有挑战性的研究课题［１］，是涉及到哲学、心理学、美学、人类学等的交叉学科。目前在情感计算理论和应用方面的研究已经浮出水面，而将情感计算运用在图像检索的初步研究中，国内外已发表过一些论文，主要集中在人的面部表情识别、机器人的情感行为和可穿戴式计算应用等研究领域。基于内容图像检索的研究正进行的如火如荼［４］。虽然这两方面的研究起步都比较晚，特别是情感计算，但也有了一些可喜的成果。人类的情感从心理学角度上主要指人的心理反应。西方有的学者把情感分为基本的六种：羡慕、爱、恨、欲望、愉快和悲哀。而国内一直流行着“七情六欲”之说，《礼记－礼运》说：“喜、怒、哀、惧、爱、恶、欲七者弗学而能。”即所谓的七情。有研究显示，不同图像可以唤起人类不同的情感。对图像进行情感分类有助于建立和谐人机环境［７］和情感计算领域的研究。在现实世界中的情感活动离不开周围的环境，而现实中的环境可以被认为是由一幅幅的图像组成的，所以对图像的情感研究是非常必要的。而且在实际应用中图像的情感研究也有着相当广阔的前景，可以运用于艺术、装潢、机器人和游戏开发等领域。本文对图像进行情感分类，实现图像的情感语义检索。用户可以使用多范例图来进行检索情感相似图或使用文本描述的方式来进行检索。为了增加特征到语义的映射和图像匹配的效率，利用多范例图进行检索是一种行之有效的方法。在多范例图中，我们把要查询的相似图划分到相关组中，需要过滤掉的图像则放到相反组。本文分为三部分，首先介绍了情感语义检索系统总体结构，主要分为特征向量的提取、表示，低阶可视化特征向高阶语义特征的映射，以及情感空间和用户接口的介绍；其次主要分析图像的情感语义，详细阐述情感语义模型的结构和功能；最后对由２５００幅数字图像组成的数据集仿真实验，分析了实验结果，并且提出今后的研究方向。２系统总体结构设计图像检索系统主要研究的内容是基于数字图像处理基础上的视觉特征提取、多维索引以及检索系统设计等［７］，本文也不例外，检索系统的总体结构如图１，主要分为三个部分，其中关键技术为图像的特征抽取、表示，图像低阶可视化特征向高阶语义特征的映射阶段以及情感模型的建立。下面作详细的介绍。作者简介：李海芳（１９６４－），女，副教授，硕士生导师，在读博士，研究方向为：信号与信息处理，数据挖掘。焦丽鹏（１９８１－），男，硕士研究生，主要研究方向为图像检索、智能信息处理。情感语义图像检索技术研究李海芳焦丽鹏陈俊杰王莉贺静（太原理工大学计算机与软件学院，太原０３００２４）Ｅ－ｍａｉｌ：ｓｘｌｈｆ１２３＠１６３．ｃｏｍ摘要图像中所蕴涵的丰富语义仅用若干低级物理特征是不能进行完整描述的，而且在语义映射时也会有信息丢失，因而产成“语义鸿沟”是在所难免的。将多特征融合，建立情感语义模型，分析情感的概念解析功能对提高智能信息检索的精度和效率是非常必要的。论文讨论了图像的颜色、纹理等特征的提取与表示，低阶图像可视化特征到高阶图像语义特征的映射过程，图像的情感语义分类，建立了情感语义模型，实现对基于情感语义图像的检索。对由２５００幅数字图像组成的数据集进行了实验，并对实验结果进行分析，部分结果是令人满意的，而且提高了基于内容图像检索的精度。关键词语义鸿沟基于内容的图像检索情感计算情感语义特征提取文章编号１００２－８３３１－（２００６）１８－００８２－０４文献标识码Ａ中图分类号ＴＰ３９１ＲｅｓｅａｒｃｈｏｆＡｆｆｅｃｔｉｖｅＳｅｍａｎｔｉｃｓＲｅｔｒｉｅｖａｌＢａｓｅｄｏｎＣｏｎｔｅｎｔＬｉＨａｉｆａｎｇＪｉａｏＬｉｐｅｎｇＣｈｅｎＪｕｎｊｉｅＷａｎｇＬｉＨｅＪｉｎｇ（ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒａｎｄＳｏｆｔｗａｒｅ，ＴａｉｙｕａｎＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，Ｔａｉｙｕａｎ０３００２４）Ａｂｓｔｒａｃｔ：Ｔｈｅａｂｕｎｄａｎｔｓｅｍａｎｔｉｃｃｏｎｔａｉｎｅｄｉｎｔｈｅｉｍａｇｅｓｃａｎｎｏｔｂｅｅｎｄｅｓｃｒｉｂｅｄｃｏｍｐｌｅｔｅｌｙｏｎｌｙｕｓｉｎｇｓｏｍｅｌｏｗ－ｌｅｖｅｌｐｈｙｓｉｃａｌｆｅａｔｕｒｅｓ，ａｎｄｓｏｍｅｉｎｆｏｒｍａｔｉｏｎｗｉｌｌｂｅｌｏｓｔｉｎｔｈｅｓｅｍａｎｔｉｃｍａｐｐｉｎｇ，ｓｏｉｔｉｓｕｎａｖｏｉｄａｂｌｅｔｏｐｒｏｄｕｃｅｔｈｅ“ｓｅｍａｎｔｉｃｇａｐ”．Ｉｔｉｓｎｅｃｅｓｓａｒｙｔｏｉｍｐｒｏｖｅｔｈｅｐｒｅｃｉｓｉｏｎａｎｄｅｆｆｉｃｉｅｎｃｙｏｆｔｈｅｉｎｔｅｌｌｅｃｔｉｖｅｉｎｆｏｒｍａｔｉｏｎｒｅｔｒｉｅｖａｌｂｙｓｙｎｃｒｅｔｉｚｉｎｇｍｕｌｔｉ－ｆｅａｔｕｒｅｓ，ｅｓｔａｂｌｉｓｈｉｎｇｔｈｅａｆｆｅｃｔｉｖｅｓｅｍａｎｔｉｃｍｏｄｅｌａｎｄａｎａｌｙｚｉｎｇｔｈｅｉｄｅａ－ａｎａｌｙｓｉｓｆｕｎｃｔｉｏｎｏｆｅｍｏｔｉｏｎ．Ｆｅａｔｕｒｅｓｅｘｔｒａｃｔｉｎｇａｎｄｅｘｐｒｅｓｓｉｎｇｏｆｉｍａｇｅ’ｓｃｏｌｏｒ，ｔｅｘｔｕｒｅ，ｅｔｃ．，ｍａｐｐｉｎｇｐｒｏｃｅｓｓｆｒｏｍｔｈｅｌｏｗ－ｌｅｖｅｌｉｍａｇｅｖｉｓｕａｌｆｅａｔｕｒｅｓｔｏｔｈｅｈｉｇｈ－ｌｅｖｅｌｉｍａｇｅｓｅｍａｎｔｉｃｆｅａｔｕｒｅｓ，ａｎｄｔｈｅｅｍｏｔｉｏｎｓｅｍａｎｔｉｃｃｌａｓｓｉｆｉｃａｔｉｏｎｏｆｔｈｅｉｍａｇｅｓａｒｅｄｉｓｃｕｓｓｅｄ，ｅｍｏｔｉｏｎｓｅｍａｎｔｉｃｍｏｄｅｌｉｓｅｓｔａｂｌｉｓｈｅｄ，ｔｈｅｒｅｔｒｉｅｖｉｎｇｂａｓｅｄｏｎａｆｆｅｃｔｉｖｅｓｅｍａｎｔｉｃｉｍａｇｅｓｉｓａｃｈｉｅｖｅｄｉｎｔｈｉｓｐａｐｅｒ．Ｔｈｅｄａｔａｓｅｔｃｏｍｐｏｓｅｄｏｆ２５００ｄｉｇｉｔａｌｉｍａｇｅｓｉｓｅｘｐｅｒｉｍｅｎｔｅｄｗｉｔｈ，ａｎｄｔｈｅｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｈａｖｅｂｅｅｎａｎａｌｙｚｅｄ，ｓｏｍｅｏｆｗｈｉｃｈａｒｅｓａｔｉｓｆｉｅｄ，ａｎｄｔｈｅｐｒｅｃｉｓｉｏｎｂａｓｅｄｏｎｃｏｎｔｅｎｔｉｍａｇｅｒｅｔｒｉｅｖｉｎｇｈａｓｂｅｅｎｉｍｐｒｏｖｅｄ．Ｋｅｙｗｏｒｄｓ：ｓｅｍａｎｔｉｃｇａｐ，ＣＢＩＲ，ａｆｆｅｃｔｉｖｅｃｏｍｐｕｔｉｎｇ，ａｆｆｅｃｔｉｖｅｓｅｍａｎｔｉｃｓ，ｆｅａｔｕｒｅａｂｓｔｒａｃｔｉｏｎ

智能视频行为分析平台建设方案

基于智能视频分析的监控平台建设方案随着国家经济的提高，城市和城市化进程在不断的发展，各种社会矛盾和暴力事件逐渐增多，政府和相关部分对加强城市各地联网型监控系统越来越重视，当前城市和小区监控系统建设使用监控录像存储，事件发生后调取查阅的方式，这种方式在一定程度上满足了社会的需求，但是无法避免事态趋于恶化，在此背景下，具有智能视频行为分析的监控平台建设就显得尤为重要。智能视频技术让安全警卫部门能通过摄像机实时自动“发现警情”并主动“分析”视野中的监视目标，同时判断出这些被监视目标的行为是否存在安全威胁，对已经出现或将要出现的安全威胁，及时向安全防卫人员通过文字信息、声音、快照等发出警报，极大地避免工作人员因倦怠、脱岗等因素造成情况误报和不报，切实提高监控区域的安全防范能力。现有各大监控系统厂商和信息化科技公司都研发出大量的智能视频分析软件，可以分为两大类，基于嵌入式DSP 智能分析系统和基于计算机末端处理的智能分析系统。一．基于嵌入式DSP的处理优点

1、DSP方式可以使得视觉分析技术采用分布式的架构方式。在此方式下，视觉分析单元一般位于视觉采集设备附近（摄像机或编码器），这样，可以有选择的设置系统，让系统只有当报警发生的时候才传输视觉到控制中心或存储中心，相对于计算机末端处理方式，大大节省的网络负担及存储空间。 2、DSP方式下视觉分析单元一般位于视觉采集设备附近（摄像机或编码器），此方式可以使得视觉分析单元直接对原始或最接近原始的图象进行分析，而后端计算机方式，计算机器得到的图象经过网络编码传输后已经丢失了部分信息，因此精确度难免下降。 3、视觉分析是复杂的过程，需要占用大量的系统计算资源，因此计算机方式可以同时进行分析的视觉路数非常有限，而DSP方式没有此限制。二．在对比上述两种处理模式的优缺点基础上，提出基于DSP嵌入式处理和末端计算机处理两种系统结构.

知识图谱概述与应用

导读：知识图谱(Knowledge Graph) 是当前的研究热点。自从2012年 Google推出自己第一版知识图谱以来，它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年纷纷推出了自己的知识图谱产品以作为回应。比如在国，互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。那么与这些传统的互联网公司相比，对处于当今风口浪尖上的行业- 互联网金融，知识图谱可以有哪方面的应用呢？目录： 1. 什么是知识图谱？ 2. 知识图谱的表示 3. 知识图谱的存储 4. 应用 5. 挑战 6. 结语 1.什么是知识图谱？知识图谱本质上是语义网络，是一种基于图的数据结构，由节点(Point)和边(Edge)组成。在知识图谱里，每个节点表示现实世界中存在的“实体”，每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲，知识图谱就是把所有不同种类的信息（Heterogeneous Information）连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。

知识图谱这个概念最早由Google提出，主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎，知识图谱可用来更好地查询复杂的关联信息，从语义层面理解用户意图，改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候，搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月，家庭情况等等。另外，对于稍微复杂的搜索语句比如”Who is the wife of Bill Gates“ ，Google能准确返回他的妻子Melinda Gates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。

视频分析技术的原理

视频分析技术的原理视频分析技术通常采用背景分离（背景减除）技术来进行图像变化的检测（所有的视频分析模式，如入侵、丢包、逆行等都是一种模式的图像变化）。其思路是对视频帧与基准背景图像进行比较，相同位置的像素（区域）变化则认为是变化了的区域，对这些区域进一步处理、跟踪、识别，得到包括目标位置、尺寸、形状、速度、停留时间等基本形态信息和动态信息，完成目标的跟踪和行为理解之后，也就完成了图像与图像描述之间的映射关系，从而使系统进一步进行规则判定，直到触发报警。背景减除法是目前普遍使用的运动目标检测方法，其算法本身需要大量的运算处理资源，并且仍然会受到光线、天气等自然条件及背景自身变化（海浪、云影、树叶摇动等情况）的影响。但是，针对不同的天气以及自然干扰，已经有多种附加算法（过滤器）应用来弥补这些缺陷，随着芯片能力的提升及算法改进，相信视频分析技术会进一步成熟。视频内容分析的关键技术前景目标的探测是视频分析技术实施的前提条件。背景减除法是目前视频分析技术中用于前景目标探测的最常见方法，其原理是利用当前图象和背景图象的差分（SAD）来检测出运动目标（区域）的一种方法。此方法可以提供比较完整的运动目标特征数据，精确度和灵敏度比较高，具有良好的性能表现，但对动态场景的变化，如光线变化情况也比较敏感。背景减除法的工作原理如图2所示，当前图像与背景图像模型做差后形成运动目标区域，即图中的小船。动目标区域，即图中的小船。背景模型的建立是背景减除法的关键所在。通常，视频分析算法需要一定的时间进行“背景学习”，所谓背景学习，实质上是利用时间平均图像的方法，将背景在一个时间段（如30秒钟）内的平均图像计算出来，作为该场景的背景模型。那么，“背景学习”时间结束后，系统仍然需要具有“背景维护”的能力，之前建模的背景并不是一成不变的，这样能保证系统对场景内的图像变化不那么敏感，如光线变化、影子等等，因此，开发出实用、有效的背景模型以适应动态、复杂的场景是目标探测及视频分析技术的关键。视频分析的工作流程视频分析实质是人工智能的一部分，是通过模仿人类的工作过程来实现的。人类通过眼睛这个“传感器”实现视频的采集、预处理、处理然后将真实图像传送给大脑，大脑并不是对所有传送过来的图像进行整体的分析处理，而是采用多

基于语义的图像低层可视特征提取及应用

———————————— 基金项目基金项目：：国家自然科学基金资助项目“基于语义网的多源地学空间数据融合与挖掘研究”(41174007)。作者简介作者简介：：韩冬梅(1961－)，女，教授、博士生导师，主研方向：图像特征提取，数据挖掘，语义网；王雯，博士研究生；李博斐，硕士研究生。收稿日期收稿日期：：2013-09-09 修回日期修回日期：：2013-11-21 E-mail ：wangwen_1010@https://www.360docs.net/doc/e516800951.html, 基于语义的图像低层可视特征提取及应用韩冬梅1,2，王雯1，李博斐1 (1. 上海财经大学信息管理与工程学院，上海 200433；2. 上海市金融信息技术研究重点实验室，上海 200433) 摘要：为实现图像低层可视特征提取及其智能语义推理，从遥感图像解译入手，结合灰度共生矩阵和模糊C 均值分类器提取图像纹理特征。构造基于灰度形态学的多尺度多结构元素边缘检测算子，提取特征知识。构建基于断层带的多源地学数据语义推理模型。以成都附近的断层为研究对象，进行语义推理验证，其解译结果与专家实地解译情况相符，初步验证该模型的可行性，使图像的机器分析结果更加贴近专业人员的目视解译，为地学研究数字化和遥感图像解译信息化提供参考。关键词关键词：：语义网；纹理特征；边缘特征；语义推理；灰度共生矩阵；多源地学数据 Extraction and Application of Image Low-level Visual Features Based on Semantics HAN Dong-mei 1,2, WANG Wen 1, LI Bo-fei 1 (1. School of Information Management and Engineering, Shanghai University of Finance and Economics, Shanghai 200433, China ; 2. Shanghai Key Laboratory of Financial Information Technology, Shanghai 200433, China) 【Abstract 】In order to realize extraction of image low-level visual features and semantic reasoning, this paper starts from remote sensing image explanations, combines Gray Level Co-occurrence Matrix(GLCM) and Fuzzy C-Means(FCM) classifier to extract texture feature, then detects edge by multi-scale and multi-structuring elements based on grayscale morphology, finally constructs multi-sources geological data based on the fault zone and uses the Chengdu parcels to test and verify the model. The results completely coincide with the expert’s field studies, which demonstrates the feasibility of this model, makes the results of machine analysis closer to results of visual interpretation, and provides valuable preferences fordigitalization of the earth science study and informationization of image interpretation. 【Key words 】semantic Web; texture feature; edge feature; semantic reasoning; Gray Level Co-occurrence Matrix(GLCM); multi-source geosciences data DOI: 10.3969/j.issn.1000-3428.2014.03.051 计算机工程 Computer Engineering 第40卷第3期 V ol.40 No.3 2014年3月 March 2014 ·图形图像处理图形图像处理·· 文章编号文章编号：：1000-3428(2014)03-0244-05 文献标识码文献标识码：：A 中图分类号中图分类号：：TP391.41 1 概述随着语义网与地质学研究的深入，具有地理特征指向性的遥感图像分析日趋完善。然而，现有的图像分析大多存在对研究结果的主观依赖性，如何实现遥感图像特征与地理构造语义的自动匹配就成为一个研究难点。关于遥感图像低层可视特征提取方面的研究，目前大多数是基于纹理特征的图像特征分析。纹理特征是对图像灰度分布函数的统计[1]。多种用以测量纹理的特征分析算法被陆续提出，大体可分为统计分析、结构分析、模型分析、变换分析方法4类[2]。其中，结构分析方法的应用比较有限，只适用于对一些常规的纹理进行分析；统计分析方法有灰度共生矩阵[3]、游程长度矩阵[4]；模型分析方法有自相关[5]、马尔可夫随机场模型[6]、分形[7]。变换分析方法有小波变换法[8]、滤波变换分析[9]等。其中，应用最为广泛、处理效果较好的是灰度共生矩阵算法。遥感图像边缘特征提取方面，常用的边缘检测算法可以做如下分类：基于微分或者二阶微分计算的传统算子[10]，这类算子在处理时往往要和一定的图像去噪工作结合使用；基于滤波算法的新兴算子，如Hough 变换和小波变换，这类算法的效果虽然有很大提高，但是算法的构造和处理过程非常复杂，实用性和实时性较差[11]。交叉学科知识构造的创新型算法，将原本未使用在图像分析领域中的其他学科的模型或者建模思想引入到边缘检测中，其中最具代表性的当属基于数学形态学的边缘检测算法[11]。遥感图像特征的提取离不开语义的解释[12]。文献[13]针对图像目标与特征集之间难以对应的问题，提出一种基于概率潜在语义分析的层次化目标表述方法。文献[14]提出

视频监控图像分析技术的背景和重要性

视频监控图像分析技术的背景和重要性改革开放以来，随着利益主体日益多元、利益诉求日益多样、社会心态日益复杂，少数群众维权意识强烈而法制观念淡薄，动辄采取过激行为，造成了严重的社会后果。受国际金融危机和全球性经济衰退影响，刑事犯罪总量仍在高位运行，新型犯罪不断增多，犯罪的智能化、暴力化、组织化特征更加突出，国家安全形势更加严峻复杂。全国发案率呈逐年上升趋势，仅2012年全国发案866.3万起。针对我国安全形势面临的挑战，近年来公安部开展了“科技强警示范性城市建设”和“十一五”重点项目“城市视频监控与报警示范工程”的科技专项研究，希望通过技术攻关和集成，整合社会视频监控与报警资源，提高社会治安的综合防控能力。公安部为此先后投入近3000亿在660个大中城市建成了覆盖广泛的城市视频监控网络，这些已建成的视频监控系统在公安的刑侦业务中得到了广泛的应用。视频图像侦查技术已成为新的破案增长点，视频图像业务已成为公安行业发展最快的业务。近年来，全国公安机关利用刑事科学技术侦破案件数量年均增长13.9%，部分地方利用包含视频图像分析侦查技术在内的信息化手段破案已占破案总数的30%甚至40%以上。视频侦查技术已成为继刑事技术、行动技术、网侦技术之后的侦查破案的第四大技术支撑。公安部领导多次指出：“视频侦查学是公安信息化的关键和重点，是有效提升刑侦工作的突破点。” 视频图像具有极大的信息量，它同时具有空间分辨和时间分辨的能力，但真正把这些信息提取和挖掘出来是复杂和困难的。监控视频分析技术是指通过对视频画面的监控判断和检测分析，过滤掉视频画面中无用的或干扰的信息，抽取视频源中关键的有用信息，从而为刑侦工作的顺利推进提供直观且有价

个方面分析知识图谱的价值和应用

以模仿人类的视觉、听觉等感知能力，但这种感知能力不是人类的专属，动物也具备感知能力，甚至某些感知能力比人类更强，比如：狗的嗅觉。而“认知语言是人区别于其他动物的能力，同时，知识也使人不断地进步，不断地凝练、传承知识，是推动人不断进步的重要基础。”知识对于人工智能的价值就在于，让机器具备认知能力。而构建知识图谱这个过程的本质，就是让机器形成认知能力，去理解这个世界。三、图数据库知识图谱的图存储在图数据库（Graph Database）中，图数据库以图论为理论基础，图论中图的基本元素是节点和边，在图数据库中对应的就是节点和关系。用节点和关系所组成的图，为真实世界直观地建模，支持百亿量级甚至千亿量级规模的巨型图的高效关系运算和复杂关系分析。目前市面上较为流行的图数据库有：Neo4j、Orient DB、Titan、Flock DB、Allegro Graph等。不同于关系型数据库，一修改便容易“牵一发而动全身”图数据库可实现数据间的“互联互通”，与传统的关系型数据库相比，图数据库更擅长建立复杂的关系网络。图数据库将原本没有联系的数据连通，将离散的数据整合在一起，从而提供更有价值的决策支持。四、知识图谱的价值知识图谱用节点和关系所组成的图谱，为真实世界的各个场景直观地建模，运用“图”这种基础性、通用性的“语言”，“高保真”地表达这个多姿多彩世界的各种关系，并且非常直观、自然、直接和高效，不需要中间过程

四种主流视频图像处理技术

四种主流视频图像处理技术如今，随着经济的发展和人们生活水平的提高，视频监控在生活中应用的范围越来越广，人们对新形势下视频处理技术的应用和发展问题尤为关注。数字视频和数字图像比传统的图像和视频分辨率要高，处理方便，易于操作和整理。但由于部分设备性能不足、客观条件限制等因素，在实际的视频监控应用中，仍会出现视频图像模糊不清、关键信息捕捉不到等问题。而在视频图像处理的过程中，由于操作技术问题或者客观因素等，给视频图像处理技术的应用带来一些负面影响，降低了处理技术的水平和质量。视频图像处理技术的四大技术视频图像处理过程中会涉及到对视频图像数据的采集、传输、处理、显示和回放等过程，这些过程共同形成了一个系统的整体周期，可以连续性的运作。在视频图像处理技术范围内最主要的就是包括了图像的压缩技术和视频图像的处理技术等。目前，市场上主流的视频图像处理技术包括：智能分析处理，视频透雾增透技术，宽动态处理，超分辨率处理，下面分别介绍以上四种处理技术。智能分析处理技术智能视频分析技术是解决视频监控领域大数据筛选、检索技术问题的重要手段。目前国内智能分析技术可以分为两大类：一类是通过前景提取等方法对画面中的物体的移动进行检测，通过设定规则来区分不同的行为，如拌线、物品遗留、周界等；另一类是利用模式识别技术对画面中所需要监控的物体进行针对性的建模，从而达到对视频中的特定物体进行检测及相关应用，如车辆检测、人流统计、人脸检测等应用。视频透雾增透技术视频透雾增透技术，一般指将因雾和水气灰尘等导致朦胧不清的图像变得清晰，强调图像当中某些感兴趣的特征，抑制不感兴趣的特征，使得图像的质量改善，信息量更加丰富。由于雾霾天气以及雨雪、强光、暗光等恶劣条件导致视频监控图像的图像对比度差、分辨率低、图像模糊、特征无法辨识等问题，增透处理后的图像可为图像的下一步应用提供良好的条件。数字图像宽度动态的算法数字图像处理中宽动态范围是一个基本特征，在图像和视觉恢复中占据了重要的位置，关系着最终图像的成像质量。其动态的范围主要受保护信号量和平均噪声比值来决定的，其中动态范围可以从光能的角度来定义。数字的信号处理会受到曝光量中曝光效果、光照度和强度的影响和作用。动态范围跟图案的深度息息相关，如果图像动态范围宽，则在图像处理时亮度变化较为明显，但如果动态范围较窄，在亮度转化时，亮暗程度的变化并不明显。目前图像的宽动态范围在视频监控、医疗影像等领域应用较为广泛。超分辨率重建技术提高图像分辨率最直接的办法就是提高采集设备的传感器密度。然而高密度的图像传感器的价格相对昂贵，在一般应用中难以承受；另一方面，由于成像系统受其传感器阵列密度的限制，目前已接近极限。

知识图谱研究方法心得

体育政策研究现状、前沿热点与演化分析 ——基于科学知识图谱的可视化分析心得一、主要内容作者基于科学知识图谱可视化分析，通过Web of Science TM 文献资料数据库检索体育政策研究论文，以“体育政策”的标题、摘要、关键词和收录全文为研究对象，运用引文分析、共被引分析、聚类分析、词频分析、社会网络分析等基本方法，对体育政策研究的现状、前沿热点和演化路径进行分析，采用Cite SpaceⅢ可视化软件绘制科学知识图谱，将数据以图像形式呈现出来。通过运用Cite SpaceⅢ可视化软件，一是通过选择“country”（国家）和“institution”（机构），时区分割设置为2（Time Slice Length=2）,绘制了体育政策发文高产国家分布图；二是通过选择参数“Author”（作者），绘制了体育政策发文高产作者知识图谱；三是通过选择参数“Category”（学科），绘制了体育政策研究领域的学科贡献网络图谱；四是通过导入文献，在主题词资源（Term Source）中选择标题（Title）、摘要（Abstract）,节点类型（Node Types）选择关键词（Keyword）,绘制出了体育政策研究领域的学科贡献网络图谱。分别对以上四个图谱进行分析得到以下结论：1.美国是体育政策研究的中心，无论从发文量还是文章的中心性都高居第一，高校是体育政策研究发文量的高产机构；2.体育政策领域研究者形成一

小部分核心作者群，但数量较少，研究作者总体成离散性分布；3.体育政策研究需要多学科的支持，社会科学学科和公共科学学科是体育政策发文量的高产学科，形成以这两个学科为主流的研究领域； 4.体育政策的关注点在不断的发展和变化，正在由对儿童的关注过渡到整体的公共健康，由体育活动过渡到发挥体育的教育功能，由对体育行为的控制过渡到形成终身体育的锻炼意识。二、当前体育领域知识图谱研究方法应用现状在中国知网通过以体育、知识图谱为主题和关键词进行搜索，根据关联度选取了104篇期刊、论文，进行分类发现当前体育领域应用知识图谱研究方法主要呈现在以下内容：一、单项运动。主要包括英文期刊中马拉松研究、、我国龙舟科研成果、国内外体育舞蹈研究、国外滑雪运动风险研究、太极拳运动研究、舞龙舞狮研究、攀岩运动研究、我国速度滑冰研究、国外篮球运动研究、国内外排球领域研究、羽毛球运动研究、我国乒乓球研究、我国体育舞蹈、国内外健美操、国内外啦啦操、网球研究、电子竞技现状、竞技游泳、国际有氧运动科学研究等项目的研究分析；二、学校体育教育。主要包括我国冰雪教学研究、我国体育教师教育研究、我国基础教育体育课程研究、国际学校体育研究、国外体育教师研究、高校公共体育课、高校体育教学、体育舞蹈教学、国际体育教育动态演变研究、国内外体育教育研究、国内外高校体育教学研究现状、我国学校体育政策、体操教学研究领域、我国体育教学环境研究、我国高校体育俱乐部等内容的研究；三、体育科学。主要包括：国际体

基于知识图谱的图像语义分析技术及应用研究

图像语义分析与理解综述

6个方面分析知识图谱的价值和应用

语义图像检索研究进展

从视频到语义：基于知识图谱的 视频语义分析技术

智能视频分析系统

情感语义图像检索技术研究

智能视频行为分析平台建设方案

知识图谱概述与应用

视频分析技术的原理

基于语义的图像低层可视特征提取及应用

视频监控图像分析技术的背景和重要性

个方面分析知识图谱的价值和应用

四种主流视频图像处理技术

知识图谱研究方法心得

从视频到语义：基于知识图谱的视频语义分析技术