国内外网络舆情数学建模研究综述_苏创

国内外网络舆情数学建模研究综述_苏创
国内外网络舆情数学建模研究综述_苏创

收稿日期:2014-04-16修回日期:2014-06-11

基金项目:教育部人文社会科学研究项目

“网络舆情演化的不确定性机理分析与风险管理”(编号:13YJA630065)。作者简介:苏创(1987-),男,硕士研究生,研究方向:不确定优化与决策;彭锦(1961-),男,教授,博士生导师,研究方向:不确定理论及

其应用;李圣国(1979-),男,博士,讲师,研究方向:不确定风险与保险分析。

通讯作者:彭

国内外网络舆情数学建模研究综述

*

1,2

彭锦

2

李圣国

2

(1.上海师范大学数理学院

上海200234;2.黄冈师范学院不确定系统研究所黄冈438000)

互联网技术的发展及网络应用的普及使网络舆情成为当前一个热门的研究领域.众多学者从不同角度运

用不同的数学方法对网络舆情进行了研究,取得了大量成果,涌现出大批文献.本文从数学建模的视角对部分国内外网络舆情的研究文献进行归类分析.按照网络舆情中不确定性因素的数学处理方法不同,将网络舆情数学建模的模型主要分为四类。即经典数学模型、随机数学模型、不确定数学模型、其它数学模型.结合现有网络舆情数学建模中存在的问题,本文对网络舆情相关研究的未来发展趋势进行了展望。关键词

网络舆情

数学建模

不确定性

中图分类号

G353.11

文献标识码

A

文章编号1002-1965(2014)10-0014-07

DOI 10.3969/j.issn.1002-1965.2014.10.003

A Survey on the Mathematical Modeling of Internet Public Opinion

Research Both at Home and Abroad

Su Chuang 1,

2

Peng Jin 2Li Shengguo 2

(1.College of Mathematics and Science ,Shanghai Normal University ,Shanghai 200234;2.Institute of Uncertain Systems ,Huanggang Normal University ,Huanggang

438000)

Abstract

Internet public opinion has become a hot research field nowadays.Many researchers have studied this field from different aspects

with many methods ,and gained a lot of achievements.This review classifies and analyzes the research literatures of internet public opinion from mathematical modeling perspective.According to the different processing methods of uncertainty of internet public opinion ,the inter-net public opinion mathematical modeling can be divided into four categories ,that is ,classical mathematical model ,stochastic mathematical model ,uncertain mathematical model and other mathematical model.At last ,the related research in the future is prospected in combination with the existing problems of mathematical model of internet public opinion.Key words

internet public opinion

mathematical modeling

uncertainty

0引言

20世纪90年代以来,互联网技术的日新月异使网络成为人们获取信息和发表观点的重要平台。随着网络的不断普及,网络舆情也悄然登上了历史舞台。一种观点认为,网络舆情是由于事件的刺激而产生的通过互联网传播的人们对于该事件的所有认知、态度、情感和行为倾向的集合

[1]

。鉴于近几年国内外网络舆

情事件的日益增多,网络舆情的研究逐渐成为舆情研究的重点领域。作为社会科学与自然科学交叉的新兴

研究领域,网络舆情的研究涵盖了新闻学、传播学、社会学、政治学、管理学、信息技术等多个学科,引发了国内外众多领域专家和学者的关注

[2]

近年来,学者们对网络舆情的分析及管控研究主要包括舆情的热点挖掘、传播、预警和危机应对等几个方面。研究的方法既有定性研究,又有定量研究,而从定性的角度研究则更多一些。定性研究主要源于新闻与传媒、社会学、行政管理等学科专业背景研究人员,而定量研究主要来源于在数学、统计学、计算机应用等学科专业背景的研究人员。

第33卷第10期2014年10月

情报杂志

JOURNAL OF INTELLIGENCE

Vol.33No.10Oct.2014

国内部分学者从不同侧面对网络舆情的研究文献进行了综述,既有从宏观角度去计量分析整个网络舆情领域的文献[3,4],也有从研究网络舆情某一局部问题去计量分析相关文献[5,6],但是鲜有学者对通过数学建模研究网络舆情的文献进行专题综述,在已公开发表的有关网络舆情的文献综述中,大部分只针对国内的研究文献,很少把国外一些相关研究成果涵盖在内.

为了反映国内外有关网络舆情数学建模研究的现状,为相关研究人员提供借鉴。本文在查阅大量研究文献的基础上,以研究网络舆情所采用的数学模型种类对文献进行整理分析,按照网络舆情中不确定性因素的数学处理方法不同,将网络舆情数学建模的模型主要分为四类,即经典数学模型、随机数学模型、不确定数学模型、其它数学模型。结合现有网络舆情数学建模存在的欠缺,本文对未来的相关研究进行了展望。

1文献统计分析

1.1国内文献统计分析国内文献主要以中国学术文献网络出版总库(CNKI)、中国博士学位论文全文数据库、中国优秀硕士学位论文全文数据库这三个数据库的收录为准,时间截止2014年3月10日。本文将“网络舆情”与“网络舆论”视为同一概念,“模型”和“建模”也不加区别,组合成四个检索条件。在上述三个数据库中,分别选择主题为“网络舆情”或“网络舆论”,并含“模型”或“建模”为精确检索条件。为了保证研究文献的学术含量,我们主要选取博士与硕士论文库文献以及SCI来源期刊、EI来源期刊、核心期刊和CSSCI这四类期刊文献,检索结果如下。

表1国内网络舆情数学建模年载文献量分布表年份200620072008200920102011201220132014

期刊载文量22412192638554

博士论文量010*********

硕士论文量04917273430410

论文总量2713385274811114从表1可以看出,我国最早有关网络舆情建模的研究大致始于2006年。近些年来,随着专家学者对网络舆情数学建模的研究不断深入,每类文献量发展趋势呈上升态势,相关学术成果不断涌现,总体文献量逐年增加。

在这些文献的学科专业分类中,有新闻与传媒、互联网技术、计算机应用技术、图书情报管理等多个学科。在这些文献所受基金的资助种类中,有国家自然科学基金、国家社会科学基金、国家高技术研究发展计划(863计划)、国家重点基础研究发展计划(973计划),还有一些省份的自然科学基金、社会科学基金等28种基金。在这些文献所出自的机构分类中,有华中科技大学、四川大学、江西财经大学、南京大学、福州大学、解放军信息工程大学、中国科学院科技政策与管理研究所、中国科学院合肥智能机械研究所等百余所高校及科研院所。

从上述统计中,我们可以看出:一、众多学科专业背景的研究人员不约而同地参与到网络舆情建模的研究中;二、国家和地方政府不断加大力度支持网络舆情建模的研究,而且提供项目经费作为研究资助;三、网络舆情建模研究机构或团体分布比较广泛,全国各地共有百余所机构关注此领域课题研究。

1.2国外文献统计分析国外与网络舆情建模研究相关的文献,我们以ScienceDirect数据库收录的为主。舆情主要以“Public opinion”、“Public feeling”及“Public sentiment”等三种表达为主,其中以“Public o-pinion”表达的文献占大多数。网络也有两种表达方式,分别是“Internet”和“Network”。从所查到的文献来看,模型和建模的表达方式以“Model”和“Model-ing”为主。综合考虑之,我们在ScienceDirect数据库高级检索中输入“Internet public opinion”and“mod-el”,“Network public opinion”and“model”,“Internet public opinion”and“modeling”及“Network public opinion”and“modeling”这四个检索条件,勾选“in Abstract Title Keywords”进行检索。在不影响文献统计分析趋势的前提下,我们只勾选Journals选项进行检索。为了便于对比,选择的时间起点是2006年,截止时间为2014年3月10日。检索结果如下表所示。

表2国外网络舆情数学建模年载文献量分布表年份200620072008200920102011201220132014

期刊载文量18168101528264213从表2可以看出,国外网络舆情建模相关的研究文献相比国内而言不是很多,但近些年的研究文献总体呈现递增的趋势。本综述选取的部分英文参考文献就来源于其中。补充说明一点,中国学者在国外期刊上发表的部分文献也归属于国外网络舆情研究文献。2网络舆情数学建模研究的分类

对收集的部分中外文献进行分类整理,我们发现用数学建模的方法研究网络舆情大多集中在舆情的传播阶段,也有部分文献研究舆情的预警和挖掘等方面。采用的数学模型类型可谓百花争艳。根据网络舆情中不确定性因素的数学处理方法不同,本文以如下四类模型来进行归纳整理。

2.1经典数学模型经典数学模型是指那些只涉及决定性因素与传统数学方法,不涉及随机性等非决定性因素的数学模型。研究网络舆情的经典数学模型

·

51

·

第10期苏创,等:国内外网络舆情数学建模研究综述

代表之一是传染病模型。传染病模型是根据疾病的发生、发展及环境变化等情况,建立能反映其变化规律的微分方程数学模型[7]。Sudbury[8]最先提出用传染病模型来研究谣言传播,提出了一个SIR模型,其中S (susceptible)表示不知道信息的个体,I(infectious)表示知道信息并传播信息的个体,R(recovered)表示不再传播的个体。在该模型中,传播率和排除率是一个常数。对模型进行仿真后,得到谣言最多只能传递到80%人群的结论。Leskovec等[9]通过SIR模型研究舆情在博客圈内的传播情况。上述模型有一个缺陷就是考虑的个体状态比较简单,处理比较粗糙。实际上除了上述所考虑的三种状态之外,还存在其它的状态。在考虑其他状态的情况下,陈波[10]等建立了新的带直接免疫的SEIR舆论传播控制模型,并证明了该模型的传播平衡点及稳定性。陈静[11]在其硕士论文里面,基于传染病模型提出了一种适合当前在线网络传播形式的SICRS模型。该模型综合了传统的传染病SIS 和SIR两种模型,同时加入个体从感染状态I到免疫状态R之间的一种过渡状态(治疗状态C)。这里的C对应到舆情领域为知道消息但不传播的暂时遗忘状态;这里的R对应到舆情领域为对消息免疫的永久遗忘状态。Zhou等[12]利用SIR模型研究复杂网络上的谣言传播,研究发现最后受谣言感染的人数取决于网络的拓扑结构。当网络结构从随机网络变为无标度网络时,最后感染的人数将减少。Roshani和Naimi[13]将传统的传染病模型结合无标度网络建立一个新的模型。模型中每个节点的传染率等于它的度,将传染函数引入模型中,得出一个很有意思的实验结果,较小的传染性指数会导致谣言传播更广泛,而且这个结果和网络拓扑结构及配置无关。陈福集[14]在传统的传染病传播模型基础上引入话题衍生率,构建了SEIRS网络舆情传播模型。通过对传播阈值和平衡点的求解,从理论上分析了话题衍生率对传播态势的影响。兰月新[15]通过研究突发事件网络舆情形成过程及其影响因素,建立突发事件网络舆情传播规律的微分方程模型,确定舆情扩散过程中的三个特征时间点和舆情发展的四个时段。上述模型有一个共同的特征,模型中各项参数的变化规律是确定的,模型不涉及不确定的参量。

2.2随机数学模型随机数学模型是指在建模的过程中考虑了不确定因素,并利用概率论与数理统计、随机分析等随机数学方法来对不确定因素进行数学处理的模型。网络舆情传播的途径众多,如微博、论坛、门户网站、空间等,导致网络舆情的传播过程中存在很多不确定的因素,有部分学者将这种不确定因素视为随机因素,通过建立随机数学模型来研究网络舆情。到目前为止,研究网络舆情的随机模型主要有:马尔可夫模型、随机推理模型等。

有学者认为舆情发展的状态空间可以看作是随机变量序列,而且舆情的发展在t+1时刻的状态只与t 时刻的状态有关;舆情发展状态的转移过程是随机过程,这些特征满足马尔可夫链的基本要求。在分析上述网络舆情发展特点的基础上,刘勘等[16]提出了一种基于马尔可夫链的舆情热度趋势分析模型。Zeng 等[17]采用马尔可夫模型研究舆情在网络中的传播,在文献[18]中采用隐马尔可夫模型预测网络舆情的变化。Chen等[19]提出根据LIPED建立隐马尔可夫链模型研究舆情的变化。与文献[17-19]根据训练学习方法获得的马尔可夫模型参数不同,方薇等[20]在研究网络舆情整体正反意见人数概率分布时,充分考虑偏好、环境等参变量对状态预测的影响,采用哈肯协同理论来计算马尔可夫模型中的状态转移概率;然后,基于马尔可夫链获得网络舆情时间序列的状态(正面、负面)的概率分布,形成一个协同-马尔可夫模型。林琛[21]为了充分利用不同类型的实体和不同类型的社会关系对于专家结果的影响,在其博士论文中提出在Web数据中抽取多模网络的框架,并在这个多模网络上使用基于马尔可夫链的模型对专家进行排序;针对在多模网络上的马尔可夫过程计算到达专家节点的概率问题,提出在多模网络上的马尔可夫随机游走过程,并证明该过程是遍历不可约的。

还有部分学者从概率推理、贝叶斯网络、时间序列分析等角度研究网络舆情。网民将舆情传播给其它网民不一定就100%成功,而是存在一个概率β(0<β<1)。针对这一情况,Kitsak等[22]在复杂网络中利用传染病模型研究网络舆情的传播过程,将传播节点以概率β随机传播其相邻节点,并根据β的大小得出两种不同的结论。博客倾向性检索的目标就是检索出与给定主题相关评论的博文,廖祥文等[23]为了实现该目标,提出一个基于概率推理模型的算法用于检索博客倾向性。针对网络舆情作用主体复杂多样,难以预知等特点,张一文等[24]将贝叶斯网络建模与网络舆情态势评估的方法相结合,建立基于贝叶斯网络的网络舆情态势评估模型。网络舆情短期趋势预测忽略了传播过程中的动态变化性,所以预测效果不理想,针对这一不足之处,周耀明等[25]提出一种自适应网络舆情传播建模方法,与现有的预测方法比,自适应网络舆情传播建模方法具有更高的预测精度及更好的预测稳定性。Valerie Isham[26]等将随机传染病模型和随机网络结合,提出一种谣言在有限随机网络里面的随机传播模型。Zhang和Hong[27]将传统的Deffuant–Weisbuch 模型推广到两种多选择的DW模型,用来分析观点的

·

61

·情报杂志第33卷

演化模型。类似的观点演化模型还有Hegselmann–Krause模型[28]及Zhu[29]在文献中提到的基于无标度网络的Voter模型。Hou[30]等将初始的观点均匀分布在-1与1之间,在经典的deffuant模型基础上提出一个观点形成模型,用来预测一致意见的形成。上述模型在研究网络舆情的过程中,考虑了实际存在的一些不确定因素,并将这些不确定因素看成随机因素,采用概率、随机过程等数学方法建模。

2.3不确定数学模型网络舆情的产生、发展、消亡等阶段涉及诸多不确定因素,由非决定现象导致的不确定性愈来愈受到专家学者们的关注。为提供严谨处理不确定性的理论与方法工具,建立在公理化数学系统基础上的一门新型数学分支—不确定理论[31]应运而生。不确定理论及其延伸在许多领域取得了一系列成功的应用。在应用不确定理论处理网络舆情不确定性方面已经开始起步。不确定推理是建立在不确定集上的由人类不精确语言推导出结果的一种过程。Liu[32]最先建立不确定推理规则并将其应用到不确定控制中。Gao[33]基于不确定推理规则库建立不确定推理控制器,并成功应用到倒立摆系统。网络上的信息网民是否传播受多方面因素的影响,比如信息的真假、对信息感不感兴趣等。Su和Peng[34]将信息的真实度、网民对信息的兴趣度及网民传播的意愿度分别用三个不确定集表示,随后在不确定推理规则库的基础上建立不确定推理系统,利用不确定推理系统去判断网民是否会传播信息。网络舆情传播是一个随时间变化的动态过程,受很多不确定因素的影响,可以将网络舆情传播的过程看作一个不确定过程。不确定过程最早是由Liu[35]提出来的,随后在许多领域取得了应用。不确定微分方程是由典范过程驱动的,Peng等[36]将不确定微分方程应用到金融保险领域,李圣国和彭锦[37]对近年来不确定微分方程的研究成果进行了综述。苏创等[38]首先考虑将不确定微分方程应用于网络舆情传播的研究,将每个时刻舆情传播的次数看作一个不确定变量,将受不确定因素影响的舆情传播过程视为由典范过程驱动的不确定过程,从而建立了基于不确定微分方程的网络舆情传播模型。

上述模型将网络舆情网民传不传播采用不确定推理的方法推导,将舆情传播过程看做一个不确定过程,采用不确定微分方程研究网络舆情中存在的一些不确定因素。更多有关不确定理论的知识请参见文献[31]。2.4其它数学模型灰色系统理论主要研究的就是“外延明确,内涵不明确”的“小样本,贫信息”问题。在客观世界中,大量存在的既不是白色系统(信息完全明确)也不是黑色系统(信息完全不明确),而是灰色系统。有部分学者在研究网络舆情过程中,发现网络舆情中也存在这一现象,基于灰色理论建立模型来研究网络舆情。潘崇霞[39]在其硕士论文中运用灰色层次分析法对网络舆论的话题进行预测。李文杰等[40]以网上舆情事件的点击量和评论量作为舆情预警评价指标,提出灰色预测模型。

有部分学者用模糊理论研究网络舆情。到目前为止,研究主要集中在网络舆情的预警上。采用的方法主要有:模糊推理、模糊综合评价。李弼程等[41]借鉴战场态势分析和威胁估计思想,提出了一种基于直觉模糊推理的网络舆情预警方法,采用网络舆情态势分析模式对预警等级进行判断。石鲁生等[42]针对影响网络舆情预警等级各因素的特点以及目前各预警方法对预警等级动态变化性考虑不足的问题,引入动态模糊集,利用模糊综合评价法对网络舆情进行综合评判和动态预警。戴建华等[43]针对现实生活中人们获得信息的模糊性,在传统元胞自动机模型的基础上加入模糊推理的思想,并引入观点倾向度和倔强度两个模糊变量,提出了模糊规则下网络舆论的元胞自动机传播模型,最后仿真分析了网络舆论形成中个体观点的演化过程。Chen和Lin[44]基于模糊元胞自动机提出一个新颖的网络舆情演化模型。

博弈论是研究具有斗争或竞争性质现象的数学理论和方法。生物学家常常使用博弈理论来理解和预测进化论的某些结果。陈福集等[45]为了更好地认识网络舆情传播过程中的羊群效应,将演化博弈理论引入该问题的研究中建立演化博弈模型,并根据模型得出相应的指导意义。韩少春等[46]建立动态舆情演化博弈模型研究羊群效应在舆情演化过程中的产生机理及其动态发展,提出了动态舆情演化博弈树和收益矩阵,得出羊群效应可以加速信息扩散的结论。杨涵新[47]在其博士论文中指出网络的聚类系数越高越能促进公共物品博弈中的合作行为,基于这一特点,提出了一种预期迁移的博弈模型,当一个个体的实际收益低于期望值的时候,他会随机迁移到另外一个地点,发现在适中的期望值下,系统的合作水平最高。张四海[48]在其博士论文中提出重复博弈模型,并在此模型框架内,研究博弈策略演化问题,对合作理论、方法、策略演化以及网络演化问题进行了研究。魏静等[49]从进化博弈视角研究复杂在线网络舆情的传播情况,构建基于复杂网络的互联网舆情传递进化博弈模型。Liu等[50]将传统进化博弈模型中的“支付”概念替换成“个体接受程度”,并将网民对社会热点问题的态度分为“支持”,“中立”,“反对”,从而建立网络突发事件进化博弈模型。

神经网络是由大量的、简单的处理单元广泛地互相连接而形成的复杂网络系统,是一个高度复杂的非

·

71

·

第10期苏创,等:国内外网络舆情数学建模研究综述

线性动力学习系统。神经网络特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。基于神经网络具有的特性,神经网络模型被学者用于研究网络舆情。杨于峰等[51]基于自组织特征映射神经网络模型(SOM)具有较强的容错和聚类能力,将其运用到品牌丑闻微博分类预测研究上,得到微博上品牌丑闻事件传播的五种类型:对数型、缓坡型、突变型、长坡型及堤坝型。田盼等[52]将自组织特征映射神经网络模型(SOM)应用到微博话题变化趋势研究上,与文献[51]所不同的是,将SOM模型与乌克兰控制论专家A.G.Ivakhnenko提出的数据分组处理方法相结合,建立微博话题博文数量曲线分类模型。

元胞自动机是指散布在规则网格中的每一元胞取有限的离散状态,按照确定的规则通过简单的相互作用进行遍历而构成的动力系统[53]。有学者将网民个体看做一个元胞,元胞间的相互作用遍历过程看作是舆情传播的过程,从而建立元胞自动机模型来研究网络舆情。曾祥平等[54]利用元胞自动机模型建立一个网络舆情传播模型,该模型反映舆情形成过程中网民个体发表言论数的变化及观点的变化。方薇等[55]同样也是利用元胞自动机模型研究网络舆情的传播,但是和文献[54]不同的是,在针对元胞状态转换时提出了元胞移动遍历算法和元胞坚定性的多数规则计算公式,使遍历的过程与网络舆情的实际传播过程更接近。

也有学者建立系统动力学模型来研究网络舆情。系统动力学是分析研究信息反馈系统的学科[56]。陈福集等[57]从系统动力学的视角研究政府回应网络舆情能力的提升。曾华艺[58]在其硕士论文中结合系统动力学方法,对舆情事件的影响因素及其相互作用进行探索性研究。张一文[59]在其博士论文中,以系统动力学为工具,由政府、网络媒体、网民三个子系统构建一个反映突发性公共危机事件网络舆情作用机制的系统动力学模型。

上述模型包含了灰色、模糊、博弈论等数学方法,还有一些是数学方法和算法的结合,如:神经网络、元胞自动机、系统动力学等。这些数学模型种类多,研究的方法也各有千秋,但是和前面的三类数学模型又有所区别,因此统一归为一类。

3网络舆情数学模型研究中的欠缺

国外网络通常不像国内网络这样承载着许多意愿和诉求,所以很难形成规模较大的舆情。但是也有一些情况例外,比如2013年的斯诺登“棱镜门”事件和2014年的“马航失联”事件引起全世界关注,网络上关于这两个事件也是铺天盖地的报道,广大网民通过论坛、博客、贴吧留言和转发等方式参与讨论。总体来说,国外关于网络舆情研究的直接成果较少。国内研究网络舆情虽然时间比较晚,但是随着这几年网民的激增和网络舆情事件的频繁发生,网络舆情引起学者的高度关注,相关研究进展迅速。学者们以经典、随机、不确定等数学模型对网络舆情进行定量研究,发表了不少研究成果。但是从上面的归类总结中,我们不难发现从数学模型角度研究网络舆情尚存在某些欠缺。

模型中不确定因素的处理工具不够新颖。网络舆情是研究人的思想在网络上传播的过程,而每个人都是一个相对独立的个体,尽管周围环境和各种条件都一样,但是不同的网民在对同一个舆情事件也有可能做出不同的反映,所以网络舆情的每一个阶段都有可能存在我们意想不到的因素,整个网络舆情从出现到最终消失是一个不确定的过程。学者们在研究网络舆情过程中,忽略或者回避了一些客观存在的非确定因素,或者仅考虑将非确定因素视为随机性,运用概率论来处理。但采用概率方法处理网络舆情中的一切非确定现象,未必总符合常理。比如,腾讯QQ突然在小窗口弹出最近关于马航飞机失联的新闻帖子,有三个网民A、B、C正在上网,这三个人互不认识,其中A点击浏览帖子的可能性为0.7,B点击浏览帖子的可能性为0.6,C点击浏览帖子的可能性为0.5,那么这三个人同时点击浏览的可能性按照概率论的方法处理只有0.21,但是按照不确定理论的方法处理是0.5。网络舆情传播中的不确定性是随着点击浏览人数的增多而增大,但是随着人数的增多,用概率论运算法则得到的结果远低于用不确定理论运算法则得到的结果。所以采用不确定理论运算法则得到的结果更符合人们的直觉。

模型的种类不够丰富。研究网络舆情传播的模型目前还主要集中在传染病模型、马尔科夫模型等几类常见模型及其某些变形,成功尝试用新的数学方法建模的研究不多。在应用传染病模型中,将舆情传播率设定为一个常数,而实际上,舆情的传播率是一个动态的变量。在应用元胞自动机模型中,也是将每个人看作一个元胞,元胞状态下一刻变化由周围元胞状态通过一个固定的数学公式表示。很少有学者尝试用动态方法研究网络舆情演化过程。在交叉研究方面,已有学者将模糊推理和元胞自动机结合起来研究个体舆情传播,也有学者将传染病模型和博弈论联系起来,研究两种竞争观点的演化过程。但是这种交叉研究的文献现在还比较少,网络舆情建模是一个系统建模的过程,需要众多专业背景的研究人员共同参与,很欣喜的看到有物理研究学者将能量扩散方程应用到舆情研究。未来的研究将是多学科协同合作的过程。但是我们也

·

81

·情报杂志第33卷

应当看到,研究的模型越来越复杂,考虑的因素越来越多,从之前建立的可以求解模型,到现在只能通过计算机仿真,未来的研究将是依靠计算机的复杂系统建模。

模型的实证研究效果不高。依现有的研究文献分析发现,当前从数学建模的角度研究网络舆情,大多数只是理论上反映舆情的一些性质和传播规律,从实证角度研究网络舆情比较少。由于忽略了很多非确定因素,所以仿真得出的结果与实际情况还存在一些差距。在舆情预警方面,从第三节的文献分析可知,也用了很多种预测方法,大多数研究的结果也只是粗糙地对舆情发展态势做一个预警。在整理中还发现建立的模型只符合一个特定的舆情传播过程,换另一个舆情就不适用。当然,出现上面结果有以下几点原因。首先,网络舆情本来就是一个很复杂的问题,想要清楚刻画不容易,只能作一些假设;其次,学者们在研究中渗入了他们的主观因素,他们为网民观点变化制定的各种规则就可以反映这个问题;最后,受当前信息缺失或技术水平的限制,无法收集和网络舆情相关的全部数据,学者们在建模中也无法考虑全部的影响因素。

4网络舆情数学模型研究展望

目前网络舆情的研究吸引了愈来愈多学者的兴趣,引起了越来越多管理者的重视。从数学建模的角度来看,网络舆情研究将呈现以下趋势:

a.越来越多不同学科专业背景的学者研究网络舆情。这一趋势从所收集的近年研究文献学科分类可以看出。需要指出的是,我们在查阅文献过程中发现,通过数学建模研究网络舆情不再只是局限于那些从事数学研究的学者,更多具有计算机理论、管理科学、动力系统理论、物理等学科专业背景的学者将加入网络舆情建模研究队伍中。还要指出的是,学术界对网络舆情的研究将呈现从定性转向定性和定量相结合的大趋势。

b.越来越新的动态建模方法用于研究网络舆情。从最初通过常微分方程组建立的传染病模型,到基于马尔可夫链的预测模型,再到最近的不确定微分方程模型。我们发现研究网络舆情的方法开始从静态转向动态。还有一些具有物理学、生物学等背景的研究人员将物理学、生物学中的一些动态模型或建模思想引入到网络舆情的研究中。此外,随着处理非确定性工具的不断发现与应用,考虑的影响因素尤其是不确定因素的处理方法也将越来越多,从随机过程到不确定过程,从随机微分方程到不确定微分方程。因此,可以清晰地预见,研究网络舆情的动态建模方法将也是未来的大势所趋。

c.越来越重视理论与实践相结合。研究网络舆情就是把握舆情的演变规律,为决策者管控舆情提供参考,现阶段对网络舆情的传播和预警方面研究的文献不少,但是能成功进行实证分析的研究为数不多,未来研究舆情数学建模的趋势将是多个不同专业背景人员的合作,所建立的模型中考虑更多的实际因素,使模型预测更贴近真实的舆情走势。从事后研究转到事前研究、事中研究。对从事网络舆情危机应对的决策者来说,这将是福音,因为他们可以将网络舆情带来的负面影响尽可能降低。

5结束语

本文对网络舆情数学建模的文献进行整理分析,按照处理网络舆情不确定性因素的数学方法不同,将研究网络舆情的数学建模主要分为经典数学模型、随机数学模型、不确定数学模型及其它数学模型四大类。对现有的网络舆情数学模型存在的欠缺或问题进行了分析,并在此基础上展望未来网络舆情数学建模研究的趋势。

未来的网络舆情研究将更多地关注舆情的预警和控制,做好这一点就必须要熟谙舆情的演化过程。对管理者来说,舆情要不要控制、在哪一时刻控制、何时控制使所受的影响最小,何时控制使投入的成本最小,这些问题很显然是定性研究所不能满足的。从定性到定量、从静态到动态、从确定因素到不确定因素的变化轨迹是网络舆情研究的发展趋势所在。

参考文献

[1]曾润喜.网络舆情管控工作机制研究[J].图书情报工作,2009(18):79-82.

[2]崔薇,曾润喜,王国华.中国网络舆情研究文献计量分析[J].情报科学,2011,29(1):131-135.

[3]许鑫,章成志,李雯静.国内网络舆情研究的回顾与展望[J].情报理论与实践,2009,32(3):115-120.

[4]季丹,谢耘耕.中国网络舆情研究的历史回顾与反思-基于CNKI、CSSCI高被引论文观察[J].上海交通大学学报:哲学

社会科学版,2012,20(4):48-56.

[5]董志宏,扁柯潇,林立瑛,等.突发事件网络舆情研究文献计量分析[J].情报杂志,2011,30:60-62.

[6]李大芳,白庆华.国内网络参与研究文献综述[J].图书与情报,2012(3):107-112.

[7]马知恩,周义仓,王稳地,等.传染病动力学的数学模型与研究[M].北京:科学出版社,2004.

[8]Sudbury A.The Proportion of the Population Never Bearing aRu-mour[J].Journal of Applied Probability,1985,22:443-446.[9]Leskovec J,McGlohon M,Faloutsos C,et al.Patterns of Casca-ding Behavior in Large Blog Graphs[C].Proc of the SIAM Int

Conf on Data Mining,New York:ACM Press,2007:551-556.[10]陈波,于泠,刘君亭,等.泛在媒体环境下的网络舆情传播控制模型[J].系统工程理论与实践,2011,31(11):2140-2150.

·

91

·

第10期苏创,等:国内外网络舆情数学建模研究综述

[11]陈静.复杂网络上基于流行病学的舆情传播模型及其规律研究[D].吉林大学,2013.

[12]Zhou J,Liu Z,Li B.Influence of Network Structure onRumor Propagation[J].Physics Letters A,2007,368(6):458-463.[13]Roshani F,Naimi Y.Effects of Degree-biased Transmission Rate and Nonlinear Infectivity onRumor Spreading in Complex

Social Networks[J].PhysicalReview E,85.036109,2012.[14]陈福集,陈婷.基于SEIRS传播模型的网络舆情衍生效应研究[J].情报杂志,2014,33(2):108-113.

[15]兰月新,邓新元.突发事件网络舆情演进规律模型研究[J].情报杂志,2011,30(8):47-50.

[16]刘勘,李晶,刘萍.基于马尔可夫链的舆情热度趋势分析[J].计算机工程与应用,2011,47(36):170-173.

[17]Zeng J,Zhang S,Wu C,et al.Modelling Topic Propagation Over the Intenet[J].Mathematical and Computer Modelling of Dy-

namic Systems,2009,15(1):83-93.

[18]Zeng J,Zhang S,Wu C,et al.Predictive Model for Internet Pub-lic Opinion[C].Proceedings of Fourth Conference on Fuzzy

System and Knowledge Discovery,2007,3:7-11.

[19]Chen C,Chen M,Shen M.LIPED:HMM-based Life Profiles for Adaptive Event Detection[C].KDD'05,2005,Chicago,Illi-

nois,USA,556-561.

[20]方薇,何留进,宋良图.因特网上舆情传播的预测建模和仿真研究[J].计算机科学,2012,39(2):203-205.

[21]林琛.WEB环境下的社会网络挖掘研究[D].复旦大学,2009.

[22]Kitsak M,Gallos L,Havlin S,et al.Identification of Influential Spreaders in Complex Network[J].Nature Physics,2010,6

(11):888-893.

[23]廖祥文,曹冬林,方滨兴,等.基于概率推理模型的博客倾向性检索研究[J].计算机研究与发展,2009,46(9):1530-1536.[24]张一文,齐佳音,方滨兴,等.基于贝叶斯网络建模的非常规危机事件网络舆情预警研究[J].图书情报工作,2012,56(2):

76-81.

[25]周耀明,李弼程.一种自适应网络舆情演化建模方法[J].数据采集与处理,2013,28(1):69-76.

[26]Isham V,Harden S,Nekovee M.Stochastic Epidemics andRu-mours on FiniteRandom Networks[J].Physica A,2010,389:

561-576.

[27]Zhang J,Hong Y.Opinion Evolution Analysis for Short-range and Long-range Deffuant–Weisbuch Models[J].Physica A,2013,392:5289-5297.

[28]HegselmannR,Krause U.Opinion Dynamics and Bounded Con-fidence Models,Analysis and Simulation[J].Journal of Artificial

Societies and Social Simulations,2002,(JASSS),5.

[29]Zhu Y,Li W,Cai X.Opinion Evolution on a BA Scaling Net-work[J].Physica A,2013,392:6596-6602.

[30]Hou L,Liu J,Pan X,et al.Prediction of Collective Opinion in Consensus Formation[J].International Journal of Modern Phys-

ics C,2014,25(4):1450002.

[31]Liu B.Uncertainty theory[M].3rd Edition,Springer-Verlag Berlin,2010.

[32]Liu B.Uncertain Set theory and Uncertain InferenceRule with

Application to Uncertain Control[J].Journal of Uncertain Sys-

tems,2010,4(2):83-98.

[33]Gao Y.Uncertain Inference Control for Balancing an Inverted Pendulum[J].Fuzzy Optimization and Decision Making,2012,11(4):481-492.

[34]Su C,Peng J.A New Method to Monitor Internet Public Opinion based on uncertain set and uncertain inference[R].TechnicalRe-

port,2014.

[35]Liu B.Fuzzy Process,Hybrid Process and Uncertain Process[J].Journal of Uncertain Systems,2008,2(1):3-16.

[36]Peng J,Yao K.A New Option Pricing Model for Stocks in Un-certainty Markets[J].International Journal of OperationsRe-

search,2011,8(2):18-26.

[37]李圣国,彭锦.描述不确定动态系统的新工具:不确定微分方程[J].系统工程学报,2013,28(3):419-426.

[38]苏创,彭锦,李圣国.基于不确定微分方程的网络舆情传播模型研究[R].研究报告,2014.

[39]潘崇霞.基于灰色理论的网络舆情危机预警研究[D].江西财经大学,2012.

[40]李文杰,化存才,何伟全,等.网络舆情事件的灰色预测模型及案例分析[J].情报科学,2013,31(12):51-56.

[41]李弼程,王瑾,林琛.基于直觉模糊推理的网络舆情预警方法[J].计算机应用研究,2010,27(9):3312-3315.

[42]石鲁生,陈林,李凯.一种网络舆情的动态预警方法[J].天津师范大学学报:自然科学版,2012,32(2):59-65.

[43]戴建华,杭家蓓.基于模糊规则的元胞自动机网络舆论传播模型研究[J].情报杂志,2012,31(7):16-20.

[44]Chen T,Lin J.A Novel Model for the Evolution of Online Public Opinion Based on Fuzzy Cellular AutomataRules in Directed

World Networks[J].Applied Mathematics&Information Sci-

ences,2013,7(6):2335-2343.

[45]陈福集,黄江玲.基于演化博弈的网络舆情传播的羊群效应研究[J].情报杂志,2013,32(10):1-5.

[46]韩少春,刘云,张彦超,等.基于动态演化博弈论的网络舆情传播羊群效应[J].系统工程学报,2011,26(2):275-281.[47]杨纯新.复杂网络上的若干动力学研究[D].中国科学技术大学,2011.

[48]张四海.基于社会网络和博弈论的合作理论研究[D].中国科学技术大学,2006.

[49]魏静,朱恒民,洪小娟,等.基于复杂在线网络的舆情传递研究-进化博弈视角[J].现代图书情报技术,2013,231(3):65

-70.

[50]Liu D,Wang W,Li H.Evolutionary Mechanism and Information Supervision of Public Opinions in Internet Emergency[J].Proce-

dia Computer Science,2013,17:973-980.

[51]杨于峰,余伟萍,田盼.基于SOM神经网络的品牌丑闻微博传播分类预测研究[J].情报杂志,2013,32(10):23-28.[52]田盼,何跃.基于SOM-GMDH的微博热点话题变化趋势研究[J].软科学,2013,27(8):75-79.

[53]段晓东,王存睿,刘向东.元胞自动机理论研究及其仿真应用[M].科学出版社,2012.

[54]曾祥平,方勇,袁媛,等.基于元胞自动机的网络舆论激励

(下转第24页)

N(v)为关注U的朋友用户的关注人数,如果人数很多,则其影响力被分流的程度越大,相应的u用户聚合得到的影响力就会减弱。最后按照按节点的链接影响力排序,得到用户影响力序列。两种方法对于“腐败”、“城管”主题的用户关系网络的用户排序结果如下表:

表1不同排序方法下影响力前10名博主的发布情况分析

舆情主题

重要性

排序方法

博主发布微博的

被评论数的平均值

发布微博

数的平均值

微博平均转发

总数的平均值

城管用户连接度1140.926.75181.25

城管网络链接1469.308.60187.30

腐败用户连接度119.71.4296.9

腐败网络链接697.332084.7从表中可以看出,在“城管”主题下,按用户连接度排序方法获得的前10位用户其发布的微博的被评论数的平均值为1140.92,平均转发数为181.25,而利用网络链接排序方法获得的前10位用户,其发布的微博的被评论数的平均值为1469.30,提高了28.78%。而在“腐败”主题下,按用户连接度排序方法获得的前10位用户其发布的微博的被评论数的平均值为119.7,平均转发数为296.9,而利用网络链接排序方法获得的前10位用户,其发布的微博的被评论数的平均值为687.3,提高了482.54%,较高用户影响力的定位效果要高于仅仅依赖用户连接度。在“城管”主题中,由于大多发布微博的用户之间并没有形成较强的关系群,僵尸粉也随着其关系映射而消减很多,因而按照网络链接方法排序虽然比用户连接度排序有一定程度的提高,但比例不是很高。而在“腐败”主题下,由于大部分发帖的活动用户有一定的网络链接关系,用户连接明显增强,但许多博主的朋友多,但其影响力却不高。

通过表中数据,进一步可证明在社会网络中网络连接度大不一定其影响力很强,在舆情的网络预警和干预处理时,可以利用PageRank方法挖掘那些影响力大的少数节点,并对他们进行监控,一方面可以更好地通过他们发布舆情的正能量,同时对他们进行监控,提高舆情监控的效率。

在不同舆情主题下,处理的方式也应有所不同。“城管”主题基本上只需要控制几个影响力大的博主即可控制舆情传播,但“腐败”主题由于博主关系复杂,具有群体效应,更多依赖于舆情引导和政府工作职能公开,不能仅仅依赖于影响力大的微博用户节点的作用。

3结论

本文介绍了大数据时代微博网络舆情研究问题的特点,对微博大数据进行分析时,可针对不同主题进行分类,缩小数据分析量,提高网络挖掘的效率。本文针对“腐败”和“城管”主题建立了博主关注网络,并对网络结构进行了差异性分析,发现“腐败”主题比“城管”主题的意见更集中化,博主相互之间有更多的关注关系。在对不同主题下的博主关系网络分析中,发现社会网络中网络连接度大的微博用户的影响力不一定很强,利用PageRank方法可以获得更为精确的博主影响力。不同主题下微博用户影响力的能量和结构差异很大,微博舆情管理要依据不同的舆情主题采取合适的方法对网络舆情进行监控和引导,及时进行预警处理。

参考文献

[1]冯芷艳,郭迅华,曾大军等.大数据背景下商务管理研究若干前沿课题[J],管理科学学报,2013,16(1):1-9

[2]Lynch C.Big data:How do your data grow?[J].Nature,2008,455(7209):28-29.

[3]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169

[4]吴敏琦.微博用户日常生活信息获取行为模式及其影响因素研究[J].情报科学,2013,31(1):86-90

[5]王晓光.微博客用户行为特征与关系特征实证分析-以"新浪微博"为例[J].图书情报工作,2010,54(14):66-7

[6]杨凯,张宁.微博用户关系网络的结构研究与聚类分析[J].复杂系统与复杂性科学,2013,10(2):37-43

[7]刘继,李磊.基于微博用户转发行为的舆情信息传播模式分析[J],情报杂志,2013,32(7):74-78

[8]Aral S,Walker D.Identifying Influential and Susceptible Mem-bers of Social Networks[J].Science,2012,337(6092):337

-341.

[9]于晶.微博传播过程中用户影响力的特征实证分析[J],情报杂志,2013,32(8):57-61

[10]张玥,张宏莉,张伟哲,卢珺珈.识别网络论坛中有影响力用户[J].计算机研究与发展,2013,50(10):2195-2205

(责编:白燕琼

檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪檪

)(上接第20页)

模型[J].计算机应用,2007,27(11):2686-2688.

[55]方薇,何留进,孙凯,等.采用元胞自动机的网络舆情传播模型研究[J].计算机应用,2010,30(3):751-755.

[56]Ogata K.系统动力学(英文版)[M].第4版.北京:机械工业出版社,2004.

[57]陈福集,叶萌.系统动力学视角下政府回应网络舆情的能力

提升研究[J].情报杂志,2013,32(11):121-127.

[58]曾华艺.基于系统动力学的网络舆情危机预警研究[D].江西财经大学,2012.

[59]张一文.突发性公共危机事件与网络舆情作用机制研究[D].北京邮电大学,2012.

(责编:贺小利)

网络舆情调研报告

网络舆情调研报告 篇一:网络舆情调研报告 做好新形势下网络舆情监管工作的几点思考 随着计算机技术的日益普及,网络越来越成为人们传递信息、交流情感的一种重要途径,被称作报纸、广播和电视之外的第四媒体。人们充分的认识到,作为双刃剑的网络媒体,在给我们带来便捷的同时也带来了舆情危机,正如一网友所说:“每个人都是一羽话语蝴蝶,同频共振即可掀起舆论风暴。而互联网给了每个人一只麦克风,每个人都可以成为记者、作家、新闻发言人,蝴蝶又有了麦克风,更容易形成话语声浪、文化波涛”。所以,在新的历史形势下,如何更为有效地做好网络舆情监管工作成为宣传思想文化战线亟待解决的问题。网络舆情的形成及网络舆情监管工作的现状: 面对不断发展的网络媒体。一方面,人们可以随时随地利用这种传媒对某一事件、某一问题表达自己的情感,发表自己的看法,甚至煽动某些事件;另一方面,人们获取信息的渠道和方式也日益多样化,一旦有重大事件发生,如果一时不能获得消息或不能及时得到准确的消息,就会通过网络等获取信息。“一边是随心所欲的发布信息,一边是随时随地的获取信息”,发布的是什么样的信息、这些信息的怎样传播,获取信息的人们的怎样反应??这些都属于网络舆情的范畴,如何及时地发现这些网络舆情,并根据其发展变化采取相应的对策,对其实施有效的监管,成为党委政府维护自身形象、加强执政能力的必要手段。就目前而言,大多数地区已经意识到网络舆情对一个地方经 济社会发展有着不可忽视的影响,也建立起了最基本的舆情监管体系,可以开展网上舆情的采集、分析、处理等,但只局限于小范围之内的,并没有形成一个行之有效的监管体系。网络舆情监管存在的问题和不足: 从近年来发生的如贵州瓮安、云南孟连、湖北石首等有较大负面影响的群体性事件来看:事件发生后,尽管在网络中某些言论的观点是客观的、真实的,对事件的发展、问题的解决起到了一定的促进作用,但更多的是情绪化、偏激的,辱骂、

国内网络舆论文献研究综述

国内网络舆论文献研究综述 管理学院2011级行政管2班姓名艾尼瓦尔·吾斯曼学号20112555 摘要:互联网的发展为公众参与社会事务提供了开放、互动、自由的环境,公众可以随时在这个公开的环境中表达意见和看法。而公民在网络上表达观点和看法的同时也出现了一些不可避免的负面影响,严重影响了社会和谐,因此近几年以来政府部门和社会看重对网络舆论和网络舆论监督管理,同时对网络舆论进行监督和管理。作者通过收集整理大量的文献,就现在网络所拥有的表象分析,对于舆论所表达的概念,还有出现的问题及其必要性展开梳理,期望能为网络舆论的治理提供全面的总结资料。 关键字:网络舆论、网络论舆监管、文献综述 Development of the Internet for the public to participate in community affairs offers an open, interactive, free environment, the public can express their views and opinions at any time in the open environment. While citizens to express their views and opinions in the network also had a negative impact of some of the inevitable, seriously affected the social harmony, so in recent ye ars since the government and the social value of online public opinion and public opinion manag ement network, while the network of public opinion supervision and management. The authors col lected a lot of literature, the concept of a network of public opinion, necessity, status, and its im pact on the conduct of the system comb, hoping to provide a comprehensive summary of inform ation management for the network of public opinion. 目录 国内网络舆论文献研究综述 (1) 一、网络舆论与网络舆论监管的概念界定 (3) (一)网络舆论的概念 (3) (二)网络舆论的特征 (3) (三)网络舆论形成和传播的主要原因 (4) (四)网络舆论监督和管理的必要性 (4) (五)网络舆论监督和管理的内涵 (4) (六)网络舆论监督和管理的基本原则 (5) 二、国内外网络舆论监督和管理的研究现状 (6) (一)国外网络舆论监督管理的研究现状 (6) (二)国外对于网络舆情引导监督和管理的主要特点有 (7) (三)国内网络舆情监管的研究现状 (8) 三、我国网络舆情监管存在的主要问题 (9) (一)应对网络舆情的态度被动,行动速度迟缓 (9) (二)网络舆情监管部门执行网络法规刚性不强 (9) 四、网络舆情有效监管的路径选择 (10) (一)政府信息公开 (10) (二)加强对网络舆情的引导 (10) (三)完善对网络舆情预防和处理 (11) (四)完善网络立法 (11) (五)提高全民的综合素养 (12) 参考文献 (12) 一、网络舆论与网络舆论监管的概念界定 (一)网络舆论的概念

网络舆情中的大数据分析方法研究

网络舆情中的大数据分析方法研究 网络舆情是指在网络空间中对网民和生活中的社会事件尤其是一些突发事件的看法和态度。网络舆情通常涉及社会的热点事件,因而经常在网络中快速传播,成为人们谈论的焦点。因而,对网络舆情进行分析和正确的引导显得尤为重要。文章采用大数据分析方法分析网络数据,通过聚类的方法发掘网络舆情中的热点问题。实验证明该分析方法具有较高的热点挖掘能力和及时的能力。 标签:网络舆情;大数据分析;统计方法 一、舆情信息的获取 舆情分析的第一步是要对网页中的信息进行抓取,第二步是对抓取的网页的信息进行预处理。 对网页信息抓取主要采用网络爬虫,爬虫的主要作用是将互联网上的网页下载到本地形成一个互联网内容的镜像备份。它既可以爬取网页链接,又可以爬取网页的文本信息和图像信息。它通过关键字的搜索将对应的统一资源定位为相关的网页页面进行抓取,通過对其进行文本和图像的解析,提取对应网页的文本和图像信息并进行保存。本文中主要提取的是网页的文本信息。 而中文分词是把中文中的汉字系列分割为一个个独立的中文词汇。由于中文词汇与词汇之间的界限远不如英文单词那样清晰,因此,中文分词也是一个技术难点。当前中文分词主要是从主要包括字符串匹配分词方法和机器学习的统计分词方法。字符串匹配分词方法是事先通过一定的方法建立一个庞大的数据库字典,按照一定的方法把待分词的词汇与数据库字典中的词进行匹配从而实现分词的方法。机器学习的统计分词方法是通过词汇出现的频率和在文中的含义等信息对汉字的这些特征进行训练,从而实现分词。字符串匹配分词方法比较准确,但缺乏灵活性,机器学习的统计分词方法能对词的语意进行识别,但由于算法的不完善,准确率不高,因此,在实际中通常是将这两种结合来实现分词。 中文分词的词性主要包括名词、动词、形容词和副词等,形容词和副词常表示事物的状态和特征,因而经常能表明作者对事件的喜怒哀乐之情;动词一般就是用来表示动作或状态,它是对事物采取的动作的直接体现。这些词在舆情分析中就显得尤为重要。 二、文档特征的提取 一个网页的文本通过分词后会有成百上千个中文词汇,如果直接对其分类会影响分类的效率和准确性。因此,在分类前要去除一些无关的词语,留下最能代表文档特征的一些分词作为文档的特征。文档特征提取最主要的方法是把文档的内容和词频进行结合。

语音信号识别及处理中英文翻译文献综述

语音识别 在计算机技术中,语音识别是指为了达到说话者发音而由计算机生成的功能,利用计算机识别人类语音的技术。(例如,抄录讲话的文本,数据项;经营电子和机械设备;电话的自动化处理),是通过所谓的自然语言处理的计算机语音技术的一个重要元素。通过计算机语音处理技术,来自语音发音系统的由人类创造的声音,包括肺,声带和舌头,通过接触,语音模式的变化在婴儿期、儿童学习认识有不同的模式,尽管由不同人的发音,例如,在音调,语气,强调,语调模式不同的发音相同的词或短语,大脑的认知能力,可以使人类实现这一非凡的能力。在撰写本文时(2008年),我们可以重现,语音识别技术不只表现在有限程度的电脑能力上,在其他许多方面也是有用的。 语音识别技术的挑战 古老的书写系统,要回溯到苏美尔人的六千年前。他们可以将模拟录音通过留声机进行语音播放,直到1877年。然而,由于与语音识别各种各样的问题,语音识别不得不等待着计算机的发展。 首先,演讲不是简单的口语文本——同样的道理,戴维斯很难捕捉到一个note-for-note曲作为乐谱。人类所理解的词、短语或句子离散与清晰的边界实际上是将信号连续的流,而不是听起来: I went to the store yesterday昨天我去商店。单词也可以混合,用Whadd ayawa吗?这代表着你想要做什么。第二,没有一对一的声音和字母之间的相关性。在英语,有略多于5个元音字母——a,e,i,o,u,有时y和w。有超过二十多个不同的元音, 虽然,精确统计可以取决于演讲者的口音而定。但相反的问题也会发生,在那里一个以上的信号能再现某一特定的声音。字母C可以有相同的字母K的声音,如蛋糕,或作为字母S,如柑橘。 此外,说同一语言的人使用不相同的声音,即语言不同,他们的声音语音或模式的组织,有不同的口音。例如“水”这个词,wadder可以显著watter,woader wattah等等。每个人都有独特的音量——男人说话的时候,一般开的最低音,妇女和儿童具有更高的音高(虽然每个人都有广泛的变异和重叠)。发音可以被邻近的声音、说话者的速度和说话者的健康状况所影响,当一个人感冒的时候,就要考虑发音的变化。

舆情分析报告范文

舆情分析报告范文 舆情信息范文一 群众认为复活端午节光放假还不够 农历五月初五是端午节,作为第一个法定节日的端午节,如何让端午节焕发活力是个值得研究和切实解决的问题。广大群众认为,zhèng fǔ部门不能简单放假了事,应和相关的民俗组织一道,营造节日氛围,搭建吸引群众参与的平台。相关组织应围绕所在不同地区和城市特点,举行一些群体性娱乐活动,进行多种多样的纪念活动,让其成为端午节最突出的标志行为。只有这样才能让端午节成为一个别人"抢不走、夺不去"的民族节日。 公众拥护省高中课程设置及教学指导意见仍担心学生成绩下降考学难 近日,省教育厅再次出台素质教育新举措,高中课程设置及教学指导意见深得人心,对推进素质教育、促进学生全面发展、健康成长无疑具有重要意义。但同时十分担心,改革来得太快太急,配套措施跟不上,突出综合素质,倡导个性化发展容易分散学生精力,使老师、学生都想"松一口气",放松约束要求,最终导致成绩下降,影响就学。再者,开发学生潜能需要一个长期的过程,注重于某几门感兴趣的课程短时间不一定有收获,又容易导致偏科,影响成绩。不公开考试成绩,学生无法进行比较,心中无数,容易产生错误判断。公众呼吁,教育部

门应想方设法解决一下考生多和学校少的矛盾,切实改善教育大环境;同时,加大宣传力度,转变就学观念,引导到职业学校就读,学一技之长,不要都在"一本"、"重点"上扎堆。 舆情信息范文二 群众热议应届生应聘"雷事" 近日来,新一轮的"应聘大战"逐渐拉开帷幕,众多2016届毕业生走上求职舞台。在大部分应聘者极力展示自己能力的同时,应聘人的回答雷倒众考官的情况也屡见不鲜。这些"雷事"一经报道,引来群众热议。 雷事一简历雷同度高,模板泛滥。 肖婷是全国最大的电信运营公司的面试官,还没开始面试,两个名字就被她重重画了线。"这俩人就像是动画片里的葫芦兄弟遮上姓名后,一样的学校、一样的专业、一样的考试成绩,甚至是完全相同的擅长弹吉他、会打网球"她说。一问才知,校园网上有一份简历模板,两个人只改了名字和专业,其他的直接就使用了。他们甚至连模板的内容都懒得背,回答得"驴唇不对马嘴"。 群众普遍认为,这种雷同简历的出现,并不仅仅是大学生"变懒"的表现,这其中还包含着很大的"不负责任"在里面,作为跨出校园,步向社会的"招牌",都

国内网络舆情研究综述

国内网络舆情研究综述 丁 也 (周口师范学院新闻系 466001) 【摘 要】自互联网进入中国后,国内关于网络传播的研究一直没有中断过,但对网络舆情的研究尚处起步阶段。作为一个新兴的研究领域,网络舆情研究在理论与实践的紧密结合中不断拓展和创新。为更好地了解国内网络舆情的研究现状,本文根据对“中国期刊网”的检索结果,选取了其中一些有代表性的文献从网络舆情的概念、形成与传播、收集与研判、监控与引导以及网络舆情危机的预警等方面进行综述。 【关键词】网络舆情;传播;研判;引导;预警 随着网络的兴起和网络技术的普及,网络开始成为舆情汇集的新通道、传播的主阵地。作为现实社会舆情问题在网络空间中的延伸,网络舆情也渐渐走上社会发展的舞台,并发挥了越来越重要的作用。为更好地了解国内网络舆情的研究现状,本研究根据对“中国期刊网”的检索结果,试选取其中一些有代表性的研究成果做一综述,以期全面展示已有相关研究成果,供理论界参考借鉴,并以此推动网络舆情研究的进一步深化。 一、网络舆情的概念 周如俊、王天琪(2005)认为网络舆情从书面上理解就是在互联网上传播的公众对某一“焦点”、“热点”问题所表现的有一定影响力、带有倾向性的意见或言论的情况。刘毅(2006)认为网络舆情是由各种社会群体构成的公众,在一定的社会空间内,对自己关心或与自身利益紧密相关的各种公共事务所持有的多种情绪、态度和意见交错的总和。徐晓日(2007)认为网络舆情是社会舆情的一种表现形式,是公众在互联网上公开表达的对某种社会现象或社会问题的具有一定影响力和倾向性的共同意见。纪红、马小洁(2007)认为网络舆情就是指在网络空间内,围绕舆情因变事项的发生、发展和变化,网民对执政者及其政治取向所持有的态度。 二、网络舆情的形成与传播 一些研究者从新闻传播学维度对网络舆情的形成和传播规律进行了探讨。周如俊、王天琪(2005)认为网络舆情的形成主要源于社会矛盾、个人意见的扩展以及偶发事件的激发等诱因。张勇锋(2008)通过对《旅游新报》事件网络舆情信息在“量”和“质”上的梳理与分析,指出网络舆情所表达的观点和立场倾向其根源和指向仍然是现实生活中存在的现象和问题。曹劲松(2010)指出,依据时间轴线分析,网络舆情的发展具有“散播———集聚———热议———流行”四个阶段和“爆发、升华、延续”三个关口。刘毅(2007)认为,电子邮件和新闻组、即时通讯工具、BBS、博客和维客四类网络言论传播渠道是网络舆情传播的基本途径。曾润喜、徐 晓林(2010)以新浪网新闻《村官疑因考试领先公安局长之子被设套成逃犯》为研究样本,对网络舆情的传播规律进行研究后发现,网络舆情受到新闻刊发时间的影响,与信息获取便捷度正相关;网络舆情受到网络舆情事件涉及地区的影响,与互联网普及率正相关;网络舆情受到使用媒介类型的影响,互联网网民是主体,手机网民逐步增加;网络舆情的网民态度受到情绪的影响,容易指向党政机关和整个社会,呈现一边倒趋势。 三、网络舆情的收集与研判 网络舆情的收集与研判,是目前国内学术界就网络舆情进行研究的一个重要的内容。当前学术界就此问题进行了卓有成效的研究,取得了较为丰硕的理论成果。李雯静、许鑫、陈正权(2009)根据网络舆情的特点,从指标设计、分类、构建等方面,在网络舆情信息汇集、分析、预警的工作流程中,按照主题将信息分门别类,统计、计算出若干指标值,对舆情进行横向、纵向的监测和评估,筛选出有价值的信息,帮助舆情工作者对舆情突发事件进行研判及态势预测。 郑魁、疏学明、袁宏永(2010)根据公共安全网络舆情研究的需求,将中文分词技术应用于突发事件应急管理中,提出基于ICTCLAS分词技术的网络舆情热点信息的自动发现方法,并通过1个突发事件的实例验证了该方法的实用性和可靠性。该方法读入新闻文本并进行分词和词频统计,从词频表中去除停用词,合并多单位关键词得到突发事件热点信息关键词列表,对网络信息及时进行检索,为突发事件应急决策提供技术支持。柳虹、徐金华(2011)提出了一个包括舆情信息采集、信息预处理、特征提取、VSM生成、热点发现算法和评价指标等几个部分的网络舆情热点发现模型,并通过实验比较了两种算法:K-means方法和SVM方法,实验结果表明SVM对于网络舆情热点发现方面具有比较好的优势。 刘毅(2006)研究了内容分析法在网络舆情分析中的作用,认为内容分析法在网络上的应用主要体现在对网络的内容挖掘、对网络的结构挖掘和对网络的使用记录挖掘上,内容分析法在网络舆情信息分析中的作用主要体现在三个方面:(1)描述网络中传播的舆情信息;(2)推论网络舆情信息传播主体的意图以及态度和情绪的倾向性;(3)描述和推论网络舆情信息的产生和变化趋势。黄晓斌、赵超(2009)研究了文本数据挖掘法在网络舆情分析中的作用。文本挖掘的技术主要包括特征提取、文本分类、文本聚类、关联分析、文本总结、趋势预测等。文本挖掘技术在网络舆情信息分析中的应用体现在五个方面:(1)对网络舆情进行描述;(2)对网络— 0 6—

指纹识别系统(文献综述)

指纹识别方法的综述 摘 要: 对在指纹的预处理和特征提取、指纹分类、指纹的匹配过程中的方向图、滤波器、神经网络等关 键性原理和技术做了详细的说明,并对在各个过程中用到的方法做了进一步的比较,讨论了各种方法的优越性。 0 引 言 自动指纹识别是上世纪六十年代兴起的,利用计算机取代人工来进行指纹识别的一种方法。近年 来,随着计算机技术的飞速发展,低价位指纹采集仪的出现以及高可靠算法的实现,更使得自动指纹识 别技术越来越多地进入到人们的生活和工作中,自动指纹识别系统的研究和开发正在成为国内外学术 界和商业界的热点。相对于其他生物特征鉴别技术例如语音识别及虹膜识别,指纹识别具有许多独到 的优点,更重要的是它具有很高的实用性和可行性,已经被认为是一种理想的身份认证技术,有着十分 广泛的应用前景,是将来生物特征识别技术的主流。 1 指纹取像 图 1 是一个自动指纹识别系统AFIS(Automated Fingerprint Identification System) 的简单流程。 → → → ↓ ↑ ———— 将一个人的指纹采集下来输入计算机进行处理是指纹自动识别的首要步骤。指纹图像的获取主要利用设备取像,方便实用,比较适合AFIS 。利用设备取像的主要方法又利用光学设备、晶体传感器和超声波来进行。光学取像设备是根据光的全反射原理来设计的。晶体传感器取像是根据谷线和脊线皮肤与传感器之间距离不同而产生的电容不同来设计的。超声波设备取像也是采用光波来取像,但由于超声波波长较短,抗干扰能力较强,所以成像的质量非常好。 2 图像的预处理与特征提取 无论采取哪种方法提取指纹,总会给指纹图像带来各种噪声。预处理的目的就是去除图像中的噪 音,把它变成一幅清晰的点线图,以便于提取正确的指纹特征。预处理是指纹自动识别过程的第一步, 它的好坏直接影响着指纹识别的效果。常用的预处理与特征提取( Image Preprocessing and Feature Ex 2 t raction) 方法的主要步骤包括方向图计算、图像滤波、二值化、细化、提取特征和后处理。当然这些步骤 可以根据系统和应用的具体情况再进行适当变化。文献[ 1 ]提出了基于脊线跟踪的方法能够指纹取像 图像预处理 特征提取 指纹识别 数据库管理

地方政府应对网络舆情的治理模式文献综述

地方政府应对网络舆情的治理模式文献综述 进入21世纪以来,我国的互联网技术迅速发展,计算机在民众中得到普及,我国的网民数量也迅速增加到今天的5.13亿左右。由于我国政治民主化进程的发展,网络空间的虚拟性,网络影响力的增加,我国公民和网民越来越多的通过网络表达对公共事件的看法、参与国家政治生活、表达自己的利益诉求。虽然我国地方政府应对网络舆情的治理研究起步较晚,但是关于网络治理的相关问题我国学者做了大量的研究。从总体上看,主要集中在以下几个方面:第一,对政府网络治理的发展现状分析。从文献中,我们发现网络治理越来越受到政府重视。当前,加强执政能力建设、提高执政水平的一项重要任务就是加强舆情信息工作、建立舆情信息机制。胡锦涛总书记在党的十六届六中全会报告中就如何加强网络舆情引导和掌控能力方面提出了三点明确要求;十七届五中全会提出“建立社会安全事件的预防预警和应急处置体系”以及“加强重要新闻媒体建设,重视互联网等新兴媒体建设、运用、管理,把握正确舆论导向,提高传播能力。”如在谢金林的《网络舆论的政府治理: 理念、策略与行动》、《网络空间政府舆论危机及其治理原则》、郑曙村和张勇的《中国网络公共领域的兴起与政府治理》、刘良的《中国网络公共领域的兴起与政府治理模式变迁》、姚引良.刘波和汪应洛的《网络治理理论在地方政府公共管理实践中的运用及其对行政体制改革的启示》等

文章中都详细阐述了政府对网络舆情的治理方法及策略,体现出政府对网络治理的重视。但在网络治理如火如荼发展的背后也存在写不足与缺陷。根据近两年人民网舆情监测室发布的中国互联网舆情分析报告统计数据看,2009年排名前20位的网络热点事件中,与政府直接相关的有15件,负面事件有14件,占政府事件总数的93%;2010年排名前20位的网络热点事件中,与政府直接相关的负面事件6件,占政府事件总数的75%。说明当前网络热点事件往往反映的是政府的负面信息,直接影响了政府公信力及领导干部的形象。所以,如何充分利用好网络平台,把握社情民意的实时镜像,辅助政府决策参考,同时管理好网络平台,建立政民沟通的公信通道,构建网络和谐舆情,是当前政府网络舆情治理工作的关键所在。 第二,对网络舆情治理主要问题的解决路径的研究。针对政府网络治理存在的问题,关于如何使政府构建网络和谐舆情的探讨越来越多,如张勤和梁馨予的《政府应对网络空间的舆论危机及其治理》、孙柏瑛和李卓青的《政策网络治理: 公共治理的新途径》、黄颖和陈水生的《网络治理视野下的公共服务型政府建设——以上海浦东市民中心为例》、李小梅和李尚敏的《论“网络治理”模式下中国政府角色的新定位》等文章中均有体现。 第三,基于我国的发展情况,我国学者给出来如下的政府治理模式: 政府层面上: (一)、理念上的转变。对于各级地方政府来说,首先政府要以战略

网络舆情调研报告范文及写作方法

网络舆情调研报告范文及写作方法 一般格式标题页: 1、标题 2、客户(委托人) 3、调研公司 4、日期内容目录 执行性摘要:1、目标的简要陈述 2、调研方法的简要陈述 3、主要调研结果的简要陈述 4、结论与建议的简要陈述 5、其他相关信息(如特殊技术、局限、背景信息) 分析与结果(详细):1、调查基础信息 2、一般性的介绍分析类型 3、表格与图形 4、解释性的正文结论与建议 调查方法: 1、研究类型、研究意图、总体的界定2、样本设计与技术规定a、样本单位的界定b、设计类型(概率性与非概率性,特殊性) 3、调查问卷a、一般性描述b、对使用特殊类型问题的讨论 4、特殊性问题或考虑5、局限a、样本规模的局限b、样本选择的局限c、其他局限(抽样误差、时机、分析等) 附录:1、调查问卷 2、技术性附录(如统计工具、统计方法) 3、其他必要的附录(如调查地点的地图等)2一般写法一、标题。 标题可以有两种写法。一种是规范化的标题格式,即“发

文主题”加“文种”,基本格式为“××关于××××的调查报告”、“关于××××的调查报告”、“××××调查”等。另一种是自由式标题,包括陈述式、提问式和正副题结合使用三种。陈述式如《教学反思实效性研究实验调查》,提问式如《为什么要进行教学反思实效性研究》,正副标题结合式,正题陈述调查报告的主要结论或提出中心问题,副题标明调查的对象、范围、问题,这实际上类似于“发文主题”加“文种”的规范格式,如《提高教师教学反思质量――××××教学反思实效性研究的调查报告》等。 二、正文。 正文一般分前言、主体、结尾三部分。 1.前言。有几种写法:第一种是写明调查的起因或目的、时间和地点、对象或范围、经过与方法,以及人员组成等调查本身的情况,从中引出中心问题或基本结论来;第二种是写明调查对象的历史背景、大致发展经过、现实状况、主要成绩、突出问题等基本情况,进而提出中心问题或主要观点来;第三种是开门见山,直接概括出调查的结果,如肯定做法、指出问题、提示影响、说明中心内容等。前言起到画龙点睛的作用,要精练概括,直切主题。 2.主体。这是调查报告最主要的部分,这部分详述调查研究的基本情况、做法、经验,以及分析调查研究所得材料中得出的各种具体认识、观点和基本结论。

网络舆情分析技术的研究

网络舆情分析研究 舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。网络舆情形成迅速,对社会影响巨大,不仅需要各级党政干部密切关注,也需要社会各界高度重视。随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息的主要来源有:新闻评论、BBS、聊天室、博客、聚合新闻(RSS)。 网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。网络的开放性和虚拟性,决定了网络舆情具有以下特点:1、直接性,通过BBS,新闻点评和博客网站,网民可以立即发表意见,下情直接上达,民意表达更加畅通;2、突发性,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种情绪化的意见,就可以成为点燃一片舆论的导火索;3、偏差性,由于发言者身份隐蔽,并且缺少规则限制和有效监督,网络自然成为一些网民发泄情绪的空间。在现实生活中遇到挫折,对社会问题片面认识等等,都会利用网络得以宣泄。因此在网络上更容易出现庸俗、灰色的言论。 与国外相比,我国网络舆情还存在以下特殊情况:一是由于历史的原因,我国曾长期处于封闭状态,容易受到外来思想文化的冲击。二是目前我国正处于社会转型期,不可避免地存在诸多矛盾,容易使一些人出现情绪化冲动,以致不能明辨是非。三是少数社会管理者对于舆论习惯于回避或堵塞。因此,网络这把锋利的“双刃剑”在提供了下情上达的便捷方式的同时,也对我国政治安全和文化安全构成了严重威胁,具体表现在以下三个方面:一是西方国家利用网络对我国进行“西化”“分化”,网上思想舆论阵地的争夺战日趋激烈。二是传统的政治斗争手段,在网上将以更高效的方式实现,利用网络串联、造谣、煽动将比在现实中容易得多,也隐蔽得多。三是通过网络,西方的观念、生活方式可以便捷地渗透进来。对于网络舆情的这些特点,社会管理者应当了然于心。对现实中出现的各种网络舆论,社会管理者应能做出及时反馈,防微杜渐,防患于未然。因此必须利用现代信息技术对网络舆情予以分析,从而进行控制和引导。由于网上的信息量十分巨大,仅依靠人工的方法难以应对网上海量信息的收集和处理,需要加强相关信息技术的研究,形成一套自动化的网络舆情分析系统,及时应对网络舆情,由被动防堵,化为主动梳理、引导。 这样的系统应该具备以下功能:首先是舆情分析引擎。这是舆情分析系统的核心功能,包括:1、热点话题、敏感话题识别,可以根据新闻出处权威度、评论数量、发言时间密集程度等参数,识别出给定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题。2、倾向性分析,对于每个话题,对每个

语音识别技术文献综述

语音识别技术综述 The summarization of speech recognition 张永双 苏州大学 摘要 本文回顾了语音识别技术的发展历史,综述了语音识别系统的结构、分类及基本方法,分析了语音识别技术面临的问题及发展方向。 关键词:语音识别;特征;匹配 Abstact This article review the courses of speech recognition technology progress ,summarize the structure,classifications and basic methods of speech recognition system and analyze the direction and the issues which speech recognition technology development may confront with. Key words: speech recognition;character;matching 引言 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,所涉及的领域有信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等,甚至还涉及到人的体态语言(如人民在说话时的表情手势等行为动作可帮助对方理解)。其应用领域也非常广,例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务领域的智能对话查询系统,在信息高度化的今天,语音识别技术及其应用已成为信息社会不可或缺的重要组成部分。 1.语音识别技术的发展历史 语音识别技术的研究开始二十世纪50年代。1952年,AT&Tbell实验室的Davis等人成功研制出了世界上第一个能识别十个英文数字发音的实验系统:Audry系统。

网络舆情综述

浅析网络舆情综述 [摘要]伴随着互联网与社交平台的不断发展与完善,中国正式进入“传媒聚光灯”和“大众麦克风”的时代。作为拥有4亿网民听众的网络舆论正式踏上与传统媒体分庭抗礼的地位,而从2012年底至2013年2月初这一小段时间内各类网络舆情的井喷式爆发与其对社会造成的巨大冲击更是证明了网络舆论日益发挥着举足轻重的作用。网络舆情对于地方税务局来说同样是一把双刃剑,不可避免的我们需要认清其发挥影响力的实质与应对方式。本文旨在立足于专家人士对舆情最新解读与理论,分析探讨面对网络舆情时各部门占据主动的可行性,以及如何合理利用网络舆情的优势寻找拓展纳税服务新途径。 一、网络舆情综述 (一)、网络媒体的兴起与网络舆情的出现与发展 自1994年互联网正式进入到我国以来,网络作为继报纸、广播、电视等传统媒体之后成为21世纪中国社会发展不可或缺的全新媒体形式。这种建立在数字技术与网络通讯基础之上的媒体通过多种形式影响着我们日常生活的方方面面:数字电视、博客、播客、微博、网上论坛、手机移动信息平台、对话链、虚拟社区、搜索引擎、门户网站等等。而形式的广泛性与内容的丰富性则为其吸引来了不同年龄、不同地区、不同需求的庞大人群受众。2013年1月中国互联网络信息中心(CNNIC)在京发布第31次《中国互联网络发展状况统计报告》报告显示,截至2012年

12月底,我国网民规模达到5.64亿,互联网普及率为42.1%。与此同时,手机网络各项指标增长速度全面超越传统网络,以手机终端为主的微博用户及地区论坛应用方面出现较快增长,截至2012年12月底,我国微博用户规模为3.09亿。 网络舆情,是“由各种事件的刺激而产生,通过互联网传播的,人们对于该事件的所有认知、态度、情感和行为倾向的集合” [1],换言之,网络舆情就是针对某一社会现象,网民通过论坛、博客、微博等网络传播形式公开表达的具有针对新的意见、态度和情绪的总和。而当这种讨论趋向于统一时就会产生不可忽视的巨大的正面或者负面的社会力量,并有效影响着社会公共事务的处理方向从而改变社会现实现象。总是,在网络传播成为社会信息的重要传播方式的背景,一旦社会出现突发敏感事件,公众舆论会迅速集聚在网上,网络舆情事件也就随之形成。 2013年3月有人微博发表题为“孙志刚十年祭”的文案,在重新提起2003年广州孙志刚案的同时更是对网络舆情发展十年过程的总结。从2002年的4580万至2012年底的5.64亿,最近十年来网民规模迅速扩大是推动网络舆情发展的主体因素。随着互联网进入以博客、RSS、P2P、社交网(SNS)、即时通信(IM)等为主导的Web2.0 阶段,网民可以就任何关键字设立专门的论坛,任何对此事件或话题感兴趣的网民都可以到论坛发表言论和图片,互联网技术“为网络舆论兴盛准备了技术条件” [2]。随着参与社会事件讨论的人数越来越多,网络舆情开始逐渐受到各

网络舆情及其预警研究综述

江苏科技信息June 2013 ■ 杨菁赵岩 摘要: 文章收集、整理了关于网络舆情及网络舆情预警的国内外研究成果,对研究内容进行了系统梳理,并在此基础上提出了网络舆情及网络舆情预警研究的不足及展望,为该领域进一步研究奠定了文献基础。关键词:网络舆情;预警机制;危机管理 网络舆情及其预警研究综述 网络舆情及网络舆情预警研究是伴随着信息科技的飞速发展而新兴的学科,随着网民数量的大量增加,该领域相关研究的重要性越发凸显。近几年国内外许多学者将研究视角聚焦于网络舆情及网络舆情预警方面的研究。本文收集、整理了该研究方向上的国内外研究成果,对研究内容进行了系统梳理,并在此基础上提出了网络舆情及网络舆情预警方面的研究不足及研究展望,为该领域的发展奠定基础。 1.网络舆情及网络舆情预警的国外研究现状 关于网络舆情及网络舆情的预警研究,国外学者的相关研究主要集中在以下方面。一部分国外学者的研究主要针对互联网对舆情的影响或网络舆情展开。Savigny和Heather认为,当代社会舆论总体上由大众媒体促成,并通过沟通系统创造出来。互联网作为一种新的沟通工具,与传统的媒介相比对公众舆论 有重要作用。Christen等通过实验比较了地方、国家和互联网新闻对公众舆论的影响。 Kobayashi和Tetsur通过调查互联网的应用对日本舆论的影响,认为互联网是公众获取和理解政府政策的有效工具。除此之外,各国政府还有相应的法律法规对网络言论、信息及一些商业行为进行管理规范,如美国在9.11后发布的《爱国者法案》和法国的《信息社会法》等。可以看出这些研究虽然与网络舆情有关,但并没有专门以公共事件的网络舆情危机作为研究对象,仅仅从管理角度进行了一些研究。 还有一部分国外学者的研究则主要偏重于危机事件的应对及决策,大多从群体决策理论框架和批判理论角度出发。从20世纪初开始,学者们就将群体思维用于解决群体讨论、群体决策、群体成员人际关系等问题。一些学者认为,以网络为媒介形成的虚拟社群,其讨论方式、决策方式、人际关系等,都很像一个 小群体,所以出现了许多以群体传播理论研究网络传播行为的论文。另一些学者的研究以批评理论为工具,探讨网络传播群体中成员的社会背景及性别角色以及由此带来的影响,其关注的重点多是不平等和压迫现象。还有一些文献集中于公众舆情对一任政府及政府对一些重大事件的政策评论及影响上,如:对伊拉克和海湾战争的民意研究、对克林顿政府的民意研究等。 2.网络舆情及网络舆情预警的国内研究现状 我国正处于社会主义民主化和法制化建设和完善的转型时期,伴随着互联网的高速发展,对网络舆情的研究也迫在眉睫,受到各学者的广泛关注。 理论体系方面,当前网络舆情事件应急处理中存在较多问题,如信息的过度控制导致舆情泛滥;应急准备不足,对突发事件响应速度慢;舆情监测分析手段落后;主流媒体在网络空间的引导缺 基金项目:内蒙古自然科学基金面上项目;项目名称:内蒙古经济、资源、环境发展中的公共危机事件网络舆情预警机制研究;项目编号:2012MS1008。内蒙古教育厅高等学校科学研究重点项目;项目名称:内蒙古经济、资源、环境非均衡发展的公共危机事件网络舆情预警机制研究;项目编号:NJSZ12047。 作者简介:杨菁,内蒙古工业大学,讲师,博士。赵岩,内蒙古工业大学,副教授,博士。 战略研究 12

语音识别文献综述

噪音环境下的语音识别 1.1引言 随着社会的不断进步和科技的飞速发展,计算机对人们的帮助越来越大,成为了人们不可缺少的好助手,但是一直以来人们都是通过键盘、鼠标等和它进行通信,这限制了人与计算机之间的交流,更限制了消费人群。为了能让多数人甚至是残疾人都能使用计算机,让计算机能听懂人的语言,理解人们的意图,人们开始了对语音识别的研究. 语音识别是语音学与数字信号处理技术相结合的一门交叉学科,它和认知学、心理学、语言学、计算机科学、模式识别和人工智能等学科都有密切关系。 1,2语音识别的发展历史和研究现状 1.2.1国外语音识别的发展状况 国外的语音识别是从1952年贝尔实验室的Davis等人研制的特定说话人孤立数字识别系统开始的。 20世纪60年代,日本的很多研究者开发了相关的特殊硬件来进行语音识别RCA实验室的Martin等人为解决语音信号时间尺度不统一的问题,开发了一系列的时问归正方法,明显地改善了识别性能。与此同时,苏联的Vmtsyuk提出了采用动态规划方法解决两个语音的时闻对准问题,这是动态时间弯折算法DTW(dymmic time warping)的基础,也是其连续词识别算法的初级版.20世纪70年代,人工智能技术走入语音识别的研究中来.人们对语音识别的研究也取得了突破性进展.线性预测编码技术也被扩展应用到语音识别中,DTw也基本成熟。 20世纪80年代,语音识别研究的一个重要进展,就是识别算法从模式匹配技术转向基于统计模型的技术,更多地追求从整体统计的角度来建立最佳的语音识别系统。隐马尔可夫模型(hidden Markov model,删)技术就是其中一个典型技术。删的研究使大词汇量连续语音识别系统的开发成为可能。 20世纪90年代,人工神经网络(artificial neural network,ANN)也被应用到语音识别的研究中,并使相应的研究工作在模型的细化、参数的提取和优化以及系统的自适应技术等方面取得了一些关键性的进展,此时,语音识别技术进一步成熟,并走向实用。许多发达国家,如美国、日本、韩国,已经IBM、Microsoft、Apple、AT&T、Nrr等著名公司都为语音识别系统的实用化开发研究投以巨资。 当今,基于HMM和ANN相结合的方法得到了广泛的重视。而一些模式识别、机器学习方面的新技术也被应用到语音识别过程中,如支持向量机(support vector machine,SVM)技术、进化算法(evolutionary computation)技术等。

网络舆情监控系统可行性报告

舆情监控系统可行性分析报告 2011年4月

1 目录 第一章项目总述 (2) 1.1 系统背景 (2) 1.2 数安舆情监控系统的必要性 (2) 1.3 我国网络舆情现状 (3) 1.4 系统设计方针和原则 (3) 第二章项目可行性分析 (4) 2.1价值分析 (4) 2.2 数安舆情监控系统三大模块 (5) 2.2.1 舆情分析引擎 (5) 2.2.2 互联网信息采集 (5) 2.2.3 搜索引擎数据管理 (5) 2.3 数安舆情监控系统先进技术 (5) 2.3.1 网络信息采集技术 (5) 2.3.2 数安舆情监控系统舆情智能分析技术 (6) 2.3.3 自然语言智能处理技术 (7) 2.3.4 全文检索技术 (7) 第三章实施方案 (7) 3.1 总体框架 (7) 3.2 数安舆情监控系统系统特点 (8) 3.2.1 自定义URL来源及采集频率 (9) 3.2.2 支持多种网页格式 (9) 3.2.3 支持多种字符集编码 (9) 3.2.4 支持整个互联网采集 (9) 3.2.5 支持内容抽取识别 (10) 3.2.6 基于内容相似性去重 (10) 3.2.7 热点话题、敏感话题识别 (10) 3.2.8 舆情主题跟踪 (10) 3.2.9 自动摘要 (10) 3.2.10 舆情趋势分析 (10) 3.2.11 突发事件分析 (10) 3.2.12 舆情报警系统 (10) 3.2.13 舆情统计报告 (11) 3.3 价值实现 (11) 第四章项目投资 (12)

第一章项目总述 1.1 系统背景 随着互联网的快速发展,网络媒体作为一种新的信息传播形式,已深入人们的日常生活。网友言论活跃已达到前所未有的程度,不论是国内还是国际重大事件,都能马上形成网上舆论,通过这种网络来表达观点、传播思想,进而产生巨大的舆论压力,达到任何部门、机构都无法忽视的地步。可以说,互联网已成为思想文化信息的集散地和社会舆论的放大器。 1.2 数安舆情监控系统的必要性 网络舆情是通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点,主要通过BBS论坛、博客、新闻跟贴、转贴等实现并加以强化。当今,信息传播与意见交互空前迅捷,网络舆论的表达诉求也日益多元。如果引导不善,负面的网络舆情将对社会公共安全形成较大威胁。对我们说,如何加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。 统计数据显示,我国正在跃升为全球领先的舆论媒体大国。截至2006年初,电视数量、报纸发行量和30岁以下网民人数均已排名全球首位;现有3000多个电视频道、2000多份报纸和9000多种杂志。在舆情媒体规模、媒体种类等发展迅猛的同时,舆情导向的监测预警显得愈发重要,特别是互联网这把“双刃剑”,既提供了大量进步、健康、有益的提倡性信息,也有不少反动、迷信、低级的误导性言论,这样就更需要有舆情监测预警的出现,防范误导性舆论的社会危害于未然,把握和保障正确舆论的前进导向,为构建和谐社会的舆情保驾护航。 2

语音识别开题报告

青岛大学 毕业论文(设计)开题报告 题目:孤立词语音识别的并行编程实现 学院:自动化工程学院电子工程系 专业:通信工程 姓名:李洪超 指导教师:庄晓东 2010年 3月22日

一、文献综述 语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。 广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别[1]。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。 1.1 语音识别技术现状 1.1.1 语音识别获得应用 伴随着语音识别技术的不断发展,诞生了全球首套多语种交谈式语音识别系统E-talk。这是全球惟一拥有中英混合语言的识别系统,能听能讲普通话、广东话和英语,还可以高度适应不同的口音,因而可以广泛适用于不同文化背景的使用者,尤其是中国地区语言差别较大的广大用户。由于E-talk可以大大提高工作效率,降低运营成本,并为用户提供更便捷的增值服务,我们相信它必将成为电信、证券、金融、旅游等重视客户服务的行业争相引用的电子商务应用系统,并成为电子商务发展的新趋势,为整个信息产业带来无限商机。 目前,飞利浦推出的语音识别自然会话平台SpeechPearl和SpeechMania已成功地应用于国内呼叫中心,SpeechPearl中的每个识别引擎可提供高达20万字的超大容量词库,尤其在具有大词汇量、识别准确性和灵活性等要求的各种电信增值服务中有着广泛的应用。 1.1.2 语音合成信息服务被用户接受 语音合成技术把可视的文本信息转化为可听的声音信息,其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言,全球有十几亿人使用中文,其市场需

相关文档
最新文档