形式语言理论

形式语言理论
形式语言理论

形式语言理论

形式语言理论(formal language theory)用数学方法研究自然语言(如英语)和人工语言(如程序设计语言)的产生方式、一般性质和规则的理论。形式语言是模拟这些语言的一类数学语言,它采用数学符号,按照严格的语法规则构成。从广义上说,形式语言是符号取自某个字母表的字符串的集合。

如同自然语言具有语法规则一样,形式语言也是由形式文法生成的。一个形式文法是一个有穷变元集合,这些变元也称为非终结符或语法范畴。每个变元都可以用来定义语言,定义方式可以是递归的,即通过一些称为终结符的原始符号,加上变元自身,递归地加以定义。和变元有关的规则称为生成式,生成式决定了语言是如何构造出来的。一个典型的生成式表示:给定变元所代表的语言包含这样一些字符串,它们是通过连结运算,将另外某些变元语言中的字符串和若干终结符连结起来而得到的。

形式文法被严格地定义为四元组G=(V,T,P,S),其中V和T分别是变元和终结符的有穷集合,并且V和T分别是变元和终结符的有穷集合,并且V和T没有公共元素,即V∩T=?。S是一个特殊变元,称为开始符号。P是生成式的有穷集合,生成式的基本形式是:a→β,这里a和β,这里a和β都是(V∪T)*中的元素,即它们都是由变元和终结符组成的符号串,但要求a至少含有一个非终结符。在形式文法定义中,生成式集合P是至关重要的。在对使用符号的惯例作某些约定后,仅仅考查生成式,就能推断出一个文法的变元、终结符和开始符号,故可以通过列出生成式来定义一个形式文法。

形式文法G=(V,T,P,S)产生的形式语言记为L(G)。L(G)中的字符串ω都具有如下特点:①该字符串仅由终结符组成,即ω∈T*;②该字符串能由开始符号S派生出来,即从S出发,通过应用零个或多个P中的生成式,由S可以推导出ω。

根据P中生成式a→β的特点,可以将形式文法及其产生的形式语言分类,构成所谓的形式语言谱系。形式语言理论中重点研究四类文法和语言:①0型文法。又称为无限制文法。这种文法对生成式a→β不作特殊限制,a和β可以是任意的文法符号串,当然a不能是空字符串。0型文法是形式语言谱系中最大的文法类。由0型文法产生的形式语言恰是图灵机所识别的语言类,即递归可枚举语言。②1型文法。又称为上下文有关文法。这种文法要求生成式a→β满足|a|≤|β|,即β要至少和a 一样长。由1型文法产生的语言称为1型语言或上下文有关语言。1型语言恰是非确定型线性有界自动机所识别的语言类。③2型文法。又称为上下文无关文法。这种文法要求生成式a→β中的a必须是变元。由2型文法产生的语言称为2型语言或上下文无关语言。2型语言恰是由下推自动机所识别的语言类。④3型文法。又称为正则文法。这种文法分为两种类型:第一类要求生成式的形式必须是A→ωB或A→ω,其中A,B都是变元,ω是终结符串(可以是空串),这种特殊的正则文法称为右线性文法。第二类正则文法称为左线性文法,它要求生成式必须是A→Bω,或A→ω的形式。由正则文法生成的语言称为正则语言,它恰是有穷自动机所识别的语言类。

上述定义的4种语言类具有依次包含关系,即对于i=0,1,2,在不考虑空字符串时,i型语言都真包含i+1型语言。

语言的起源与进化

语言的起源与进化 10生物科学2班22号陈莹 摘要:语言是人类的密码,关于语言起源的研究由来已久。关于语言的起源,有多种说法,如神授说、拟声说等。达尔文的《物种起源》发表至今近一个多世纪以来,用进化论的思想研究语言的传统一直非常盛行。我们试图从多个角度来探讨语言的起源与进化,以期能对该问题进行更深入的探讨。 关键词:语言起源;进化;语音;劳动;思维 1.对语言的起源与进化的思考 在人类的认识史上,关于语言起源的问题一直都是一个不解之谜。关于语言起源的研究从来都没有停止对人类的困扰。不断有学者提出各种各样的假说,诸如手势、契约说、感叹说、本能说、摹声说、神授说、进化说、劳动说、嘴势说、约定俗成说、人类本源说等等。这些假说在不同层面体现了人们对语言起源的探讨,对人类语言这一种神奇特征的猜测和推断。 自达尔文的《物种起源》发表至今近一个多世纪以来,用进化论的思想研究语言的传统一直非常盛行。根据进化说的研究成果,人类的祖先在大约400万年前就已经开始直立行走。人类的喉部和声道的结构发生变化,空腔逐渐有可能发出越来越复杂的信号,最终产生语音。综合人类学、分子生物学和考学的证据,在10万年前到四万前之间,人类应该有了一些相当发达的原始语;从大约四万年前,这些原始语应该在词汇和语法上迅速丰富起来,开始向现代语言过渡。进化说虽说还不能够界定语言起源的具体时代,但是,这一假设说断言:语言的起源是一个相当漫长的过程,它是与人类进化相伴而行的,语言在大约一万年以前就已经成为现代语言的完整系统,换句话说,它与现代的语言已经没有什么本质上的区别了。2.劳动与进化的关系 劳动与语言作为区分人类与他动物的最重要的两个标志。近年来考古发现和人类学的研究表明,古猿开始向人转化,约在1400万年以前。从猿到人转变这一历史过程,是由生产活动从动物的形式到真正有意识的人的形式的过渡所推动的。因此,人体的结构及器官的形态功能的形式、社会组织的形式、意识和语言的产生,也能从劳动形式的发展过程中求得解释。劳动有其形成过程。这个过程从开始到人类脱离动物界为止,大体经历了三个阶段:最初是纯粹的本能活动;伴随有一定的智力的劳动萌芽状态的活动,这种活动伴随有一定的意识萌芽,是劳动直接前身;最后发展为在自觉目的的指导下的制作和实用工具的活动,这是人类的真正的劳动。劳动促使人脑具有了形成意识和形象思维,发音器官与语言起源关系密切的条件的产生和进化。 3.语音条件的必然进化 在语言起源的最初阶段,一开始猿人发出的是不分音节的呼叫或连缀的声音。在群居动物中,如果说动物的嘶鸣或猿猴的报警都能够代表一定的含义或传达要求的话,那么在初民的共同觅食或劳动进行的相互呼叫,就更要有协调行为要求的意义。初民的呼叫能反复地刺激已经抬起来的头脑,神经以及相应的发音器官。 从南方猿脑模外表形态看来,与语言有关的区域已有分化的扩展。这种扩展,反映在出名的部分音节的连缀呼叫中,可能出现了口形不同的几个的元音,这与工具的出现,生产劳动的发展带来的杂食的增多密切相关。咀嚼着形态、韧性、硬度各不相同的食物,锻炼了空腔及舌功能的增大,从而使呼叫的语言中分化出来,这是人属成员在漫长的生存实践中从事语言尝试的最大成果。这几个元音节,于是语言由萌芽阶段开始向前迈步了。 4.语言与思维 谈到语言的起源就不能回避语言与思维的关系及出现先后的问题,因为语言与思维是密不可

形式语言与自动机

形式语言与自动机的发展和在计算理论中的作用 2015060104020王桢 形式语言是语言学衍生过来的,开始形式语言并没有用于研究计算机编程语言,而只是研究自然语言的结构。在电子计算机出现以后,人们就马上想到用计算机来作自然语言的机械翻译。可是这项工作并没有所成果,对自然语言的结构 理解太片面化,翻译质量不理想也很难提高。1956年,乔姆斯基发表了用形 式语言方法研究自然语言的第一篇文章。他对语言进行定义:给定一组符号,称 为字母表,用∑表示。又用∑*表示∑中字母组成的所有符号串的集合。∑*的每个子集都是∑上的一个语言。乔姆斯基的语言定义方法为人们所公认,一直沿用下来,乔姆斯基根据文法将语言分成3大类。同时克林在研究神经细跑中,建立 了识别语言的系统有穷状态自动机。乔姆斯基发现自动机和文法分别从生成和识别去表达语言,并建立了形式文法和自动机之间的联系,证明语言的形式文法与自动机之间存在着如下的对应关系:①若某一语言能用图灵机来识别,则它就能 用O型文法生成,反之亦然;②若某一语言能用线性有界自动机来识别,则它 就能用上下文敏感文法生成,反之亦然;③若某一语言能用后进先出自动机来识别,则它就能用上下文自由文法生成,反之亦然;④若某一语言能用有限自动机来识别,则它就能用有限状态文法生成,反之亦然。这一成果将形式语言引入数 学,使得形式语言真正诞生。1960年,算法语言ALGOL60报告发表。1961年,又发表了ALGOL60修改报告。在这两个报告中,第一次使用一种称为BNF 范式的形式方法来描述程序设计语言ALGOL60的语法。不久,人们即发现BNF 范式极其类似于形式语言理论中的上下文无关文法,从而打开了形式语言广泛应用于程序设计语言的局面,并给形式语言理论本身的研究以极大的推动,使它发展成为理论计算机科学的一个重要分支。 形式语言理论是从语言学衍生而来,作为一种理解自然语言的句法规律。在发展过程中人们发现其在计算机语言中的作用,计算机语言在计算机科学中,形式语言通常作为定义编程语言和语法的基础。对编程语言编译,使之转换成机器语言,形式语言在这一工作中有很重要的作用。形式语言推动了计算机学科的发展,并成为计算机学科里重要的分支。 19世纪中,布尔用数学方法研究思维规律的问题建立了逻辑代数,即布尔代数。肖斯塔科夫和仙农,独立地应用布尔代数于继电器接点电路的分析和综合,

起源之语言

语言的起源 语言的起源是一个有高度争议性的话题,因为可得到的实证证据的欠缺,很多人认为严肃的学者不应涉足于此问题。1866年,巴黎语言学会甚至明令禁止讨论此问题,这个禁令对西方学界产生的影响一直延续到20世纪末。[1]现今,关于语言在何时何地如何起源的问题有着众多的假说,假说的数量几乎与此领域中学者的数量一样多。[2]对旁观者来说,与一百年前用达尔文演化学说对这个问题作粗糙解释的时代相比,如今此领域中似乎并没有达成更多的共识。[3]自1990年代起,越来越多的语言学家、神经科学家、考古学家、心理学家、人类学家等都开始尝试应用各种新方法来探究这个“科学界最难的问题”。[4] 语言起源理论能够根据它们前提假设的不同划分为连续性假说与非连续性假说两类。连续性假说的基本思想认为语言不可能突然之间就形成其最终的形式,它一定是由人类灵长类祖先的早期前语言系统演变而来。非连续性假说则持相反的意见,认为语言有着独一无二的特征,只能是在人类演化历程中的某一时间点上相对突然地出现的。不同理论间的另一区别是,有些认为语言是一种先天的水平,由遗传因素决定,另一些则认为语言具有文化性,是通过社交接触而习得的。[5] 现今唯一一位重要的非连续性假说支持者是诺姆·乔姆斯基。乔姆斯基如此回应达尔文主义的理论说:“在研究语言起源的很长历史中,人们一直想要知道它是如何从猿类的叫声中演变而来。不过对我来说这完全是浪费时间,因为语言是基于与任何动物沟通方式都截然不同的原则之上的”。[6]而当问到如何解释语言起源时,乔姆斯基的回答是我们无法知晓:“讲一个神话故事的话,很久以前某些灵长类动物在到处闲逛,突然间,或许是在奇异的宇宙射线的辐射后,产生了一些随机突变,它重组了灵长类大脑,并将一个语言器官植入其中”。他提醒说不应该仅仅按字面意思来理解他的故事,同时也坚持“和其他包括语言在内的与演化相关的神话故事相比,这可能更接近于事实”。[7]最近,乔姆斯基甚至更进一步地指出,产生于某个个体的一个随机突变,导致了语言在突然之间便以完美或近乎完美的形式出现。 [8][9] 绝大部分学者则更倾向于连续性假说,但对于演变的过程他们各自有着不同的看法。有一些把语言水平看作很大水准上是天生的,其中包括史迪芬·平克在内[10],他们避免去研究灵长类中明确的语言雏型,而是简单地认为“语言本能”[11]是通过通常的方式渐进演化而来。另外有一些学者认为语言并不是从灵长类的交流、而是从灵长类的认知水平中演化而来,所以也更为复杂。[12]而迈克尔·托马塞洛(Michael Tomasello)等学者则认为,语言是从灵长类的某些能够通过认知控制的沟通方式中发展而来,这些方式更多地是基于手势而非发声的。[13][14]还有些支持发声说的人把语言看作是发源于音乐的。[15] 同时还有学者超越了连续性与非连续性的二分法,他们认为语言的出现是某些社会转变的结果。[16]因为建立了前所未有的公众信任,使得人类将原先已潜藏的语言水平解放出来。[17][18][19]这些学者指出野生的黑猩猩与倭黑猩猩也有潜在但几乎从未使用的符号水平。[20] 演变

对比语言学的定义,起源和发展(精)

对比语言学的定义、起源与发展 对比语言学(Contrastive Linguistics的定义 1、语言学中的比较与对比 比较是人类认识事物、研究事物的一种基本方法,也是语言学研究的一种基本方法。如果说,语言学的根本任务是对语言的某种现象加以阐述的话,那么要对某一语言现象作出阐述,总是需要对这一现象的种种表现加以比较和分析(Harlmann1980:22。因而,按其本质来说,对比语言学也是一种比较,不过是一种具有特定含义的语言学中的比较。下面,先让我们来看看对比语言学的比较,与语言学中其他分支的比较有什么不同,从而使我们能够确定对比语言学在整个语言学中的位置,及其与其他语言学研究的联系。 在进行语言学比较时,根据比较对象的不同,可以沿两条轴线来进行。一方面,可以选择共时或历时的语言现象来进行比较;另一方面,可以选择在某一语言内部或各种语言之间的语言现象来进行比较。这两条轴线的互相交叉,便形成了如下四个象限,这四个象限将语言学研究分成四大类性质和目的不同的比较。 象限I代表了同一语言内部的共时比较。这类比较是对某一语言在其历史发展的某一阶段(特别是现时阶段的语音、语法和词汇等系统的内部构成成分及组织结构的比较。

在共时语言学研究中,要对某一语言的某一结构系统进行描述,就必须对这一结构系统里的各种语言现象加以比较分析。例如,如果我们要研究一种语言的语音系统,我们就要比较这个系统里的各个音素的发音部位和方法有什么不同,它们的声学物理属性有什么不同,在音节中的分布又有什么不同的规律,我们就必须比较这个语言中各类词的语法作用有什么不同,组合搭配有什么特点,等等。而且,要确定一个语言中的词可以区分为哪几个词类,这本身就要进行大量的形态、语义、语法特征等方面的比较。因此可以说,同一语言内的共时比较是语音学、语法学、词汇学等构成当代语言学主流的各个分支学科的一种主要研究方法。 象限Ⅱ代表了同一语言内部的历时比较。这类比较是对某一语言在其历史演变的不同阶段的语音、语法和词汇等系统加以比较,从而使我们了解这一语言的发展历史,找出其基本发展演变规律。例如,通过对英语的历时比较,语言学家一般认为,英语的演变经历了古英语、中古英语、早期现代英语和现代英语等四个阶段。其语法演变的总趋势表现为从一个综合型的语言逐步向一个分析型的语言发展,即词的屈折变化逐渐减少,语法意义的表达越来越多地依赖语序以及介词等语法作用词的运用。这类比较是对某一语言的语言史及其分科(如词源学、古今比较语法学等研究的主要方法。 象限Ⅲ代表了不同语言之间的历时比较。这类比较是对不同语言(一般是亲属语言在各个历史发展阶段的语音、语法和词汇等系统进行比较,其目的主要是探讨语言之间的历史联系,并据此对世界上的语言进行谱系分类,重建或构拟某一组亲属语的共同原始语(proto-language,找出它们之间的某些共同发展规律. 例如,语言学家通过对印欧语系诸语言之向的历时比较研究,使我们能够大致了解这些语言在历史演变过程中的关系,推断出原始印欧语的大致形式。不同语言之间的历时比较往往需要与同一语言的历时比较相结合,这就形成了现代语言学研究领域中最先发展起来的一个分支—历史语言学,又称比较语言学,或历史比较语言学。历史语言学发端于十八世纪末,到了十九世纪,逐步发展成为语言学研究中占主导地位的一个领域,并取得了丰硕的成果。

形式语言与自动机理论蒋宗礼第三章参考答案

第三章作业答案 1.已知DFA M1与M2如图3-18所示。 (敖雪峰 02282068) (1) 请分别给出它们在处理字符串1011001的过程中经过的状态序列。 (2) 请给出它们的形式描述。 S q q 1 图3-18 两个不同的DFA 解答:(1)M1在处理1011001的过程中经过的状态序列为q 0q 3q 1q 3q 2q 3q 1q 3; M2在处理1011001的过程中经过的状态序列为q 0q 2q 3q 1q 3q 2q 3q 1; (2)考虑到用形式语言表示,用自然语言似乎不是那么容易,所以用图上作业法把它们用正则表达式来描述: M1: [01+(00+1)(11+0)][11+(10+0)(11+0)]* M2: (01+1+000){(01)*+[(001+11)(01+1+000)]*} ******************************************************************************* 2.构造下列语言的DFA ( 陶文婧 02282085 ) (1){0,1}* ,1 (2){0 ,1}+ ,1 (3){x|x {0,1}+且x 中不含00的串} (设置一个陷阱状态,一旦发现有00的子串,就进入陷阱状态)

(4){ x|x∈{0,1}*且x中不含00的串} (可接受空字符串,所以初始状态也是接受状态) (5){x|x∈{0,1}+且x中含形如10110的子串} (6){x|x∈{0,1}+且x中不含形如10110的子串} (设置一个陷阱状态,一旦发现有00的子串,就进入陷阱状态) (7){x|x∈{0,1}+且当把x看成二进制时,x模5和3同余,要求当x为0时,|x|=1,且x≠0时,x的首字符为1 } 1.以0开头的串不被接受,故设置陷阱状态,当DFA在启动状态读入的符号为0,则进 入陷阱状态 2.设置7个状态:开始状态q s,q0:除以5余0的等价类,q1:除以5余1的等价类,q2:除以5 余2的等价类,q3:除以5余3的等价类,q4:除以5余4的等价类,接受状态q t

语言的起源问题是语言学理论中的一个老问题

语言的起源问题是语言学理论中的一个老问题。这里所说的语言的起源,既不是指小孩生下来后怎样学会说话,也不是指汉语、英语、法语等任何一种具体语言的形成,而是指整个人类怎样开始说话。这个问题太大了,也太难了。千百年来,不知有多少学者绞尽脑汁探索人类语言起源的奥秘。但因收效不大,所以有些人就想回避这个问题。比如一百多年前,巴黎语言学会在会章里就宣布:“本会……不接受任何关于语言起源……的报告。”倒是挺干脆的。 当然,区区一个章程,不会也不可能阻止人们对语言起源问题的探索。人们总在想:世上万事万物无不有个发生发展的过程,而且作为掌握语言的人类本身都是从猿猴变来的,那么语言也应该是从什么个玩意儿变来的。再说,作为语言科学的研究对象,如果人们对语言是“怎么来的”这个问题都是一笔糊涂账,那么语言学的其他许多重要问题,恐怕也难以交待清楚。正因为如此,所以语言起源的探讨和研究从未停止过。科学家们付出了辛勤的劳动,提出了一个又一个的学说。其中在语言学史上影响比较大的有以下几种。 有人提出“拟声说”,认为人类是用模仿事物声音的办法形成语言的。这些人注意到了人类语言的声音特性,这是可取的,而且许多语言的确都有数量多少不等的拟声词。比如汉语“猫”(māo)、“鸭”(yā)等,大概是通过模仿这两种动物的叫喊声来命名的。但是在任何一种语言中,拟声词都占极少数,那些不发声音的事物的名称又是从何而来的呢?

另外,有些词在甲语言里是拟声的,而在乙语言里却不一定拟声,这用拟声说就不好解释了。汉族人常说:“‘吱妞’一声,门开了。”这个“吱妞”应该算作拟声词了吧?可是几年前曾经有一个学汉语的外国留学生问我:“老师,我仔细地听开门关门的声音,怎么也听不出‘吱妞’(zīniū)的声音来,怎么回事?” 有人主张“感叹说”,认为人类最初的词都是表达感情的。这是因为他们看到了各民族的语言中都有感叹词的缘故,比如汉语中的“哎呀”、“哼”、“噢”等等都属这一类。但是,各种语言中那些占绝大多数的不表示感叹的词又是怎么产生的呢?这种理论注意到了语言与人类感情表达之间的关系,这是对的,但用这种理论来解释整个人类语言的起源,却是站不住脚的。 有人倡导“契约说”。比如人们感到需要给某个东西起名了,就在一块儿讨论一番,取得一致意见,这个叫“树”,那个叫“石头”等等,于是“树”和“石头”这类词就这样产生了。看来,主张“契约说”的人是从人类交际的需要来考虑语言的起源的,而且也认识到了语言的约定俗成性质,这在几百年前是可贵的。但这里也有个问题不好说清楚:人们最初约定时所用的词语又是从哪儿来的呢? 还有人主张“手势说”,也叫“身势说”。他们看到人在说话时常常用手来比划,甚至还带有身势动作,于是就猜想,大概语言是从手势发源的。不错,手势的确是一种重要的交际工具,甚至还是聋哑人主要

辩论的起源与发展

辩论的发展与起源 只要有人与人相处的地方,就有辩论;只要有辩论的地方就有雄辩。雄辩,作为人类语言沟通的一种特殊形式。它寓于人们的日常生活,也寓于人们本能的竞争潜意识之中;雄辩,作为辩论中一种独特的语言交流形式不同的特点。这些特点决定了雄辩在辩论中的特殊地位。 既然说语言是人类沟通的重要形式之一,那么,就可以说“辩”字无处不在,无时不有。而雄辩作为辩论领域中一个重要的组成部分,它在人们的语言沟通中所起的作用也就非常重要了。 俗话说:“胜者为王,败者为寇。”这正是人与人在相处之中无法躲避的竞争性、排他性和残酷性的反映。在战火纷飞的年代,胜与败的结果大抵是出于谋略加枪炮的对话;而在和平年代,枪与炮似乎不再为人们所崇仰。但这并不意味着人类因此就没有竞争了,人人都可以高枕无忧地去尽享天伦之乐了。 有赞成就会有反对;有建设就会有破坏;有深度就会有浮躁;有成功就会有失败。所有这些,都离不开一样东西——语言。 世界是由矛盾组成的。即使把世界分成无数个具象的分支,那么,这无数的分支也是由两种或两种以上矛盾体彼此间的互相联系、互相排斥和互相依存中的一种载体。不同的物质有不同的属性,不同的世界观和方法论导致不同的观点。这一切,都是产

生辩论的温床,也都是产生通过雄辩来宣扬某中立场观点的正确性的一种手段。 1. 西方之辩 其实,雄辩并不是近几年才发明出来的产物。仅就西方而言,早在古希腊时代,演说和辩论就破手社会重视,乃至连学校的教育也注重了多学生在演说能力方面和背诵名家警句方面的培养。这样,口若悬河者开始逐渐在社会上崭露头角。当时的雅典是比较开明的奴隶制城邦,政治上的民主、经济上的繁荣带来了思想领域的活跃。雅典学派林立,各种学说之间相互论辩极为盛行,因而,对有关“谈说之术”的研究也居于重要的地位。 公元前390年,苏格拉底在雅典创立了第一所修辞学校,对后世影响很大。 德国学者雅斯贝尔斯在其《苏格拉底、佛陀、孔子和耶酥》一书中曾经指出:苏格拉底的一生是“谈话的一生”。这位自诩为“雅典牛虻”的哲学家成天蓬头垢面,到处找人辩论,柏拉图的《理想国》就是记录苏格拉底辩论的一部分精彩的实录。 古罗马人先是传承了古希腊人的论辩风格,并将其推至各种领域,能言善辩、巧言令色者俯拾皆是,后经教育家们去粗取精,自成一体,使得演说论辩发展成为衡量人才的重要标准之一。不仅如此,古罗马还造就出一大批在语言修辞方面具有很高水平的雄辩家。西塞罗就是一个比较典型的例子。 演说和论辩造就了无数的辩士,辩士所及之处,也从先前的

“语言和语言研究”含义起源历史与发展

语言和语言研究 语言和文字曾经是人们崇拜的对象 语言是人类的创造,只有人类有真正的语言。许多动物也能够发出声音来表示自己的感情或者在群体中传递信息。但是这都只是一些固定的程式,不能随机变化。只有人类才会把无意义的语音按照各种方式组合起来,成为有意义的语素,再把为数众多的语素按照各种方式组合成话语,用无穷变化的形式来表示变化无穷的意义。 人类创造了语言之后又创造了文字。文字是语言的视觉形式。文字突破了口语所受空间和时间的限制,能够发挥更大的作用。 语言和文字是人类自己创造的,可是在语言文字的神奇作用面前,人们又把它当做神物崇拜起来。他们用语言来祝福,用语言来诅咒。他们选用吉利的字眼做自己的名字,做城市的名字,做器物和店铺的名字。他们甚至相信一个人的名字跟人身祸福相连,因而名字要避讳。皇帝的名字、长官的名字、祖宗和长辈的名字不能叫,一般人也都在“名”之外取一个“号”,彼此不称名而称号。在后世,认为这是礼貌;在远古,这是人身保护。现代各地口语里也常常有些词语起源于避讳;不久以前,很多行业有各自的避讳字眼。从前有些人家,因为小孩儿不懂得避讳,在堂屋里贴一张纸条“童言无忌”,意思是小孩儿说的话不算数。 文字的发明,古人更加认为是一件了不起的大事。《淮南子》里说:“昔者仓颉作书而天雨粟,鬼夜哭。”最能表示文字的神力的是符箓,这是跟口语里的咒语相当的东西。一般的文字也都沾上迷信的色彩,有字的纸不能乱扔,要放在有“敬惜字纸”标签的容器里,积聚起来烧掉。文字里边当然也有避讳,嘴里不能说的名字,纸上也不能写;必得要写就得借用同音字,或者缺一笔。 语言研究的开始和发展 语文学的兴起有了语言,人们用来抒情达意;有了文字,人们用来记言记事。 于是有了书册,世代相传,成为经典。为了方便后世的人读通这些经典,有人出来加以解释,这样就产生了语文学,这是语言学的早期形式。把语言文字从崇拜的对象改变为研究的对象(或研究兼崇拜的对象),这是一大进步。 为了读通古书而产生语文学,这是中国与西方──印度、希腊、罗马相同的,但是表现的形式不同。西方用的是拼音文字,中国用的是汉字。汉字自成一种体系,跟语言的配合关系比较复杂。这就使得中国的语文学和西方的语文学呈现不同的面貌。 中国语文学的重点是汉字的形、音、义之间的错综复杂的关系。语文学的著作大致有四种形式:①随经典本文加注字音字义,往往跟“串讲”相连。也有汇集成书的。如陆德明的《经

形式语言与自动机的关系

形式语言与自动机的关系研究 新疆师范大学数理信息学院数学03-6班摘要: 形式语言的直观意义,自动机的直观意义,形式语言的定义, 形式语言的特征,语法的分类,自动机的定义,自动机的分 类,各种自动机的定义,形式语言和自动的的关系,自动机 的对语言的例子 基本关键词: 形式语言的定义;自动机的定义;形式语言和自动机的关系 1,形式语言的直观意义 α→的直观地讲,形式语言是用来精确描述语言和它结构的手段。它一重写规则β α,均为字符串。重写规则就是在包含α的字符穿中遇见规则左边的形式来表示,其中,β α时,α部分重新写为右边的β。这样一个初设的字符串通过不断地运用重写规则,就可以到另一个字符串。通过选择不同的规则并且以各种不同的顺序来运用最这些规则,如果指 定一个初始符,某规则以其为左部,一组规则就可以构成一个语法。 2,形式语言的定义

形式语法是一个四元组G=(N, V , P, S ),其中N 是非终结符的有限集合,有时也称变量,它们相当于各种句法范畴。V 是终结符的有限集合,若语法生成的是自然语言,这些终端语符就相当于这种语言中具体的词,终端 语符集 这种语言的词库,P 是以重写规则的有限集合,基本形式P }{βα→,即""βα改写为,其中箭头表示指令,一条规则就是一个机械性的操作程序,用来演算它联系着的两侧语符集或语符序列之间的关系,而S 是一个特定的初始符; 3,语法的分类 乔姆斯在他的著名【文章】中根据重写规则将语法分成四类:正则语法,上下文有关语法,上下文无关语法;有这些语法生成的语言是正则语言,,上下文有关语言,上下文无关语言,递归数集合。 a 如果P 中的规则,满足如下的形式:x A Bx A →→或,,其中,A,B 是非终结符,x 是终结符,则G 称为正则语法(简称为FSG )。 b 如果P 中的规则,满足如下的形式:α→A ,其中,A 是非终结符, α是由N 和V 中字符所组成的字符串(或可表示为()*∈V N α,*意味着它右边的字符可以重复0到任何 多次),则G 称为上下文无关语法(简称为CFG )。 d 如果P 中的规则,满足如下的形式:αγββα→A ,其中,A 是非终结符,γβα,,,是字符串,且γ至少包含一个字符,则G 称为上下有无关语法(简称为CSG )。 d 如果P 中的规则,满足如下的形式:其中,α,β是字符串,则G 称为无限制重写系统。 对于以上任何一种语法,两个字符串之间一次派生关系?可定义为: 如果y x →是P 中的规则,βαβαy x ?。 字符串α,β有多次派生关系* ?则是说,通过多次应用一次派生关系,从α可派生出β,并记为α* ?β: n αβαα==,0,而对n i i n i +?-=αα,1,....0。 给定以语法,其语言定义为所有合法终结字符串的集合。合法终结字符串是指由初始符S 出发,运用重写规则而派生得终结字符串,即, (){}ααα**;?∈=S V G L 例子:假设G=(N, V , P, S), N={S, A} , V={0, 1}, P={0,0,1→→→A A A A S } 则 ,{}110)(≥=m G L m 是正则语法,在V={0, 1}上它所对应的正则表达式是100*。 形式语言的特征: ⑴ 高度抽象化(采用形式化的手段,专用符号,数学公式来描述语言的,结构关系,这种关系是抽象的)。

形式语言与自动机课后习题答案

形式语言与自动机课后作业答案 第二章 4.找出右线性文法,能构成长度为1至5个字符且以字母为首的字符串。 答:G={N,T,P,S} 其中N={S,A,B,C,D} T={x,y} 其中x∈{所有字母} y∈{所有的字符} P如下: S→x S→xA A→y A→yB B→y B→yC C→y C→yD D→y 6.构造上下文无关文法能够产生 L={ω/ω∈{a,b}*且ω中a的个数是b的两倍} 答:G={N,T,P,S} 其中N={S} T={a,b} P如下: S→aab S→aba S→baa S→aabS S→aaSb S→aSab S→Saab S→abaS S→abSa S→aSba S→Saba S→baaS S→baSa S→bSaa S→Sbaa 7.找出由下列各组生成式产生的语言(起始符为S) (1)S→SaS S→b (2)S→aSb S→c (3)S→a S→aE E→aS 答:(1)b(ab)n /n≥0}或者L={(ba)n b/n≥0} (2) L={a n cb n /n≥0} (3)L={a2n+1 /n≥0} 第三章 1.下列集合是否为正则集,若是正则集写出其正则式。 (1)含有偶数个a和奇数个b的{a,b}*上的字符串集合 (2)含有相同个数a和b的字符串集合 (3)不含子串aba的{a,b}*上的字符串集合 答:(1)是正则集,自动机如下 (2) 不是正则集,用泵浦引理可以证明,具体见17题(2)。

(3) 是正则集 先看L’为包含子串aba的{a,b}*上的字符串集合 显然这是正则集,可以写出表达式和画出自动机。(略) 则不包含子串aba的{a,b}*上的字符串集合L是L’的非。 根据正则集的性质,L也是正则集。 4.对下列文法的生成式,找出其正则式 (1)G=({S,A,B,C,D},{a,b,c,d},P,S),生成式P如下: S→aA S→B A→abS A→bB B→b B→cC C→D D→bB D→d (2)G=({S,A,B,C,D},{a,b,c,d},P,S),生成式P如下: S→aA S→B A→cC A→bB B→bB B→a C→D C→abB D→d 答:(1) 由生成式得: S=aA+B ① A=abS+bB ② B=b+cC ③ C=D ④ D=d+bB ⑤ ③④⑤式化简消去CD,得到B=b+c(d+bB) 即B=cbB+cd+b =>B=(cb)*(cd+b) ⑥ 将②⑥代入① S=aabS+ab(cb)*(cd+b)+(cb)*(cd+b) =>S=(aab)*(ab+ε)(cb)*(cd+b) (2) 由生成式得: S=aA+B ① A=bB+cC ② B=a+bB ③ C=D+abB ④ D=dB ⑤ 由③得 B=b*a ⑥ 将⑤⑥代入④ C=d+abb*a=d+ab+a ⑦ 将⑥⑦代入② A=b+a+c(d+b+a) ⑧ 将⑥⑧代入① S=a(b+a+c(d+ab+a))+b*a =ab+a+acd+acab+a+b*a 5.为下列正则集,构造右线性文法: (1){a,b}* (2)以abb结尾的由a和b组成的所有字符串的集合

语言的起源 语音和语义的关系

语言的起源 语音和语义的关系 作者崔长虹 语言的起源学说有很多种,如摩声、感叹、喊叫、手势等等,但是没有一种学说能够将语言的起源解释完美的,然而,这些学说又都有一定的道理。我认为语言是由摩声、感叹、喊叫、手势等等很多不同方式自然而然起源的,不同方式起源了不同类别的语言词汇,以摩声方式起源了摩声类词汇、以感叹方式起源了感叹类词汇等等,这些不同类别的词汇组成了我们现在的语言词汇。下面就语言起源的手势说再发表一点自己的看法。 一、语言和手势语言有什么联系? (一)我们人不论你是用语音语言交流,还是用手势语言交流,在交流的过程中经常会发生这样一种现象,那就是语音语言和手势语言共同使用的现象。 1、我们与语言相通的人在用语音语言交流的时候,经常会伴随着手势语言的使用。 例如:我让你过来,我会说:来来……,同时,手还会做出来来……的手势,这样的例子是数不胜数的。 2、我们与语言不通的人是如何来交流的呢?毫无疑问我们这时候自然而然地是用手势语言来交流,这是不需要学习和思考的,这是人的一种本能,在用手势语言交流的时候,尽管我们知道对方听不懂我们的语言,但是,我们在用手势语言交流的同时还是会说出和手势语言语义相同的话。 例如:我和你的语言是不通的,我不会你的语言,你也不会我的语言。我让你过去,我会自然而然地用手做出让你过去的手势,同时,尽管我知道你是听不懂我的话的,但是,我还

是会说:过去过去……,这样的例子同样也是数不胜数的。 3、在以上的例子中,语音语言和手势语言共同使用的现象,是因为我们已经掌握了语音语言,才发生的吗?不是的,聋哑人不掌握语音语言,但是,聋哑人在用手势语言交流的时候也会“说话”。俗话说“哑巴爱说话”,在我们的日常生活中经常听到聋哑人在“说话”,聋哑人所谓的“说话”,就是聋哑人在用手势语言交流的时候,其发音器官还发出一些我们听不懂的“语音”。 (二)人们在交流的时候为什么会发生语音语言和手势语言共同使用的现象? 我们从聋哑人的交流方式进行分析,聋哑人在用手势语言交流的时候,他的发音器官为什么会发出“语音”?我们知道聋哑人是听不到声音的,因此,他在用手势语言交流的时候,他的发音器官发出的“语音”,是他无意识的发出的(受过特殊教育的聋哑人除外)。 我们知道聋哑人和非聋哑人只是听力的不同、其它都相同。所以,我们非聋哑人在没有共同语音语言的情况下,在用手势语言交流的同时,我们的发音器官也会无意识的发出语音。这就是人们在交流的时候为什么会发生语音语言和手势语言共同使用的原因。 我们的语音语言和手势语言共同使用的这一交流方式自然而然的起源了语音语言。 二、语言的起源 (一)我们先来看这样一个例子 我与一位不会汉语的人在一起,我向他表达我要喝水的意思,我拿起水杯做了一个喝的动作,我同时还不由自主的说:喝。这一动作和这句话我共同使用了两次,然后,我倒水、喝水。过了一会儿,我再次向他表达我要喝的意思,我这次没有做喝的手势,我只是说:喝,对方这时候就给我倒了一杯水,

形式语言与自动机理论试题答案解析

形式语言与自动机理论试题答案解析 一、按要求完成下列填空 1. 给出集合{Φ,{Φ}}和集合{ε,0,00}的幂集 (2x4') (1) {Φ,{Φ},{{Φ}},{Φ,{Φ}}} (2) {Φ,{ε},{0},{00},{ε,0},{ε,00},{0,00},{ε,0,00}} 2. 设∑={0,1},请给出∑上的下列语言的文法 (2x5') (1)所有包含子串01011的串 S →X01011Y X →ε|0X|1X Y →ε|0Y|1Y (2)所有既没有一对连续的0,也没有一对连续的1的串 A →ε |A ’|A ” A’ →0|01|01A ’ A ” →1|10|10A ” 3. 构造识别下列语言的DFA 2x6' (1) {x|x ∈{0,1}+且x 以0开头以1结尾} (设置陷阱状态,当第一个字符为1时,进入陷阱状态) 1 S 1 1 0,10 (2) {x|x ∈{0,1} + 且x 的第十个字符为1} (设置一个陷阱状态,一旦发现x 的第十个字符为0,进入陷阱状态) 1S 0,1 0,10,10,10,110,0,10,10,10,1 0,1

二、判断(正确的写T ,错误的写F ) 5x2' 1.设1R 和2R 是集合{a,b,c,d,e}上的二元关系,则 3231321)(R R R R R R R ? ( T ) 任取(x.,y),其中x,y },,,,{e d c b a ∈,使得321)(),(R R R y x ∈。 )),(),((321R y z R R z x z ∈∧∈?? },,,,{e d c b a z ∈ )),(),(),((321R y z R z x R z x z ∈∧∈∧∈?? )),(),(()),(),((3231R y z R z x z R y z R z x z ∈∧∈?∧∈∧∈?? 3231),(),(R R y x R R y x ∈∧∈? 3231),(R R R R y x ∈? 2.对于任一非空集合A ,Φ?A 2 ( T ) 3.文法G :S A|AS A a|b|c|d|e|f|g 是RG ( F ) 4.3型语言 2型语言 1型语言 0型语言 ( F ) 5.s (rs+s )*r=rr *s (rr *s )* ( F ) 不成立,假设r,s 分别是表示语言R ,S 的正则表达式,例如当R={0},S={1}, L(s(rs+s)*r)是以1开头的字符串,而L(rr*s(rr*s)*)是以0开头的字符串.L(s(rs+s)*r) ≠ L(rr*s(rr*s)*) 所以s(rs+s)*r ≠ rr*s(rr*s)*,结论不成立 三、设文法G 的产生式集如下,试给出句子aaabbbccc 的至少两个不同的推导(12分)。 aSBC aBC S |→ ab aB → bB →bb CB →BC bC →bc cC →cc

语言的起源

The Summary of the Origins of Human Language 曾晓莉2016201133 Language, as an important medium for human beings to communicate,has almost the same long history as the origin of human. However, as to how languages come into being, different people have different stories. In the ancient Europe, almost everybody believe in God, they thanked the god for everything they enjoyed, including their language. According to the Bible, human language is endowed by God, who imparted the language to Adam, which was recorded in The Garden of Eden in Genesis. Later, as to why people speak different languages, another story, The Tower of Babel in The Old Testament, gives people the answer. This version still influences many scholars during the 17th and 18th century. In the middle of 18th century, a great many scholars started to explore the origins of language in Europe including the well-known linguists Condillac, Rousseau, Herder and so on. And in 1769, Berlin Royal Academy of Sciences set up awards for the best answer of the origins, which contributed to some achievements. Condillac and Rousseau agreed with the Social Convention, and held the idea that language use, as a rational choice, is influenced by society. However, Herder argued that the origin of human language lies in their nature, and this ability is inherent. However, in 1860s to 1910s, ban on papers on the origins was set up. The endless speculations, conjectures and theories kept unfounded. This prohibition remained influential across the western world until late in the 20th century. Later on, in 1922, the Danish linguist Otto Jespersen summarized the Invention Theory of the origins of human language, which includes the bow-wow hypothesis, the pooh-pooh hypothesis, the ding-dong hypothesis, the yo-he-h hypothesis and the la-la hypothesis. In 1960s, another great linguist Chomsky insisted on linguistic endowment, and held that men are created with the language acquisition device. In his words, language is inherent from the parents. However, this is self-paradoxical, because Chomskyan scholars were reluctant to solve how linguistic know is invoked for use, and why most of people cannot study well their second language. Nowadays, an increasing number of linguists, archaeologists, anthropologists and psychologists are trying new methods to solve these problems. To sum up, linguistics has no end. There is a lot to be found. And we are on the way.

语言的发展起源

龙源期刊网 https://www.360docs.net/doc/375577372.html, 语言的发展起源 作者: 来源:《双语学习》2014年第08期 语言的发展与起源关于语言的起源,现当代的欧美有两种对立的观点:一种是突发型模式,认为语言是现代人的独有特征,语言能力是随着脑子增大而在晚近迅速出现的一种能力;一种是连续型模式,认为语言随着人属的进化而开始,通过作用于各种认识能力的自然选择而逐步成熟。 从古至今,语言起源的学说大致有几类: 1神授说。神授说主要盛行时期为从远古至十七世纪。其主要依据来自于基督教《圣经》中。语言神授说产生于人类的蒙昧时期,带有浓重的宗教色彩和神话色彩,也具有鲜明的文化标识性。 2人创说。人创说主要盛行的时期是十七世纪到二十世纪初。十七世纪,现代科学已经有了初步发展,欧洲已经摆脱基督教会的愚昧统治,哲学理性主义兴起,人的地位得到提高。以往认为人是上帝创造的,此时变为了上帝是按人的模样创造的,由此语言也成了人的创造物。 3进化说。二十世纪初至今仍然被普遍认可。从二十世纪三十年代开始,随着现代科学技术的发展,自然科学领域内的科学家们开始对语言的起源问题有了兴趣。他们用比哲学家和语言学家所使用的更为科学的方法来研究语言的起源。有一批动物学家潜心研究人类近亲黑猩猩的语言能力,发现黑猩猩不仅可以用动作和面部表情进行简单的交际,而且可以利用各种各样的形式交流信息。人类语言由动物似的叫唤声进化而来,是依据现代科学提供的新资料作出的关于语言起源的新构想,而不完全是主观拟测。 语言起源必须具备三个条件:一是人类感受、认识客观事物能力的丰富和提高,具有了初步的联想、分类、概括能力;二是人类的喉头、口腔和声道必须能进化到能发出清晰的声音;三是人类社会发展到一定水平。语言一开始就是有声语言→口耳相传,语言一开始就是音义结合体→音义结合的符号,语言一开始就与人的抽象思维相连。 语言的发展离不开社会发展。原始语言应该是一致的,随着语言的发展,产生了不同的语言。这是由语言的社会性决定的:不能脱离社会同时发挥交际职能。 社会方言是社会内部不同职业、阶层等方面的人在语言使用上表现出来的变异。行业用语、术语、阶级方言都是常见的社会方言。地域方言:是全民语言在不同地域的分支(变体),是因地域的隔离引起的,差异比较大,主要表现在语音,词汇和语法也有表现。通常在共同语产生之前,一个社会大致经过这样的语言发展过程:方言--通用语--共同语。所有方言中某一种方言被确立为基础方言,在这一基础上,成为通用语,进而成为共同语。

杨小文-语言的起源

语言起源的解释 从大自然到动物,再到人类的语言继承 杨小文 提要索绪尔认为语音和语义的联系是随意性的,但反对观点一直存在。笔者统计对 比2499个常用现代汉字的口形特征,发现语音的口形倾向于模拟语义。另外,自然界、动物界和人类的信息交流一脉传承:光线、声音、气味等信息媒介是原型,动物的肢 体语言继承了原型;人类的口腔发音继承了肢体语言,进行口腔“拟声”和“拟象”。原 型不是口腔发音的唯一解释,口腔发音替代原型的解释方法,使语音与语音相互链接 成系统。语音和象形文字一样,都继承了事物的特征。 关键词统计口形特征原型继承模仿精度肢体语言象征弥补代表解释

一、前言 索绪尔之后,许多语言学者讨论过音素的象征性。语言学家叶斯泊森(Otto Jesperson)指出元音[i]有“小”、“弱”、“次”、“快”等意念。陈澧在《东塾读书记?小学》一文中说:“‘大’字之声大,‘小’字之声小,‘长’字之声长,‘短’字之声短。”朱晓农认为高元音倾向于表示“小”和“亲密”,而低元音则相反。①显然,随意性观点和音义联系的现象矛盾。朱文俊在《人类语言学论题研究》一书中转述了一些观点:“发音器官的肌肉只不过把这些姿态微缩化罢了,如‘卡’就是以舌根在喉部的收缩呈现物体的受阻状”。②对2499个常用汉字统计后发现,[见附录]汉字发音的口形倾向事物特征:这些汉字中,1067字含圆唇音,其中71字含明显“圆形”意义,占6.7%。另外1432字不含圆唇 音,其中20字含明显“圆形”意义,占常用非圆唇音字数的1.4%,见图表1 0200400600800100012001400 1600 非圆唇音含中含圆形意义的字占1.4% 圆唇音中含圆形意义的字占6.7%

相关文档
最新文档