印欧语系
印欧语系(Indo-European,简称IE),也称印度一日耳曼语系(Indo-Germanie),是世界上分布最广泛的语系,分布在欧洲、美洲、亚洲等地,使用人口占世界人口的41.8%。
印欧语系这一概念最早由英国人威廉·琼斯于十八世纪时提出,他认为印度和欧洲的大部分语言都是从共同“祖语”分化出来,彼此之间具有亲属关系和相似性。按照母语人口来排名,印欧语系是世界上第一大语系。
印欧语系下分为多个语族,包括日耳曼语族、罗曼语族、凯尔特语族、希腊语族、斯拉夫语族、波罗的语族、阿尔巴尼亚语族、亚美尼亚语族、印度伊朗语族等。其中,安纳托利亚语族和吐火罗语族现已消亡。比之更古老维尼提亚语(Venetic)、迈萨比语(Messapic)、弗利吉亚语(Phrygian)等语言,仅仅留存于书面残片。这些语言保留着较早的文献,如英语、德语、俄语、梵语等。语系特征为高度屈折,具有复杂的格、性、数系统。学术研究始于19世纪,重要成果包括对各语族间亲缘关系的系统展示和对原始印欧语的语音规律的重构工作。该语系的确切起源地、存在年代仍有争论。
历史
早在16世纪,当欧洲的传教士、商人、探险者开始学习梵语后,就逐渐认识到印度的梵语与欧洲的拉丁语、希腊语等语言之间有着广泛的相似性。
18世纪,英国的东方学学者W.琼斯爵士。针对亚欧各种不同的语言,首先提“原始印欧语”的存在,他提出了著名的“印欧语假说”来解释上述语言之间的相似性。他发现当时欧洲人已知最古老的语言其中四种拉丁语、希腊语、梵语和波斯语之间有相似之处。
1786年,琼斯在印度的一次演讲中指出,梵语跟希腊语和拉丁语以及古英语之间,无论是在动词词根还是在语法形式方面都显示出系统的相似点,而这种现象绝不可能是偶然的。任何语文学家都不能不承认这些语言衍生自同一原始母语。这种原始母语就是后来人们所说的原始印欧语(简称 PIE)。
19世纪初,德国的弗朗兹·保朴对此理论进行了系统的论证。
19世纪时,学者通常将这系语言称为“印度-日耳曼语系”,有时候也叫“雅利安语系”。但后来人们逐渐发现欧洲大多数语言与此都有关联,名称也转变为印欧语系。
语言特点
梵语和立陶宛语及拉脱维亚语的古口语方言之间有很强的相似性。这些语言共同的假想祖先称作原始印欧语。关于这个语言的起始地(Urheimat),今日的学者同意两种说法:一是黑海和里海北方的干草原(见库尔干州),二是小亚细亚半岛。支持库尔干假说的将这种语言的时间推算在公元前约4000年左右;支持安纳托利亚假说的将时间要再往前推好几千年(见印度-赫梯语)
印欧语系各语言原来都是屈折语,原始的印欧语的名词有3个性,3个数和8个格的变化(例如俄语这个特点保存得比较完好);广泛利用词缀和词干元音音变来表达语法意义;名词和大部分形容词有格、性和数的变化;动词有时态、语态和语体的变化,主语和动词在变化中互相呼应。另外,印欧语系各语言的词都有重音。
但是许多语言,例如英语形态已经简化,向分析语转化。
假说
颚音类
颚-咝音同言线是将印欧语系进行划分的主要标准之一,它根据原始印欧语中三组软颚音在后继语言中的转化,将印欧语系划分为颚音类语与咝音类语两类。
质疑
原始印欧语是一种假设的原始印欧人的口头语言,并没有任何文字记录。学者们只是通过对原始印欧语的若干后裔语言进行比较研究,来推断出它的某些特征。象吠陀梵语、采用迈锡尼线形文字B的希腊语、赫梯语等语言,到公元前第2千纪就已经明显分化了。通过比较这些已得到证实的分化形式,就能构拟出更为久远的形式。比较语法的研究,对证实“印欧语假说”和确立印欧语言之间的亲属关系起了重要作用。如表示“向前”的前缀或词,梵语为 pra,古教会斯拉夫语为 pro,希腊语为pro,拉丁语为pro,哥特语为fra;表示“父亲”的词,梵语为pitar,波斯语为pedar,希腊语为patēr,拉丁语为pater,哥特语为fadar。这些前缀或词显然分别来自原始印欧语的某两个词,通过分析比较,我们可知这两个词在原始印欧语中的首音应是p。p音在大多数后裔语言中保留下来了,只有在哥特语和其他几种日耳曼语言中才变成了f。又如表示“母牛”的词,在吐火罗语东部方言中为ko,梵语为,阿维斯陀语为,波斯语为gav,亚美尼亚语为kov,古斯拉夫语为gu-,拉脱维亚语为gos,希腊语为bo▇s,拉丁语为bōs,英语为cow。从这些形式可以构拟出原始印欧语名词gW-ous,并能证实上述语言间的亲属关系,从而使构拟的形式和关于早期共同来源的假设比较可信。但是,关于原始印欧语的分布、范围、文化类型和语言结构等问题,一直还没有令人信服的解释。主要原因一是无文字记录,二是缺少原始印欧社会的文化遗物。学者们根据印欧语的一些同源词曾对原始印欧人的故乡加以推测。从印欧语言有表示“三文鱼”和“山毛”等动植物的词,推测鲑鱼和山毛榉等生长的地方就是原始印欧人的故乡,原始印欧语就是从那里发展起来的。但另一些学者持异议,认为这种方法缺乏科学性,因为几千年前的自然生态环境,在许多方面都跟今天的情况大不一样。总之,各人考虑问题的角度不同,利用的材料不同,得出的结论显然各异。21世纪初还没有一种完全令人满意的解释。语言学家始终在重建的原始印欧语中寻找,那些仅在地球上某一特定区域生存的动物或植物的名称。三文鱼在重建的古印欧语中的说法,*lok*s曾经作为支持“雅利安人”的家乡在北欧的决定性证据而闻名。但是动物和树木的名字看来经常发生涵义的缩小或者扩大;它们甚至会在人们迁移到另一个地方后,被重新启用或循环使用,就像北美的英国殖民者用robin(红胸鸲)来命名北美的一种和英国的知更鸟不同的鸟。绝大多数语言学家同意,*lok*s的最精确意思应该是“像鲑鱼的鱼”。遍布欧亚大陆北部的河流里有许多这样的鱼,包括流入黑海和里海的河流。针对山毛榉树(山毛榉)重建的古印欧语词根有类似的历史。因为铜山毛榉(Fagus silvatica)不产于波兰东部,古印欧语词根*bhago-曾被用来支持北欧或西欧起源说。但在有些印欧语言中这同一个词根指的是其他树种(橡树或槭树),而且实际上普通山毛榉(Fagus orientalis)也在高加索地区生长,所以这个词根的最初涵义并不清楚。
推论
大多数学者至少认同,构拟出的古印欧语词汇中的动植物都属温带类型(桦树,水獭亚科,河狸,猞猁,熊,马),不属于地中海气候类型(没有柏树,橄榄,四季桂),也不属于赤道地区(没有猴子,大象,棕榈,纸莎草)。这里面,马和蜜蜂属的词根最有用处。
蜜蜂和蜂蜜是基于绝大多数印欧语言中同源词构拟出来的可信的重建词汇。蜂蜜的一个衍生词,*medhu-,也用来指代一种酒精饮料蜂蜜酒(蜂蜜酒),它很可能在古印欧人的宗教仪式中起着重要作用。蜜蜂不产于乌拉尔山脉以东,即西伯利亚地区,因为硬木树种(尤其是酸橙树和橡树)作为蜜蜂喜欢营巢的树种,在乌拉尔山以东很少见,甚至完全没有。如果西伯利亚没有蜜蜂和蜂蜜,古印欧语的故乡也不可能是那里。这就排除了整个西伯利亚以及东北亚的其他一些地区,包括哈萨克族的中亚草原。“马”的词根,*ek*wo-,也被很可信地构拟了出来,同样是有神奇的说服力的证明。虽然在公元前4500年至公元前2500年间,马生存在遍布史前欧洲、高加索和安纳托利亚(小亚细亚半岛)的许多个孤立的地区,但它们在中东,伊朗和南亚次大陆极其稀见,它们只在欧亚草原上数量众多并有重要价值。马的词根可以在激烈的争论中排除中东、伊朗、南亚次大陆,并将我们的目光锁定在欧亚草原上。于是只剩下了温带欧洲,包括乌拉尔山脉以西的草原,以及安纳托利亚和高加索山区的温带部分。
(此外,古汉语中“蜜”字构拟的发音是mjit,有人相信它与原始印欧语的*medhu之间存在某种同源关系。)
二分法
印欧诸语言传统上分作两大类:K类语言和S类语言。K类语言包括拉丁语、希腊语、意大利克诸语言、凯尔特诸语言、日耳曼诸语言,以及赫梯语和吐火罗语。S类语言包括波罗的诸语言、斯拉夫诸语言、阿尔巴尼亚语、亚美尼亚语、印度诸语言和伊朗诸语言。 K类语言得名于拉丁语中表示“一百”的词centum,其特点是保留了原始印欧语的 /K/音,如拉丁语centum(亦作kentum),希腊语he-katón,古爱尔兰语cēt,吐火罗语k?nt;S类语言得名于阿维斯陀语中表示“一百”的词satm,其特点是把原始印欧语中的软腭塞音*/K/变为齿龈清擦音 /┎/,如阿维斯陀语sat媅m,梵语▂atam,伊朗诸语言satem,立陶宛语┎zitas或┎imtas,古斯拉夫语sйto。长期以来 K类语言被看作构成西部语群,而S类语言构成东部语群。但是,随着20世纪初在中国新疆一带的洞窟中发现吐火罗语文献(见吐火罗语),以及释读用楔形文字书写的赫梯语文献,学者们看出,K类语言和S类语言的地理分布不再象早先想象的那样简单。属东部语群的吐火罗语并不属S类语言,而是一种K类语言,因为它保留了K音。学者们分析了赫梯人留下的铭文,发现赫梯语甚至还在原始印欧语分化为西部语群和东部语群之前,可能就已经有了分化。此外,语音方面的其他特点,如bh、dh和gh在凯尔特诸语言、以及斯拉夫和波罗的诸语言中简化为b、d和g等,都说明仅对印欧语言作K类语言和S类语言的二分是不够的,这两类语言只是基本相符于印欧语系西部语群和东部语群。只能作为印欧语进一步细分的基础。学者们曾经就赫梯语跟印欧语系其他语言的关系争论了好些年,甚至一度导致“印度-赫梯语系”的假说。
新发现
2013年5月,一个由英国和新西兰的科学家组成的研究小组宣称,他们已经发现欧亚语系存在的线索;他们的论文发表在新出版的美国《国家科学院院刊》(PNAS)上。
研究小组发现,至少1.5万年前,一种语言开始分裂。它分裂为7种不同的语言,并在之后的5000年里,又继续分裂成几千种语言。这些语言而后成为欧洲和亚洲数十亿人使用的语言。他们猜测,从英语、葡萄牙语到日语、乌尔都语,这些语言很可能“同根同源”。
研究人员先通过计算机模型找到一些可能因为历史上变化较少所以在该地区不同语言中仍有类似发音的词,然后在语言学家重建的原始语言词库中查找这些词,发现有很高的吻合率。他们还发现,在欧亚语系中,一些常用的代词、数词和副词上万年来基本没有变化。例如“我”、“我们”、“二”、“三”等是最古老的词,这些词的历史可以追溯到4万年前。
另外他们确定了23个“最长寿”的词,这些词的含义在过去1.5万年中几乎没有改变。其研究显示,每2000年到4000年,大约一半的词会被完全不同的词所代替;在欧亚语系中,至少有4个语族拥有5个同源词(指在不同语言里发音和意义相同的词)。
论文第一作者、伦敦皇家自然知识促进学会会员、雷丁大学进化生物学家马克·帕格尔教授说,这一发现为印证欧亚语系的存在提供了新的线索,有助于了解语言的构成机制和演化过程。新墨西哥大学语言学家威廉·克罗夫特教授评论道,这项研究提出了一种可能,研究人员可以将语言资料与考古学、人类学组合起来推测人类史前时代的事情,例如人类的迁移、人们之间的交流等。
当今欧亚大陆的语言是否真的同根同源?要准确地回答这一问题,还有待进一步科学论证,而论证所得出的结论必须经得起相关学科的检验。由于种种原因,语言同源问题一直困扰着学术界(尤其语言学界)。
语言同源与语言演化密切相关,而后者的解决难度也大。正如中国语言学家、数学家周海中教授所言,解决语言演化问题的难度不亚于破解物种演化之谜的难度;语言演化既是一种社会现象,又是一种自然现象,还是人类心智发展和历史文化演变的结果;由于语言演化有其内在的原因和外界的影响,从而增加了这一问题的复杂性。因此,截至2013年5月,欧亚语系之说仍是一种假设。
下分语族
印欧语系西部语群和东部语群可以进一步划分为如下语族。
日耳曼语族
约公元前 500年前,印欧语西部语群发生了一次重要的分化,产生了所谓原始日耳曼语(也称“条顿”语),分化的导因是某些辅音发生了系统变化,即所谓“日耳曼语音变”。从而使不送气清塞音p、t、k变为送气音,浊送气音bh、dh、gh变为浊塞音,浊塞音b、d、g 变为清塞音。这一现象是德国学者J.格林在比较某些印欧语词的基础上,于1822年首先发现的,因而称为“格林定律”。
这次分化直接促进了日耳曼语族的形成。日耳曼诸语言就是从这个新阶段发展起来的。日耳曼诸语言分西支、北支和东支:西支包括英语、德语(在德语基础上衍生了依地语和卢森堡语)、荷兰语、弗拉芒语(也有学者认为弗拉芒语只是荷兰语的一种方言)、南非的阿非利堪斯语(南非语)、以及弗里西亚语;北支包括斯堪的纳维亚半岛诸语言——瑞典语、丹麦语、挪威语和冰岛语;东支的代表是哥特语,但在一千多年前就已消灭,因此有些学者不把东支算作日耳曼语族的一个语支。
罗曼语族
罗曼语族又称意大利语族或拉丁语族。罗曼诸语言的共同母语是古拉丁语,它曾经是幅员广大的罗马帝国的通用语言。罗马帝国衰亡后,各地的拉丁语方言在彼此隔绝的状态下相继发展,最终形成了各种独立的近代罗曼语。
罗曼语族通常分东支和西支,这两支语言的传统分界是沿斯培西亚-里米尼线走向划出的同言线,它大体上把意大利分为大陆部分和半岛部分。该线以南的巴尔干罗曼语,如罗马尼亚语,以及19世纪末已消亡的克尔克岛上的达尔马提亚语属东支;该线以北的其他罗曼语属西支,包括拉丁语、意大利语、法语、西班牙语、葡萄牙语语,以及若干使用人数较少的语言或方言:普罗旺斯语、撒丁语(也有学者认为撒丁语只是意大利语的一种方言)、利托-罗曼诸方言、加泰隆语(又称卡泰隆语)。
凯尔特语族
凯尔特语族诸语言在不同时期曾分布于从安纳托利亚(又称阿纳多卢)到大西洋沿岸的广阔地带。后来,处于上升地位的拉丁语逐渐取代了某些凯尔特语言,使后者的使用范围大为缩小。
凯尔特诸语言习惯分为两大类:大陆凯尔特语和海岛凯尔特语。前者公元500年以前已消亡;后者指不列颠群岛凯尔特诸语言,以及通行于法国布列塔尼地区的布列塔尼语。迄今仅存的海岛凯尔特诸语言分为北支和南支。北支即盖德尔语支(又称苏格兰盖尔语支),包括爱尔兰语、苏格兰盖尔语、以及20世纪已消亡的马恩语;南支即不列颠语支(又称布列塔尼语支),包括威尔士语、布列塔尼语,以及已消亡的康沃尔语等。
波罗的语族
波罗的语族仅存立陶宛语和拉脱维亚语(又称莱蒂语)。波罗的诸语言,特别是拉脱维亚语的某些方言保留了较多的原始印欧语特点。鉴于波罗的语族和斯拉夫语族有许多相似的地方,有些学者主张把它们合二为一,构成一个更大的语族──波罗的-斯拉夫语族。
斯拉夫语族
斯拉夫语族的形成与古代斯拉夫人的迁移密切相关。5 ~10世纪,斯拉夫人从最初的居住地向各方迁移,最后到达巴尔干半岛的大部和整个东欧,形成3个斯拉夫人集团:东部、西部和南部斯拉夫人。他们的语言也逐步分为3个相应的分支:东支包括俄语、乌克兰语、白俄罗斯语;西支包括波兰语、捷克语、斯洛伐克语、卡舒比亚语和卢萨提亚语(又称文德语或索布语);南支包括塞尔维亚语-克罗地亚语、斯洛文尼亚语、马其顿语、保加利亚语,以及古教堂斯拉夫语,后者是信奉东正教和拜占庭天主教的斯拉夫民族的礼拜仪式语言,也是最古老的斯拉夫语言。
印度语族
印度语族中,使用人数超过1000万的语言至少有9种:印地语、乌尔都语、孟加拉语、旁遮普语、马拉地语、古吉拉特语、比哈尔语、奥里亚语和拉贾斯坦语。其中乌尔都语和印地语常被西方学者看作是一种语言,称为印地-乌尔都语,有时则统称为印度斯坦语。其他语言还包括僧伽罗语、吉普赛语等。印度语族的近代语言都是从古梵语衍生出来的,但已发生了相当多的变化,大异于梵语。历来有学者主张从印欧语系中再划分出一个独立的达尔迪语族,与印度语族并列,但另一些语言学家则认为应把达尔迪诸语划归印度语族。主要的达尔迪语言是吉普赛语。
伊朗语族
伊朗语族包括波斯语、普什图语、库尔德语、俾路支语、塔吉克语、奥塞梯语,以及若干使用人数很少,且已消亡的语言。21世纪初,有些学者主张在伊朗语族和印度语族中再划分出一个努里斯坦语支(又称卡菲里语支),构成跟印度语族和伊朗语族并列的第3个语族,它包括6种使用人数极少的语言,全分布于阿富汗斯坦,个别的也分布于巴基斯坦。
其他语族
希腊语、阿尔巴尼亚语和亚美尼亚语各构成印欧语系中单独的一个语族。此外,安纳托利亚语和吐火罗语代表了印欧语系两个已消亡的然而却占有一定地位的语族。其中,安纳托利亚语族在历史上分布于小亚细亚(今土耳其的阿纳多鲁地区)一带,主要包括阿纳多鲁西北部用楔形文字书写的赫梯语,以及阿纳多鲁西南部的卢维亚语。公元开始前,这些语言就消亡了。吐火罗语族包括两支方言:东部方言,中国学者习惯称作焉耆语,西方学者多称为吐火罗语A;西部方言,中国学者习惯称作龟兹语,西方学者多称为吐火罗语B。这两支方言消亡的时间不详,有的学者认为是在9世纪以后。
主要特点
在印欧诸语言的早期阶段,共同特征比较明显,但是随着时间的推移、语言间的差别逐渐增多,有的甚至出现了广泛的差别。尽管如此,有些结构特征还是当代印欧语所共有的。语音方面,所有印欧语言都有较多的塞音,并有清浊对立,如p、t、k和b、d、g,但擦音较少,元音系统较严密,但w、y 、r、l、m和n等响音,则既可起元音作用,也可起辅音作用;鼻元音不普遍;声调用来区别词义的情况极为罕见。在语言演变过程中,语音也发生了某些变化。如在印欧诸语言发展的远古时期,塞辅音的发音方法不下3种,而在现代印欧诸语言中减为两种,只在亚美尼亚语、库尔德语、奥塞梯语和某些现代印度语言里才仍然保留着3~4套塞音体系。另外,除前述日耳曼语音变外,希腊语中的唇化软腭辅音在不同情况下变为几个不同的塞音。在古希腊雅典城邦的希腊语中,Kw在a或o前变为p,在e或i前变为t,在u前变为k。语法方面,名词有性、数、格的变化,有自然性别;动词有人称、数、式、态的变化,有些语言还有体的变化。但是印欧语言总的发展方向是:屈折变化系统所起的作用逐渐由大到小,而词序和虚词在决定语法关系时所起的作用则越来越大。只有波罗的诸语言和斯拉夫诸语言等,仍保留了复杂的屈折变化系统。词汇方面,农业方面的许多常用词很相似,大多来源于某个早期共同形式。许多语言有结构相似的数词。
古印欧语的语法在所有印欧语系语言中都留下了或深或浅的印迹。在所有的印欧语言中,名词都有词尾变化;也就是说,名词的形式随着它在句子中的使用方式而改变。英语在从盎格鲁-撒克逊语开始演化的过程中丧失了绝大部分的名词词尾变化,但所有其他的印欧语言都还保存着这一特征,而且,英语中还存留了一些随语境变化的代词(阳性的he,his,him/阴性的she,hers,her)。甚至,绝大多数印欧语言中的名词词尾变化方式都很相似,都带有同源的词尾,还有整齐的语法格的体系(主格,属格,宾格,等等),并且都被同样的三种语性(阴性,阳性,中性)区分开;具有特殊词尾变化的名词也有相似的形式类和格变化。印欧语言中的动词也有相似的动词变化形式(第一人称,第二人称,第三人称,奇数,复数,过去式,21世纪初式,等等),相似的词干变化(run-ran,give-gave),以及相似的词尾。这一包含思维形式、结构、变形和词尾的独特集合,在人类语言中完全不是必要的,或者普遍存在的。作为一个系统,它是独特的,只在印欧语系的语言中出现。共有这一语法系统的各种语言当然是某一个语言的后代,从那里它们继承到了这一体系。
一个例子可以说明,如果说这些语言共有这些语法结构是由于偶然因素,将是多么的不可能。动词to be在奇数第一人称有一个形式(am),而在单数第三人称时有另一个形式([he/she/it] is)。它们是从古日耳曼语的动词形式im和ist继承来的。古日耳曼语中的这两个词有如下确定的、业已证明的同源词:古印地语中的asmi和asti;希腊语中eimi和esti;古宗教斯拉夫语中的jesmi和jestu。所有这些词都是从一对可构拟的古印欧语动词,*he'smi和*he'sti演化而来的。所有这些语言共用同样的动词类系统(第一人称,第二人称,第三人称),并用同样的基本词根和词缀来指代这些类别,——这证明它们是起源上相关的语言。
印欧语使用许多不同的文字。赫梯语用楔形文字和一种特殊的象形音节文字;古波斯语用楔形文字;梵语用天城体、婆罗米字母和其他字母;阿维斯陀语等使用几种特殊的文字;新波斯语用阿拉伯字母;欧洲的语言则使用自古代腓尼基字母派生的各种不同类型的字母,主要有拉丁字母、西里尔字母等。
印欧语最古老的直接文献是用赫梯语的楔形文字书写的,可上溯至公元前14世纪或更早的时期。用迈锡尼线形文字B书写的希腊语早期文献,出现的时间略晚于赫梯语楔形文字。而在20世纪初发现赫梯语和释读线形文字B之前,用梵文书写的吠陀经典之一 ──《梨俱吠陀》,通常认为就是印欧语系中最古老的文献。
研究内容
历史比较语言学
历史比较语言学是从对印欧语系的具体语言进行大量研究中产生的。W.琼斯首次提出印度的梵语跟欧洲的希腊语、拉丁语、哥特语等语言有亲属关系。其后,欧洲的语言学家把琼斯的经验性见解提高到科学的论证。丹麦的R.K.拉斯克对于《古诺尔斯语和冰岛语的起源》(1818)做了探索;德国学者F.博普的《论梵语动词变位系统与希腊语、拉丁语、波斯语和日耳曼语的比较》(1816)第一次把梵语、波斯、希腊、拉丁、德语诸语言同出一源的情况做了详细的考证。琼斯称为“相似点”的现象,到这时已发展为对应关系。德国语言学家J.格林在他的《德语语法》(1819~1837)中提出了印欧诸语的音变定律,这一定律又在1875年得到丹麦语言学家K.维尔纳的修正,使原来认为是例外的现象得到统一的解释。德国学者A.施莱歇尔是历史比较语言学的集大成者,他吸取格奥尔格·威廉·弗里德里希·黑格尔的历史哲学和查尔斯·达尔文的进化思想,写出了《印欧、梵语、希腊语、拉丁语比较语法概论》(1874~1877),他是提出语言谱系观的第一人。K.布鲁格曼和B.德尔布吕克合著的5卷本《印度-日耳曼诸语言比较语法概要》 (1886~1900)更是这门学科的巨著。上述学者,无不从语言的实地调查开始,特别对梵语、波斯语、立陶宛语等古老语言,用力尤勤,他们中间,懂十几种语言的不乏其人,甚至懂几十种的也有,师承前辈,而又做到后胜于前,他们的工作赢得了世界学术界的尊重,今天,语言学研究的重点虽然已经转移,但是历史语言学的研究并没有中断,格林兄弟在19世纪中叶发起编的《德语词典》(1852),经过几代学者的努力,终于在1960年全书出版,便是一例。
年代学
如果我们能够奇迹般地与一个生活在一千年以前的讲英语的人交谈,双方将无法沟通。很少有自然语言,即在家里学到并在家里使用的语言,能够在一千年以后保持足够的稳定,而仍被看作“同一个语言”。语言变化的速度怎样测量呢?语言一般有各种方言,即区域性的口音,而且在所有地区都有富于创新性的使用者(演艺者,士兵和商贩)以及保守性的使用者(最富的一部分人和最穷的一部分人)。你的语言可能会改变的很快或者很慢,这取决于你是谁。不稳定的状态——侵略,饥荒,旧势力集团的倒下和新势力的崛起——会加快语言演化的速度。语言的某些部分变化得较早较快,而有些部分保持相对稳定。对后者的观察使得语言学家Morris Swadish编写出一个标准词汇表,这些单词从最稳定的词汇中选出,在绝大多数语言中它们倾向于保留而不被取代,即使经历过侵略和征服后也是如此。他希望,通过分析很长时间里这个稳定单词表中单词被替换的平均速度,能够得到语言演化速度的可信的标准度量——他称之为“语言年代学”。
在1950年到1952年间,Swadish发表了一个包含100个单词和一个包含200单词的基本核心词表,这是一个标准化的稳定词汇列表。他提出,所有语言在某些特定方面都趋向于保留其自有的词汇,包括身体器官(blood,foot),基本数词(one,two,three),亲属关系(mother,father),基本生活需求(eat,睡觉),基本自然事物(sun,moon,rain,river),一些动植物(树,当地的动物),一些代词(this,that,he,she),以及连词(and,or,if)。这一列表中的内容能够并且已经改造得适用于其他语言——事实上,选用的英语两百基本词汇表包含215个单词。英语核心词汇对于变化因素体现出极强的稳定性。虽然英语总词汇中超过50%是从拉丁语言中借用来的,主要来源于法语(反映出讲法语的诺曼人对盎格鲁-撒克逊人的征服即英国历史上著名的“诺曼人征服”事件)和拉丁语(经历了数世纪的法庭、教堂、学校的专业训练),但是只有4%的英语核心词汇来源于拉丁语言。在核心词汇中,英语保持着日耳曼语言的本色,真实反映了其盎格鲁-撒克逊起源,他们在罗马帝国衰败后从北欧移民到不列颠群岛。
通过对比具有长期历史记录的语言中核心词汇的旧形式和新形式(古英语/现代英语,古埃及语/中世纪埃及语,古汉语/汉语普通话,晚期拉丁语/现代法语,以及其他的九对语言),Swadish计算出,对于100单词的核心词汇表,每1000年的变化率是14%,对于200单词的核心词汇表,每千年的变化率是19%。他指出,19%是一个可接受的所有语言的平均值(这个值常被四舍五入到20%)。为阐明这一变化率的意义,意大利语和法语在200词表中的相互独立的、无关的词汇数目占总数的23%,而西班牙语和葡萄牙语的这一数值为15%。作为一基本规则,如果两种方言中超过10%的核心词汇不同,它们要么互相无法通话,要么即将达到这一状态。亦即,它们是独立的语言或者即将分离为独立语言。于是,平均来说,由于每1000年里核心词汇14%到19%的变化率,我们可以想象,绝大多数语言(包括英语)在一千年以后对我们自己的后人来说都将是难以理解的。
非印欧语
大多数欧洲语言属于印欧语系,也有一些独立在外。
分类
乌拉尔语系:包括匈牙利语、爱沙尼亚语、芬兰语和萨米语(拉普语)。
高加索语系
巴斯克语:孤立。
埃特鲁里亚语:孤立,已消亡。
另外马耳他语也是今日欧洲的语言,但起源不在欧洲,马耳他语大部份继承自阿拉伯语,属闪含语系。
土耳其语:属于阿尔泰语系。
一般特征
这个动词有两个基本意义。在不太显著的语境中它是简单的系词(“I'm tired”;“That's a shame!”),这个功能在非印欧语言可能表达得非常不同。在更显著的语境中它表达存在(“I think therefore I am”);在它们之间的分界线不总是容易划出的。此外,很多印欧语言使用这个动词作为辅助来形成复合(迂回)时态(“I'm working”; “I was bitten”)。其他功能随语言而各异。例如,尽管在基本意义上“to be”是静态动词,英语在固定搭配中把它作为动态动词使用(“You are being very annoying”)。
系词在很多印欧语言中都是不规则动词。这部分的因为它比其他动词更经常使用,部分的因为原始印欧语提供了适合这个功能的多于一个动词,这导致了后代语言以不同的方式趋向于形成异干动词范例。本文描述从一系列词根发展出不规则形式的方式。
原始词根
词语
词义解释:
en:Appendix:Proto-Indo-European *h₁es-
词根 *h₁es- 当然是原始印欧语中的系词。找到了它的 e-等级(参见印欧元音变换)在后代语言的如下形式,英语is, 德语 ist, 拉丁语、法语 est,而它的零等级产生了以 /s/ 开始的形式,如德语 sind, 拉丁语 sumus, 吠陀梵语smas 等等。在PIE中,*h₁es- 是结尾于 -mi 的 athematic 动词,就是说,第一人称单数是 *h₁esmi;这种词尾变形幸存于英语 am, 梵语 asmi, 古教会斯拉夫语 есмь (jesm') 等中。
这个动词的21世纪初时直陈语气一般为原始印欧语重构为:
*bʰuH
词根 *bʰuH- (它在原始印欧语中没有元音变换变体) 可能意味着“to grow”,也可能意味着“to become”。这是英语不定式 be 和分词 been 的来源(日耳曼语分词带有后缀 -an),例子还有苏格兰盖尔语“将来”时 bithidh,和斯拉夫语不定式等,例如俄语 быть (byt’)。PIE 的 *b 变成了拉丁语的/f/,因此拉丁语将来分词 futūrus 和完成时 fuī;拉丁语 fiō“I become”也来自这个词根,还有希腊语动词 φύω,physics 和 physical 从它派生。这个动词的21世纪初时直陈语气可以重构如下:
wes
词根 *wes- 可能最初意味着“to live”。它的 e-等级现存为德语分词 gewesen,名词Das Wesen和其衍生形容词wesentlich,o-等级(*wos-)幸存为英语和古高地德语 was,而加长 e-等级(*wēs-)现存为英语 were。(带有 /r/ 的日耳曼语形式是 grammatischer Wechsel 的结果。) 参见第4类德语强动词。
h₁er
词根 *h₁er- 意味着“to move”。这可能是古诺尔斯语和后来的斯堪地纳维亚语言21世纪初时词干的来源: 古诺尔斯语 em, ert, er, erum, eruð, eru;其中的第二人称形式被借用到英语中成为 art 和 are。其他作者把这些形式联系于 *h₁es- 并假定了 grammatischer Wechsel (/s/→/r/),尽管在一定程度上在21世纪初时词干中这是难以解释的。
steh₂
词根 *(s)teh₂- 在英语中幸存为它的最初意义:“to stand”。从这个词根派生出了在爱尔兰语和苏格兰盖尔语中所谓的“存在动词”的21世纪初时词干,分别是 tá 和 tha。在凯尔特语中缺少了最初的 s-,参见印欧 s-移动。
在拉丁语中 stō, stare 保持意义“to stand”。直到通俗拉丁语在特定语境下把它用作系词。今天这幸存于一些罗曼语言中,用它作为其两个系词之一,并且还有用从 *steh2- 派生的过去分词去替代主系词的一个罗曼趋势。
结果的范例
赫梯语
赫梯语动词“to be”派生自印欧词根 *h1es-。
吠陀梵语
吠陀梵语动词as (to be)派生自印欧词根 *h1es-。
动词bhū (to be) 派生自印欧词根 *buH-。
波斯语
波斯语文法区分有有标记的或存在动词 هستنhastan 和无标记的前接系词 استast,hastan 用于表达存在性而ast 在21世纪初时中表达判断,尽管hastan 可以在21世纪初时中用来强调表达判断。在过去时中,动词 بودنbudan 覆盖二者含义。
严格的说,hastan 是一个理论上的不定式,而非词汇上的:budan 充当hast 的实际不定式,比如在21世纪初时情态构造如 شايد بودshāyad bud“it may be”中。budan 的21世纪初时词干是 باشbāsh-,用于祈使语气和虚拟语气,比如 e.g. چنين باشدchonin bāshad“may it be so!”。
动词hast (to be)派生自原始印欧语词根 *H1es-,而bud (to be)派生自原始印欧语词根 *buH-。
希腊语
古希腊语动词eimi (I am)派生自印欧词根 *h1es-。
波罗的语族
斯拉夫语族
罗曼语族
更多资料:罗曼系词
除了拉丁语,古老的意大利语言非常少有被证实的,但是我们有奥斯坎语set (they are),fiiet (they become),fufans (they have been) 和fust(he will be),和翁布里亚语sent (they are)。本节将解说拉丁语,和从它演化来的罗曼语言。
在西班牙语、加泰隆语、加里西亚葡萄牙语和在更小范围内的意大利语中,有两个平行范例,一方面是ser/èsser/essere 来自拉丁语esse“to be”,另一方面是estar/stare 来自拉丁语stare“to stand”。
为了简单,本表只列出21世纪初时的完整变位,和某些其他时态的第一人称单数形式。
在一些现代罗曼语言中,完成时同英语一样是用分词形成的复合时态,但是古拉丁语完成时幸存在在西班牙语和葡萄牙语中共用的过去时,并作为法语、意大利语和加泰罗尼亚语中书面“过去历史时”。
有用从stare(或更特殊化的它的动名词(supine),statum)派生出的过去分词替代从esse 派生出来的主系词的趋势。例如,法语分词été 来自statum。
日耳曼语族
主条目:日耳曼动词
古英语保持动词wesan 和bēon 遍及21世纪初时词干是分离的,尽管在我们找到的使用中对它们有一致区别的性质是不清楚的,如在西班牙语中那样。但是在过去时,这两个范例结合了起来。古英语对这个动词没有分词。
参考资料
科学家称发现欧亚语系存在线索.光明网.2015-05-18