您好,欢迎来到皮书数据库! | 皮书网首页
登录|注册 |无障碍阅读
国家知识资源服务中心 CARSI
图表库
图片名称: 现场社会互动情况
所属图书: 全球化与21世纪
出版时间: 2002年12月

北京地区现场即席话语语料库的取样与代表性问题

一 引言

现场即席话语指两人或两人以上在某一场合事先无准备的谈话。它不同于我们常说的“口语”,表现在口语包括的内容很广,表1列出的都可以说是口语。

表1 常说的“口语”形式

带星号的才属于本文定义的现场即席话语,其中日常生活中无准备的交谈最具有典型性。建构现场即席话语语料库是一个非常复杂的过程,涉及诸多方面。其中首要的就是本文要讨论的取样与代表性问题。这是因为现场即席话语是最古老也是日常生活中最频繁的语言活动,可以说是俯拾皆是,同时还是个开放集,是无法穷尽的。这就决定了取样与代表性问题是不可逾越的。具体说来,我们必须在着手建库之前对下述问题做出有理有据的回答:录谁的话语?录什么内容?录多少?由谁来录?

在介绍我们建构现场即席话语语料库时是如何处理上述这些问题之前,让我们先回顾一下前人是如何做的,其中有北京语言文化大学的“当代北京口语语料”,英国/瑞典的“伦敦—伦德语料库”,美国的“美国英语口语语料库”以及“英国国家语料库口语库”。

二 对前人研究的回顾

(一)当代北京口语语料

据《当代北京口语语料》(录音文本,1993),该语料为“北京口语调查”项目的主要成果。此项目的目的是“通过大规模的实际调查,记录在居住地区、性别、年龄、职业、文化程度和民族等方面具有不同属性的北京人日常生活中的自然话语,为北京方言与普通话以及其他方言的对比研究,为北京话的发展变化和社会语言学研究、为汉语信息处理研究等,提供一份丰富翔实