文章详细页面

互联网:语言学研究面临的挑战
在线阅读 收藏

仅仅数年的时间,新的信息和通讯技术的诞生彻底改变了我们信息检索的方法。最先出现量的变化:由于互联网和其他信息网络的广泛使用,网上在线文件数目不断增多,并以迅猛的速度在持续上升。同时也出现了质的变化:过去大多数文件来源于少数几个专业供应商,而如今任何人均可以按照自己的方式来生成各类文件,因此创造出了一个可以在全世界范围内传播的信息世界。

这就是为何经典的信息检索工具彻底过时的主要原因。过去采用的索引和主题词检索法依赖于专业供应商巨大的工作量。今天面对网上浩如烟海而又千差万别的文件,搜索引擎使用的原始统计法是今天我们可以应用的惟一途径。人们承认这些方法有不尽人意之处,因为检索结果中会出现大量的“干扰”和“空白”。同时人们也承认有这些原始的统计法总比没有好,没有它们人们也将无所适从。语言学和语言处理研究中面临的挑战就在于改进这些方法,从而获得更为理想的检索结果。这一改进的成功是确保新世界范围内的信息世界的切实可行。

幸运的是,与此同时,在自然语言处理方面出现了巨大的进展。多种语言版的电子字典和众多文集的出现以及新的语言处理方法的开发可以满足网上信息检索的特殊需求。本文的目的在于论述这些新的改进以及它们是如何用来解决一些信息检索问题的

帮助中心电脑版