本文研究了从网络获取到“三农”概念簇生成的整个过程。文中应用基于DOM的网页抽取的方法从网络版的《农业大词典》中抽取“三农”词条、释义;应用基于正则表达式抽取信息的方法抽取“三农”概念的口语名称;依据《农业大词典》中词条的释义部分的内容,提出了一个“三农”词表的构建结构和“三农”概念簇的概念,并通过利用KNN分类方法形成“三农”概念簇,为以后的“三农”知识研究提供了基础;通过实验的方法验证了本书人工选择特征的方式和利用布尔权重和KL变换作为特征权重的有效性。但是,“三农”概念簇的分类是一个平面结构,“三农”概念簇的树型结构分类还需要进一步研究。