数据挖掘与人工智能技术[1]

2011-03-02 21:48 编辑:admin 来源:发表论文 浏览:

                                             数据挖掘与人工智能技术

    摘要:数据挖掘是人工智能中的一个重要分支。对人工智能的发展及其最基本的技术:知识表示、知识推理、搜索,以及数据挖掘进行了详细介绍。通过实例给出了数据挖掘的定义,最后论述了数据挖掘与人工智能的联系,并结合国内外在该领域的研究成果指出了其广阔的发展前景。

    关键词:人工智能;数据处理前言当人工智能进展到一定程度时,对符号处理技术和神经网络处理技术相结合的要求越来越强烈,其中数据挖掘便是二者很好的结合。数据挖掘体现了人工智能技术的进展,其应用领域日益广泛。本文综述了人工智能和数据挖掘的产生、发展及其相互联系,以便引起更多研究者的关注。

  人工智能的发展人工智能(Artificial Intelligence,简记为AI)研究计算和知识之间的关系[1]。用机器去模拟人的智能,使机器具有类似于人的智能,其实质是研究如何构造智能机器或智能系统,以模拟、延伸、扩展人类的智能。人工智能是在计算机科学、控制论、信息论、神经心理学、哲学、语言学等多种学科研究的基础上发展起来的。人工智能是当前信息化社会的迫切要求。例如,人工智能技术在Internet和未来的信息高速公路上将发挥重要作用[2]。人工智能是1956年由McCarthy J等正式提出的。随后人工智能的研究取得了许多引人注目的成就[3]。例如,1956年Samuel L研制出了跳棋程序,6年之后击败了一个州的跳棋冠军; 1958年美籍华人王浩在IBM-704计算机上用3~5min证明了有关命题演算的全部定理;1959年Selfride O推出了一个模式识别程序;1965年Roberts编制出了可分辨积木构造的程序;Feigenbaum E A于1968 年研制成功了DENDRAL专家系统;1972年法国人Comerauer A提出并设计实现了逻辑程序设计语言 PROLOG;同一时期,斯坦福大学的Shortliffe E H开始研制用于诊断和治疗感染性疾病的专家系统 MYCIN;1977年Feigenbaum E A在第五届国际人工智能联合会议上提出了“知识工程”的概念,

    对以知识为基础的智能系统的研究与建造起到了重要作用;1991年第12届国际人工智能联合会议上日本展出了 PSI-3智能工作站和由4X4PSI-3构成的模型机系统;1997年,IBM公司制造的“深蓝”号计算机系统战胜了国际象棋大师卡斯帕罗夫等。人工智能早期的研究领域有:专家系统、机器学习、模式识别、自然语言理解、自动定理证明、自动程序设计、机器人学、博弈、人工神经网络等;目前已涉及到以下研究领域:数据挖掘、智能决策系统、知识工程、分布式人工智能[4]等。其中,数据挖掘的出现是人工智能发展史上具有重大意义的事件。这是因为20世纪80年代初,美国、欧洲和日本制定的一批针对人工智能的大型项目都面临了重重困难:一是所谓的交叉问题,即传统方法只能模拟人类深思熟虑的行为,而不包括人与环境的交互行为;二是所谓的扩展问题,即传统人工智能方法只适合于建造领域狭窄的专家系统,不能把这种方法简单地推广到规模更大、领域更宽的复杂系统中去。以上两个根本性问题使人工智能研究进入低谷。 6月河南科技大学学报(自然科学版) Journal of Henan University of Science and Technology (Natural Science) Vol.25 No.3 Jun. 2004使人们又重新看到人工智能的希望[5,6]。

   数据挖掘数据挖掘(Data Mining, DM)是指从大量的数据或信息中挖掘或抽取出知识的过程。这里包含数据的挖掘和智能信息的抽取过程,前者要从大量纷繁复杂的现实世界数据中挖掘出未知的、有价值的模式或规律,后者是对知识进行比较、选择,总结出原理和法则,形成所谓的智能[7,8]。目前,在很多重要的领域,尤其是在银行、电信、保险、交通、零售(如超级市场)等商业应用领域,数据挖掘能够帮助解决许多典型的商业问题,如数据库营销(Database Marketing)、客户群体划分(Customer Segmentation&Classification)、背景分析(Profile Analysis)、交叉销售(Cross-Selling)等市场行为,以及客户流失性分析(Churn Analysis)、客户信用评分(Credit Scoring)、欺诈发现(Fraud Detection)等等。数据挖掘技术在企业市场营销中的应用是以市场营销学的市场细分原理为基础,其基本假定是“消费者过去的行为是其今后消费倾向的最好说明”[8]。数据挖掘有两种分析处理形式,有监督学习和无监督学习,前者是在已知训练样本集合类别的基础上通过学习建立相应模型;后者是指训练样本类别与个数未知的学习。例如,表1为某超市顾客信息数据库的部分内容,包括顾客信用卡号、姓名、性别、年龄、收入、职业、联系方式、购买商品信息、消费记录等属性描述,利用这些数据可以给潜在顾客发送用于促销的新产品宣传手册,以及将要开始的商品打折信息。


    热门论文

    随机硕士毕业

    全站推荐研究生毕业论文

    热门毕业论文范文