当前位置:首页 > 申请书大全 > wifi电视怎么看电视台 基于多Agent的智能网络答疑系统设计
 

wifi电视怎么看电视台 基于多Agent的智能网络答疑系统设计

发布时间:2019-01-30 03:59:05 影响了:

  网络答疑是多媒体网络教学系统不可缺少的功能之一。近年来,人们陆续研制和开发了一系列网络答疑系统,这些网络答疑系统已在教学过程中发挥较大作用,但其均不同程度地存在一些问题。(1)系统的自适应性能较差。如进行问题关键词匹配时,经常答非所问。(2)问题及答案的表现形式不够丰富,主要以文本为主,缺乏必要的图像、声音等多媒体支持能力。(3)数据管理功能薄弱,多采用e-mail、留言板或BBS等方式进行问题解答,难以充分利用高效的数据库管理技术,不便于数据的重复利用。(4)标准化程度不高,在设计时并未考虑标准化问题,导致重要资源无法共享等。
  本文以先进的智能代理(Agent)理论与技术为基础,提出一种新的智能网络答疑系统模型,讨论该答疑系统中问题库的自动形成机制,并介绍智能网络答疑系统所涉及的关键技术。
  
  多Agent技术简介
  
  基于多Agent技术的系统是指多个Agent相互通讯、彼此协调,共同完成作业任务的系统,它不仅具备一般分布式系统所具有的资源共享、易于扩张、可靠性强、灵活性强、实时性好的特点,而且各Agent能够通过相互协调解决大规模的复杂问题,使系统具有很强的鲁棒性、可靠性和自组织能力。在多Agent系统中,单个Agent是一个物理的或抽象的实体,能作用于自身和环境,操纵环境的部分表示,并与其他Agent通讯,具有感知、通讯、行动及控制和推理能力等基本功能。多Agent技术的这些特点,使得其在处理基于互联网的知识问题方面,具有广阔的应用前景。
  
  智能网络答疑系统的功能
  
  总体说来,智能网络答疑系统应具备四项功能。(1)学员用户能在学习过程中随时中止课件演示进程,运用自然语言进行提问,并可对提问方式进行选择(同步提问、异步提问等),也可选择系统自动回答的相关参数(如答案材料大小等)。(2)系统既能通过在常见问题库、知识点库及课件素材库中搜索答案并自动回答用户所提问题,又能通过e-mail、BBS或留言板等方式使学员用户的问题得以解答。(3)系统呈现在用户浏览器上的答案应包括两方面内容:一是多媒体形式(图文并茂)的问题解答;二是学员用户应巩固复习的知识点建议、少量练习题等。(4)系统能够自动生成和维护常见问题库(FAQ库),并保持其结构良好性,同时还应该支持专任教师用户的人工维护(增加、删除和修改等)。
  
  智能网络答疑系统的总体结构
  
  智能网络答疑系统的用户分三类。(1)请求解答疑问的学员用户,他们是系统的服务对象。(2)某课程的专任教师,他们负责构建课件库、知识点库,并提供对课件库、知识点库、FAQ库的不定期维护,同时负责回答系统无法自动回答的问题。(3)系统管理员,其负责整个答疑系统的安装、软硬件维护等,以维持整个网络答疑系统的良性运行。
  根据设计目标及用户分析,同时结合Agent技术,我们可以将智能网络答疑系统组织成如下图所示的总体结构。
  
  
  1.问题代理
  问题代理是整个网络答疑系统的核心部件,绝大多数问题都由它来回答,并由它自动生成FAQ库。其基本工作过程为:当学员用户点击“提问”按钮并选择“计算机自动答疑”选项后,系统将直接启动“问题代理”模块。该模块首先将用户输入的自然语言问题文本切分成“关键词”的逻辑组合,然后结合用户对答疑限制条件的选择结果形成复合的全文搜索条件,对FAQ库进行搜索。如果能发现大于规定阈值的答案材料,就按权值大小返回给用户,并对知识点库也进行全文搜索,将与问题文本关键词相匹配的知识点找出,给出用户应巩固复习的知识点建议。如果在FAQ库中没有找到合适的答案材料,则先对知识点库进行全文搜索,再根据知识点库中的线索和问题文本关键词的逻辑组合对课件库进行全文搜索。如果发现权值大于规定阈值的句子序列(两个句号之间的字串为一个句子),就按权值由大到小的次序返回给用户,并把它作为参考答案。同时发出用户对该回答满意程度的选择,若用户给出“比较满意”以上的选择,问题代理则将该问题题目及答案记入FAQ库(可供其他用户使用),并给用户指出应复习的知识点建议;否则,就将该问题发给专任教师。专任教师解答以后,以邮件形式发给提问用户,同时将该问题及其解答加入FAQ库。
  
  2.邮件(e-mail)代理
  邮件代理是一个具有相对独立结构和功能的部件。当学员用户选择了邮件答疑方式以后,系统将直接启用邮件代理。该代理同样首先让用户对答案材料的限制条件作选择,然后让用户填写所提问题;接下来,邮件代理先将用户所交的提问邮件进行处理,从中提取出问题文本后,交给问题代理进行处理,问题代理即按上述方法寻找答案或加入到FAQ库或转到专任教师邮箱(由教师答疑)。这里要求邮件代理与Web自动答疑无隙整合。而邮件代理的另一任务是将网络答疑系统无法回答的问题转发给专任教师,并把专任教师的回答返回给学员用户。
  
  3.讨论代理
  如果学员用户选择了讨论答疑,则系统立即启用讨论代理模块。该模块又划分为两个子模块:实时讨论代理和BBS讨论代理。(1)实时讨论代理。该代理实质上是一个有专门任务的聊天室,方便讨论和交流。如果学员用户对某个同学的回答比较满意,就点“问题已解决”按钮。这时,系统就要求将学员满意的答案用鼠标左键拖黑并复制后粘贴到另一个指定小窗口中。这样,既能让学员用户加深印象,又便于系统将该问题及答案加入FAQ库(如发现库已有相同或权值大于规定阈值的答案,就放弃加入)。(2)BBS讨论代理。该代理展示给用户的是一个留言板,当用户输入完问题文本并点击“确定”按钮后,学员用户的问题就贴在留言板上。浏览留言后,如对某个回答比较满意,就将该回答内容复制粘贴到另一指定小窗口中,系统会自动将该内容加入到FAQ库中。
  
  系统实施的关键技术
  
  1.Web浏览服务与e-mail服务的统一化
  要实现Web浏览,只需将智能网络答疑系统建立在Web服务器上,并将相关文件材料组织成HTML或XML(适用于IE 5.0以上浏览器)形式,同时利用FrontPage的自动转换技术将FAQ库中的答案材料转换成HTML形式。对于e-mail服务的支持,则需要在Web服务器端增加电子邮件处理代理,且邮件处理代理至少应具备三种基本功能。(1)可以接收远程邮件服务器上某个邮件账户的邮件。它包括两个方面:一是在服务器端定时执行,接收学员用户给系统专用邮件账户发送的提问邮件;二是用户可使用浏览器通过邮件代理来接收自己的邮件。(2)可以分析并提取邮件的组成部分,如收件人地址、发件人地址、主题、邮件正文和附件等。(3)可以发送电子邮件,可以指定收件人的邮件地址、抄送地址、主题、邮件正文、附件等。一般说来,上述功能可利用服务器扩充API(Internet Information Server的ISAPI、Netscape公司的Web服务器NSAPI等)及服务器端脚本语言(如ASP、JSP、VB Script、JavaScript和PHP3等)来实现。
  
  2.FAQ库、知识点库和课件库的自动分词
  考虑到FAQ库与知识点库是文本内容,而课件库多是HTML文档,故分词前往往需要先对课件库进行预处理,其基本过程为:将HTML文档中“BODY”的文本、“TITLE”的“标题文本”、“META”的“keywords”属性值中的“关键词”全部提取出来,并对“TITLE”和“keywords”中的文本作上特殊标记。根据网络教学系统的领域知识专业性较强的特点,本文采纳字符串匹配与频率统计相结合的方法来实现自动分词。总体说来,对FAQ库、知识点库和课件库的自动分词包括分词和加权两个基本步骤。
  ◆ 分词。为了识别一些本专业特有的新词,并将新词组成新词词库,进行分词操作之前,通常需要先根据标点符号、数字、英文字母等非汉语符号把全文切分成短串序列,然后再对全文字符短串各字串的出现频率进行统计。其统计思路为:(1)计算所有汉字短串的字串。(2)利用经验函数B=F×L计算出每个串的权值。其中,F为字串在全文中出现的次数,L为该字串所包含的汉字个数,B为该字串的权值。(3)把权值超过规定阈值的字串作为新词放入到新词词库中。
  对FAQ库、知识点库和课件库的分词过程可描述为:首先把知识点库中已指明的关键词和课件库抽取文本中的keywords属性值中的词语序列组建成关键词库,然后把全文基于关键词库、新词词库、常用词词典(优先级依次减小)进行正向最大匹配和逆向最小匹配分词,最后选择切分段数少的方案作为分词结果。如果切分段数相同,以最小逆向匹配分词方案作为分词结果。
  ◆ 加权。对于知识点库和课件库中的分词结果,关键词的作用是不相同的。这里用关键词相对于全文的渗透度来标示,并采用统计的方法计算某关键词相对于全文的渗透度。由Hash表得出每个词的同现频率(设为Fi),将知识点库中的知识点关键词的同现频率额外加上一个整数K1,将课件库的keywords属性值中出现词的同现频率额外加上一个整数K2,将课件库的TITLE标记中出现词的同现频率额外加上一个整数T;接下来将每个词的修正同现频率全部计算出来(设为Fi′),并将所有修正同现频率相加得到总和S,则关键词的渗透度Ri=Fi′/S;最后,把渗透度大于某个规定值的关键词存入到加权关键词库,这对问题文本的分词和问题答案的形成非常重要。
  
  
  3.全文搜索技术
  全文搜索是智能网络答疑系统的关键技术之一。要顺利实现全文搜索之目标,必须将原始文档所有基本元素的位置信息记录在索引库中。索引库一般有基于字表和基于词表两种形式。由于答疑内容基本上是针对某学科(或某专有领域),因此本文采取词表法来组织全文索引。全文索引库的主要部分是每个关键词的词表,索引库中的词表结构如下。
  
  其中,词语i就是被索引的、能够代表目标文档j的文本特征关键词。由于文本特征关键词可能不只在某一个文档中是关键词,故后面的文档选项则记录了对应目标的文档j的ID号。通过ID号,可以在相应文档库中查找文档j的属性信息。权值则是词语i在文档j中的权值(其计算方法在前面已叙述),位置序列则是词语i在文档j中出现的位置的数组(串号,字号)。
  利用词表法组织全文索引,检索策略十分简单。对输入的问题文本,以索引库中的词条集合作为首选词典,并配合新词词库、常用词词典使用正向最大匹配和逆向最小匹配算法来进行分词,保留分段数小的方案或保留逆向最小匹配分词方案(当分段数相同时),同时对每个目标文档进行关键词权值和计算。权值和超过系统指定阈值的文档(FAQ库的答案材料、知识点库中的知识点名称等)将被返回。文档返回的顺序按照权值和的大小降序排列。
  
  结束语
  
  本文给出了一个自适应性、实时性较强、表现形式丰富、操作简单的智能网络答疑系统设计方案,随着人工智能技术(尤其是自然语言理解技术)和远程教育技术的迅猛发展,这种智能网络答疑系统将会逐渐走向成熟和完善,并必将成为未来各种网络教学平台不可缺少的、具有相对独立性的组件。

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3