当前位置:首页 > 工作计划 > 视频搜索 暗潮涌动:暗潮涌动
 

视频搜索 暗潮涌动:暗潮涌动

发布时间:2019-03-12 03:49:35 影响了:

  编者按:视频搜索技术针对音视频这类非结构化数据,使用了语音识别、自动抽帧和内容自动关联等技术,真正做到了从内容上对视频进行搜索。2006年互联网行业的新热点是各类垂直搜索,随着行业细分,视频搜索将激荡
  起搜索领域内的一轮新热潮。为此,本报特地编撰了一组文章,全面介绍视频搜索技术及其应用态势。
  
  “如果你错过了世界杯,那么你一定不能再错过视频搜索,它能帮你找到每一个精彩进球的视频帧。”
  登录到视频搜索网站,用户可以通过关键字定位到视频中的某句话或帧,实现对视频信息的内容检索。如果用户输入检索世界杯英格兰某场比赛的进球,系统可以准确地定位到该粒进球的视频片断,甚至是某一具体的关键帧。
  网站还提供世界杯内容的预览功能。搜索结果显示之后, FLV播放器会根据用户搜索条件进行预览播放,通常会提供给用户10~15秒的预览片断,用户可以选择是否完整播放该视频。用户如果想预览某条世界杯内容,只要点击“预览”功能按钮就能实现。通过预览,用户可以大致判断视频内容,确定有无进一步了解的必要,而无需花费更多时间打开视频原文件。在提高用户体验的同时,也提高了搜索效率,使用户能够直接准确地欣赏到自己喜欢的东西。FLV预览播放器还提供全屏播放功能,全屏窗口中可以提供给用户更多的选择,例如用户可以连续播放搜索结果; 每一个预览播放的同时,都会自动提示出用户关联视频,用户可以直接选择进行预览播放。
  这些不同寻常的功能,均来自于视频搜索独特而实用的音视频处理、索引技术和内容自动关联技术。它改变了以往搜索只能把音视频文件看成一个文件从而搜索文件名的做法,真正做到了对音视频文件的内容搜索。
  视频搜索技术针对音视频这类非结构化数据,使用了自动数字化、语音识别、自动抽帧、文本挖掘和内容自动关联等技术,真正做到了从内容上对视频进行搜索,搜索结果可以直接定位到视频中出现的某句话的时间点或关键帧,可以形象地称之为互联网视频的“遥控器”。
  
  视频搜索 呼之欲出
  
  搜索一直是互联网行业关注的焦点。焦点的出现源于网民对互联网服务层出不穷的新需求,这也是市场细分和产品细分的结果。正是该需求的推动,包括社区搜索、购物搜索、旅游搜索等各类垂直搜索就成了2006年互联网行业的新热点。传统的针对文字等结构化信息的搜索技术不断成熟,企业争夺的焦点则是行业细分,而对于音视频等非结构化信息的搜索随着互联网多媒体信息的繁荣和网民对于视频节目需求的增加也开始得到企业和用户的关注。
  视频搜索功能实现了对视频文件的全内容搜索,使用关键词、句子甚至自然语言,用户均可以迅速搜索到符合条件的电视新闻资讯片断、电视节目片断以及网络视频、网络播客、音频网站上相应的音视频内容,并能高速在线播放。内容自动关联技术为用户的每一次搜索提供了个性化的相关音视频内容的推荐。
  
  视频搜索类别
  
  不论是互联网巨头谷歌(Google)、雅虎(Yahoo)、微软,还是在本土市场占得一席之地的百度(Baidu)、iask,或者从专业角度切入的Qihoo、openv等,都已纷纷涉足视频搜索。
  早在2003年5月,Google的联合创始人 Sergey Brin 就与其他开发人员联合发表了一篇文章,讨论如何建立网页新闻与广播电视新闻的相关性。他们的目标是要开发一种技术,使用户在电脑上看电视的时候,可以根据链接去看相关文章,并提高彼此之间的相关性。这种做法已经被电视网或提供低像素视频的网站广泛采用。
  但问题是,如何计算出视频文件内容的相关性?他们的做法是: 通过邻近标题记录,分析在类似一段CNN标题新闻的视频中所说的话语内容的全部文本。因此没有录音,根本不可能确定相关性。
  与传统网页搜索不同,视频文件属于非结构化信息。目前市场上视频搜索技术中以文件名或标签进行搜索和通过视频内容进行搜索最为常见。
  
  1.通过文件名或标签进行搜索
  现在,大多数网络搜索在查找多媒体文件时是通过视频文件的名字或其他标签,如视频文件的标题、作者、摘要、关键词等,然后提供链接使其他网站链接到该文件。
  例如Google就是依赖文件名或视频的标签分析来提供其视频搜索服务的。
  
  2.通过视频内容进行搜索
  该技术是对视频内容进行分析处理之后转换成结构化信息进行标记,主要表现为通过对视频资料进行数字化处理,然后利用语音识别技术提取文件中有用的内容并加以标记,最终通过检索展现给用户,并能实现关键帧定位。
  传统搜索基本上采用文件名或标签搜索方式,也就是“非0即1”的方式,它基于严格定义和分类的布尔表达式,即“与、或、非”表达式。这样搜索的最大弊病就是,如果关键词不确定,或者有错误疏漏,用户往往得不到想要的搜索结果。
  采用内容搜索方法,可通过判别相关度来对数据进行检索和筛选,根据用户输入的词、句子或段落,引擎会对搜索条件进行分析,通过模式识别或概念匹配的方式,找出在内容上最接近的搜索结果提供给用户,用户可以按相关度排序来找到自己满意的结果,可以避免传统“关键词检索”造成的漏检情况的发生。这项技术通过综合考虑词语出现的频率及上下文,可以避免许多单纯依赖关键字检索出现的错误查询结果,同时又能够查到那些可能不包含具体关键字、但包含相关概念的文档。如果说传统的搜索方法为“search”(搜索)的话,那么通过概念来检索的方法则应该称为“discover”(发现),因为它可以让用户发现一些事前他们不知道的信息。
  搜索技术的差异性将直接决定搜索的准确性和人工处理的成本,用户体验也会有很大不同。
  
  商机凸现
  
  视频搜索可以形成新的广告收入模式。比如,在用户等待搜索结果出现的时间里,系统知道他正在搜索的词,然后就向他播放和这个词相关的广告,其针对性比电视里的铺天盖地的广告更强。对于电视台来说,视频搜索技术还利于对视频广告的投放效果进行跟踪,从而进一步衍生出各种形式的新广告业务。目前视频搜索领域至少涌现出三个新星TVEyes、BBN 和Autonomy (即 Blinkx)加入角逐,它们都可以提供全文语音搜索服务。这些公司大都从为政府完成语音识别搜索项目起家。美国国防部对能够在一大堆音频和视频资料中实现搜索有着浓厚的兴趣。事实上,几乎所有的语音识别软件,都来自于1970年代以来美国国防部高等研究计划局(DARPA)资助的研究项目。
  在TVEyes的Podscope.省略那样值得关注的节目指南,但越来越多竟争者已经加入进来,试图在视频领域内,瓜分份额可能更大的互联网广告收入。

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3