伴随着多媒体数据的大规模运用,对基于内容的多媒体数据检索的研究已成为当前多媒体领域的热点之一,特别是基于内容的图像检索(content based image retrieval),已经进入实用阶段.CBIR主要是利用提取图像中的颜色、纹理或者形状特征,并将这些特征用于检索的一种信息检索手段.很多人在该领域中取得了出色的研究成果,但是由于图像检索的复杂性,特别是由于在图像底层特征和高层语义信息之间存在很大的差别,我们还不能利用已有的计算机视觉和人工智能的技术获得二者之间满意的映射关系,因此只能通过特征提取进行检索,在效果上往往不能满足用户需求.为了解决这个问题,最近人们试图运用相关反馈(relevance feedback)的技术来帮助CBIR,以获得更好的检索效果.
相关反馈在信息检索中是一种指导性学习的技术,用以提高系统的检索能力.在基于内容的图像检索中,相关反馈的过程是这样的:对于用户提供的样本图片,系统根据相似矩阵和样本图片及图像数据库中图片的图像特征,给出一个基于相似度的排序列表,数据库中图片和样本图片如果在特征空间中相似程度越高,则排序越靠前.然后,用户在该列表中选择一组符合该次检索内容的正反馈图片和一组不符合检索内容的负反馈图片,并提交给检索系统.系统根据用户的提交信息来优化相似矩阵并提交给用户新的检索结果.因此,在相关反馈中最重要的问题就是如何有效地利用用户提供的交互信息,并通过优化检索向量和相似矩阵来提高检索的准确度. 数据挖掘研究院
本文提出了一种基于贝叶斯分类的相关反馈的算法.对于每个检索样本图片,假定该图片和与之对应的所有正反馈图片构成了一个拥有共同语义含义的图像集合,则通过对于该图片集的高斯拟合构造出该检索样本图片在特征空间的贝叶斯分类器.该分类器参数反映了语义类在特征空间中的分布信息.同时,利用用户的正反馈信息不断地更新该分类器的参数,使检索效果不断得到提高,方便以后用户的检索.对于负反馈信息,通过对大量试验的观察,我们有理由假定负反馈样本之间是彼此独立的,这样,通过构造一个简单的混合高斯模型来拟合出负反馈样本在特征空间的分布,并利用一种类似于“挖洞”的过程将负反馈信息用于检索过程.通过对大图像库的检索实验,结果证明,我们的方法比其他算法可取得更好的效果.
本文第1节介绍一些研究背景.第2节介绍贝叶斯分类.第3、4节分别介绍正负反馈算法.第5节介绍试验结果.第6节是结论. 数据挖掘研究院

