图片检索技术论文

2017-06-05

图像检索是网络信息检索中的重要的组成部分,小编整理了图片检索技术论文,欢迎阅读!

图片检索技术论文篇一

Web图像检索技术综述

【摘 要】多媒体技术的迅速发展,促进了Web图像检索技术的创新和发展。针对目前的发展状况,本文对Web图像检索技术做了深入的分析和研究,包括基于文本检索、基于内容检索、语义检索以及个性化Web图像检索,并详细介绍了这4种流行图像检索技术的技术特点,最后指出了Web图像检索技术的发展趋势和研究方向。

【关键词】基于文本图像检索 基于内容的图像检索 基于语义检索 个性化Web图像检索

一、引言

目前,Web图像检索技术和模型层出不穷,可大致分为基于文本的检索、基于内容的检索、语义图像检索和个性化的Web图像检索四种。下面分别对其进行介绍。

二、基于文本的图像检索

20世纪70年代,基于文本的图像检索技术(TBIR)得以发展。目前,该技术发展较为成熟,但需要较多人工参与,耗费大量的人力和时间,而且不同的人对同一张图像的理解也不相同,这就导致对Web图像标注没有统一标准,因而检索的结果不能很好地符合用户的需求[1]。同时在互联网环境中,Web图像数据不断动态更新,采用人工方式对图像进行广泛标注也无法实现。

三、基于内容的图像检索

上世纪90年代,基于内容的图像检索(CBIR)技术产生。它主要采用图像的视觉特征来表示图像的内容,然后通过特征匹配算法进行图像检索。

(一)图像特征提取

图像的特征主要包括底层特征和语义特征。目前的CBIR系统主要使用图像底层特征来检索图像。底层特征主要包括图像的颜色、纹理、形状等定量特征。目前,颜色特征主要有颜色直方图、颜色矩和颜色相关图等。纹理特征有Gabor变换、塔式小波变换、灰度共生矩阵等。而形状特征表示主要有基于边界表示法和基于区域表示法。此外,近些年许多学者也研究了基于文本和视觉两种信息在内的Web图像检索,如文献[2]中提出一种融合文本关键词和图像视觉内容的Web图像检索方法,在一定程度上提高了Web图像检索质量。

(二)图像相似性匹配

图像检索的匹配策略大致分为完全匹配和相似性匹配。完全匹配是指两张图像的特征完全相同时图像匹配成功;而相似性匹配是指两张图像特征间的距离在某一阈值内匹配成功。在基于内容的图像检索中,图像底层视觉特征对比的相似性检索匹配占据着主导地位。

四、基于语义的图像检索

底层的视觉特征不能代表图像丰富的内涵,使得基于内容的图像检索效果并不理想。因此,出现了基于图像语义的检索技术,主要包括语义层次模型、语义的提取方法和语义表示方法三方面内容。

(一)语义层次模型

图像语义是有粒度的,即具有层次性,所以可采用多层结构对图像语义进行分析。

一般,根据图像内容可将图像分为特征语义、对象和空间关系语义、高层语义3个层次。特征语义利用图像的视觉特征及其组合进行检索。对象与空间关系语义,是分析图像中对象的视觉特征、空间关系、位置等信息,得到图像的语义描述。高层语义涉及到图像的场景语义、行为语义和情感语义,该层语义是根据人的知识理解而来,主观性较强,提取工作较复杂。

(二)语义提取方法

图像语义的提取是由底层特征向高层语义映射的过程,但现今的技术水平,直接根据底层的视觉特征推理出图像高层语义很困难,目前主要方法有基于知识语义提取、基于人工交互语义提取和外部信息的语义提取。

(三)语义表示方法

语义表示方法主要有文本表示法和基于人工智能知识表示法。文本表示法是用文本对图像或图像区域进行解释。基于人工智能的知识表示方法,如语义网络、数理逻辑等,该方法能够表达较为复杂的关系,具备较强的模糊匹配能力,但目前通用性的知识表示模型尚不存在。

五、个性化Web图像检索

随着多媒体技术的飞速发展,图像的数量急剧增加,为了得到更准确的符合个人需求的检索结果,个性化Web图像检索成为研究热点。个性化的实质是针对不同用户采用不同策略来提供不同的服务内容。个性化图像检索则是根据用户对检索结果的反馈主动学习和记录用户的兴趣信息,推测出用户的兴趣需求。用户兴趣模型(User Preference Profile)是个性化图像检索的核心,它用于存储和管理用户兴趣信息,通过收集用户的反馈信息,建立初始用户兴趣模型,经过长期地学习,不断更新用户兴趣模型,最终可以得到用户的兴趣倾向,针对不同用户提供个性化服务。

由于获取用户兴趣面临低层特征和高层语义之间的“语义鸿沟”问题,一些学者作了研究,如HE等人[3]提出了一种应用于个性化图像检索的用户兴趣模型的构建方法,以弥补语义鸿沟。QIU等 [4]提出基于用户多媒体数据管理模型的个性化图像检索,建立用户多媒体数据管理模型为用户提供个性化图像检索。文献[5]为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义。

六、总结和展望

图像检索从基于文本的检索发展到语义检索,经历了简单到复杂、低级到高级的过程。基于图像语义检索,充分利用了图像的语义信息,提高了图像检索的速度和质量,应用前景广泛,但仍存在如何改进语义提取方法以及语义描述方式等难题。目前,个性化Web图像检索成为主要研究热点,但如何更好地解决语义鸿沟,建立和改善用户兴趣模型成为一个值得深入研究的问题。

参考文献:

[1]鲁珂,赵继东,曾家智.一种适合Web图像检索的图像降维算法研究.计算机科学.2006,33(5):255~260

[2]黄鹏,陈纯,王灿,卜佳俊,陈伟,仇光.使用加权图像标注改进Web图像检索.浙江大学学报(工学版).2009,43(12):2129~2135

[3]贺琳,张菁,沈兰荪.个性化图像检索中用户兴趣模型的构建方法.计算机工程与应用.2009,45(31):168~171

[4]邱兆文,张田文.基于用户多媒体数据管理模型的个性化图像检索.电子学报.2008,36(9):1749~1749

[5]陈冬玲,王大龄,于戈,于芳.基于PLAS方法的用户兴趣聚类.东北大学学报(自然科学版).2008,29(1):53~56

点击下页还有更多>>>图片检索技术论文

更多相关阅读

最新发布的文章