2010年3月 广西师范学院学报:自然科学版 Journal of Guangxi Teachers Education University(Natural Science Edition) Mar.2010 Vo1.27 No.i 第27卷第1期 文章编号:1002—8743(2010)01—0053—05 基于色彩统计信息的图像语义检索模型的研究 杨立志,李文敬,裴国庆,张增银 (广西师范学院计算机与信息工程学院,广西南宁530023) 摘要:探讨语义网图像搜索的一般模型及其算法,提出色彩统计信息的图像语义网检索模型和检索算法,利 用半监督学习方法来实现算法,并对算法进行分析.实验结果表明,在小样本情况下对色彩统计信息进行图像检 索,提高了检索的查准查全率. 关键词:语义网;色彩统计;半监督学习;图像检索 中图分类号:TP311.131 文献标识码:A 目前使用的万维网,实际上是一个存储、传输和共享文本、图象的媒介,计算机对文字、图象等信息 只起到存储、传输的作用,对其语义无法进行识别和理解.语义网(Semantic web)是现有Web的扩展, 它提供对数据的语义描述,使计算机能够“理解”Web信息,实现计算机之间的智能交互,使Web成为全 球化信息共享的智能服务平台.图像搜索在网络中的应用非常广泛,对语义网图像搜索的研究具有潜在 的应用价值.但是,目前基于内容和基于链接的web的图像搜索方法,其查全率和查准率都不高,为此, 我们提出的基于色彩统计信息的图像语义网检索模型和检索算法,并在小样本的图像语义进行搜索实 验,获得了较高的查全查准率. 语义网的图像搜索方法 Web的图像搜索方法可分为两大类,即基于内容的和基于链接的图像搜索方法. 基于内容的主要根据图像内容(如颜色、纹理等)为图像建立索引,而基于链接的web图像搜索引 擎则主要根据页面间的超链接来标注图像…. 1.1基于内容的web图像搜索方法 从20世纪90年代以来,基于内容的图像检索(CBIR)得到了广泛的研究,各大研究机构和公司也 都相继推出自己的系统,典型的图像检索系统有:QBIC系统、Photobook系统、VisualSEEK&Web SEEK系统、Netra系统、Mars系统、SIMPLicity系统等. 相关研究人员提出来的最主流的算法是基于图像内容的底层特征:有颜色、纹理、形状等算法. Swain首先提出了使用颜色直方图作为图像内容的索引特征 ],stricker等彩用了颜色值的另外3 个统计量,即其前三阶矩来表征图像的内容 ].Wan等使用八叉树将图像的像素依据颜色值在颜色空 间中进行层次聚类 . 但是以上算法还不能满足基于图像语义的智能检索需求,这也是计算机视觉、模式识别领域的一个 难点. 1.2基于链接的图像搜索算法 图像链接的外部资源主要有图像周围的文字、图像相关度、图像的替换文本(altermate text)、图像 收稿日期:2010—01—05 通讯作者:李文敬(1964一 ),男(壮族),广西邕宁人,教授,硕士生导师,主要研究并行计算与Petri网技术 ‘54‘ 广西师范学院学报:自然科学版 第27卷 的URL.相关研究人员提出来最有名的就是按关键字搜索算法,虽然可以进行大规模图像搜索,但是缺 点是主观性不准确,精度不准. 1.3问题的提出 由于基于链接需要大量的人工语义标注,费时费力,而且具有主观性和不精确性.基于内容的web 图像搜索引擎只是针对图片进行最低层特征的搜索,没有跨过“语义鸿沟”,使底层特征上升至高层语 义. 当前互联网的图像检索,具有代表性的是百度和google,但是他们主要还是以图像关健字进行检 索,而基于色彩统计信息的图像语义检索使用户查询不再是简单的关键词检索,而是具有图像语义的推 理和匹配,使检索能力更接近人的理解水平. 2基于色彩统计信息的图像语义网检索模型 2.1 色彩统计信息的图像搜索基础理论 色彩统计与其他特征相比,对图像本身的尺寸、方向和视角的依赖性较小,色彩信息提取也相对容 易. Leung and Malik及Schmid的研究工作展现了Filter banks对图像分类的优越表现,此后大量的研 究工作都开始利用基于Filter banks的特征抽取方式来进行l2 ;Manik Varma详细论述了针对图像纹理 的聚类与分类模型,并研究了不同的滤波器组对特征提取及纹理识别的结果的影响 ],而Gaussion滤 波器、LoG滤波器以及Gabor滤波器则是诸多实验中被认为最有效的滤波器组合. 颜色直方图特别适于描述那些难以进行自动分割的图像.对于给定的图像,[.z, ],它的颜色直方 图可以由下式给出:其中, ,Y分别为图像的宽度和高度. c m =羹薹 创建直方图部分cpp代码如下: 列 image=image a丌[j]; hsv=cvCreatelmage(cvGetSize(image),8,3); hue=cvCreatelmage(cvGetSize(image),8,1); mask=cvCreatelmage(cvGetSize(image),8,1); cvZero(mask); hist:cvCreateHist(1,&hdims,CV—HIST-ARRAY,&hranges,1) 代码运行结果如图1所示. 基于色彩统计信息的图像语义检索的思路是: 利用小样本集训练,引导计算机模仿人类的视觉 感知系统,进行语义理解,从而减少计算机的盲目性, 更加准确地对图像进行分类识别. 2.2 色彩统计信息的图像语义网检索模型 根据色彩统计信息的图像搜索理论及其思路,提 出了如图2的层次化图像语义网检索模型. 首先进行特征语义识别,提出特定的颜色,再次进行对 象语义判断,例如一张图像中的马、天空、草等,最后进行匹配语义,进行手动标注语义信息 图1 颜色直方图显示 第1期 杨立志,等:基于色彩统计信息的图像语义检索模型的研究 ・55・ 2.3 图像语义网检索模型实现 实现方法:主动学习选择最具代表性的样本进行标注和半监督学习 2.3.1半监督学习的实现方法 对某些语义概念,训练集数量较少,可以考虑采用半监督学习方法,使分类器 在训练集较少的情况下仍能取得较理想的效果. 语义图像标注算法,标记语言是用来形式化地描述Web文档中所使用术语 的意义的标记语言,它的目的是要提供一个关于文档的语义形式和语义内容的互 操作标准,比如DAML,OIL,SHOE和OWL. 语义图像标注的目的就是给定一个图像 ,从语义词汇表L中抽取关键字集 训来最好地描述图像J.学习的过程是在训练集;={={(,。,叫。),…,(ID,wD)}这 样的图像一关键字对上进行的l4 J. 2.3.2支持向量机训练算法 图2层次化图像语义 支持向量机(Support Vector Machine,简称S、 )[5 是应用统计学习理论开 网检索模型 发的新型通用学习方法,它应用最大间隔算法来近似实现对于结构风险最小化原 理的几何解释,使得统计学习理论有了可以直接付诸实际应用的直观算法. SVM是从对于线性两分类问题的最优分类面研究发展而来的学习机器.给定n个独立、同分布、线 性可分的训练样本:( ,Y1),(z:,Y2),…,( ,Y ),置∈Rd(d为输入空间维数),Y ∈{-l,+1}(指 示两类样本),SVM的训练目标就是找到一个最优超平面:W・z+b=0,将两类样本完全分开. 它根据有限的样本信息在模型的复杂性(即对训练样本的学习精度和学习能力之间寻求最佳折衷, 以获得最好的推广能力,它具有理论完备、适应性强、全局优化、训练时间短和泛化性能好等特点,因此 有广泛应用. 对分类流程简要描述 训练:训练集——叫寺征选取——+训练——+分类器 . 分类:新样本——+特征选取——+分类—— 判决 2.3.3相关反馈技术 采用相关反馈CO—training,设计了一个自动反馈策略模拟检索过程.对于每一个提交的查询,检索 图像元数据库并对其进行排序.从图像元数据库中选择10张图片给用户进行标注,然后用户标注的的 信息又反馈给系统进行重新排序.注意,已经选择过的图像不会在后面的选择中出现.对于每个查询,自 动相关性反馈机制执行5次. 相关度反馈技术对于图像检索是至关重要的,使用者提供的反馈越多,算法的检索性能越高 ]. 本文结合语义图像标注算法,svnl及相关反馈等技术,提出一种改进的图像小样本匹配算法一ps (picture search),称为色彩统计信息图像语义检索算法. ps算法的大致流程为: (1)提取出原始图像中有意义的部分,这将有助于提高语义信息提取的准确度及速度,提取时采取 一般的色彩直方图分割法. (2)进行区域内颜色对象的分割和语义识别,即首先利用分块色彩图像来提取颜色各组成部分, 同时进行识别. 这个算法对于提高查准查全率都有了一定的提升,解决了自动识别问题. 具体的步骤: (1)提取待检索图像X的颜色图像特征,利用ps算法,提取其语义分类特征描述,将其对应于每个 语义层级P£( ,m)提取出的语义分类特征集合记为 Q ={(Cl, 1),…,(C ,Wf),…,} (2)将通过滤波器组的滤波响应用K—Means聚类算法做聚类,从而降低特征向量的维数,并构造 一个初始的字典. ・56・ 广西师范学院学报:自然科学版 第27卷 (3)利用标注过的图像来训练出供参考的对象模型.Training(image—alT,mask—arr,1),训练一对 样本. (4)识别HSV(hue,saturation,value)表示色相、饱和度和亮度. (5)算法结束. 算法流程图如图3所示. 此算法将识别图片中的主体作为最主要的搜索因素,比 原有的单一算法,更加符合人的理解水平.比如当用户搜索 沙滩时,将检索图片库中最类似于沙滩档案照片的图片,而 不是文件名叫沙难的图片.以查找描述语为“在海边的穿蓝 提取图像颜色特征 衣服的男人”这张图为例,描述这张图的信息可根据具有标 识意义的关键词(如海边、蓝色、衣服、男人等)作为提取元数 据的依据. 用PS算法提取语义分类特征 3实验与分析 得到语义分类特征合集Qt 利用VC+-t-6.0在Picasa上采集了20多张以自然景 色为内容的图片,并手工标注其中的对象标签,以不同的颜 用K.Means聚类算法构造宁典 色表示不同的对象,进行语义识别,其中的色彩及对象的对 应关系是: 训练山供参考的对象模型 { 深绿色表示树木, 深蓝色表示天空, 只,别HSV 浅蓝色表示海水, 浅绿色表示草地, 结束 淡黄色表示沙漠, 暗灰色表示路面, 图3 色彩统计信息图像语义检索算法流程图 枣褐色表示马匹, 黑色表示无关区域. }. 基于标注的图片和原始图片对训练出一系列以直方图表示的model,并保存为1.bSⅥⅥ可用的文 件,提供一个基于OpenCV的简单的交互界面,通过鼠标选定某一块区域,使用SVM分类器,来对该区 域进行理解识别. 部分实验用代码如下: cvScalar(15,115,15,0),evScalar(25,125,25,0),//tree cvScalar(215,115,45,0),cvScalar(225,125,55,0),//sky cvScalar(235,195,155,0),cvScalar(245,205,165,0),/sea cvScalar(115,215,245,0),cvScalar(125,225,255,0),//sand cvScalar(65,235,145,0),cvScalar(75,245,155,0),//grass cvScalar(115,115,115,0),evScalar(125,125,125,0),/road cvScalar(25,65,155,0),cvScalar(35,75,165,0)/horse 代码运行结果如下图4所示. 系统可以做到较高的识别率,通过将图像划分为很多子窗口,并遍历图像的的子窗口可以做到对图 像内容的自动识别而不需要人工干预. 最后进行基于单一颜色特征与基于色彩统计信息图像语义特征进行检索比较. 在进行图像桧索性能评价时,选取检索查准率与检索查全率曲线为评价指标,如图5所示. 第1期 杨立志,等:基于色彩统计信息的图像语义检索模型的研究 ・57・ 0 i 0 2 0.3 0.4 0 5 0.6 0.T 0 8 0.9 1 查全率 图4自动识别HSV例图 图5查全率一查准率图 4结语 基于色彩统计信息的图像语义检索对于图像检索准确性有了更进一步的提高,杏一准率 但是对图像进行有效 的语义描述等还有待进一步的研究解决,影响这个研究结果的重要因素是有没有海量的,语义标记的图像 ∞0 ∞0 卜0 o m 0 0 库,关键内容是如何进行自动的图像语义标记,比如针对这个图像自动分析其颜色、纹理甚至内容识别等 特征等,要实现全自动的语义标注还是很困难的.尽管有很多的标注工具,类似K[M这样的.现在还是需 要大量手工标注的数据,而且难点在于机器学习的研究没有进展,尤其在半监督学习领域,在只有少量的 标注样例的情况下的全自动标注,如何对图像进行有效的语义描述将会成为今后研究的重点和方向. 参考文献: [1]黄素珍,陈宁江,苏德富.并发多元搜索引擎的研究与应用[J].广西大学学报:自然科学版,2005,30(2):164—168. [2]赵继东,鲁珂,吴跃.一种基于谱图理论的Web图像搜索方法[J].计算机应用研究,2008(5):12—13. [3]周明全,耿国华,韦娜.基于内容图像检索技术[M].北京:清华大学出版社,2007:35—36. 【4 J MANIK VARMA,ANDREW ZISSERMAN.A Statistical Approach to Texture Classication from Single Images[J].IJCV (62),2005(1-2):61—81. [5]朱文球,刘强.一种新的图像语义自动标注与检索算法[J].计算机应用研究,2007,24(7):318—319. [6]黄发良,钟智.用于分类的支持向量机[J].广西师范学院学报:自然科学版,2004,21(3):75—76. [7]VAPNIK VLADIMIR N.The Nature of Statistical Learning Theory[M].Berlin:Springer,1995:1564—1564. [8]X HE,W MIN,D CAI,K ZHOU.Laplacian Optimal Design for Image Retrieval[J].SIGIR’07,2007:119—126. Research on Image Semantic Search Model Based on Color Statistical Information YANG Li—zhi,LI Wen-j ing,PEI Guo-qing,ZHANG Zeng—yin (College of Computer and Information Engineering,Guangxi Teachers Education University,Nanning 530023,China) Abstract:This article describes the Semantic Web image search of the general model and its algo rithm,color images of the Semantic Web statistica1 information retrieval models and retrieval algorithms, using semi—supervised learning method to achieve the algorithm of which an analysis was made.The experi— mental results show that in small sample cases,the retrieved statistical information of color image improved the retrieval precision recall rate. Key words:Semantic Web;color Statistics;semi—supervised learning;image search [责任编辑:黄天放]