图像分类算法与应.ppt

上传人:牧羊曲112 文档编号:6256442 上传时间:2023-10-10 格式:PPT 页数:38 大小:7.40MB
返回 下载 相关 举报
图像分类算法与应.ppt_第1页
第1页 / 共38页
图像分类算法与应.ppt_第2页
第2页 / 共38页
图像分类算法与应.ppt_第3页
第3页 / 共38页
图像分类算法与应.ppt_第4页
第4页 / 共38页
图像分类算法与应.ppt_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《图像分类算法与应.ppt》由会员分享,可在线阅读,更多相关《图像分类算法与应.ppt(38页珍藏版)》请在三一办公上搜索。

1、图像分类算法与应用研究,目录,研究背景相关研究工作已有工作基础论文主要研究内容,实际意义,按照语义内容进行图像管理/图像浏览减少人工标注时间(Flickr,Picasa)辅助图像检索(Google,Baidu,Picsearch),图像分类的语义层次,James Wang:1.语义类别(例如照片或者剪贴画,室外)2.物体的罗列(人,篮球架,楼)3.抽象的语义(运动,打篮球)4.具体的语义(具体的描述一个图像),场景分类,物体分类,Caltech 101,图像分类,海滩,恐龙,非洲,图像分类的挑战,尺度变化,光照变化,图像分类的挑战,类内差异,类间差异,研究现状,图像表示底层视觉特征表示语义图像

2、表示词包模型表示机器学习算法多示例学习算法,底层视觉特征表示,Vailaya 6类假日图片 层次分类 贝叶斯分类器Chang 全局特征,SVM分类器付岩 3类图片 3种颜色特征对比 SVM分类器Torralba 收集了8000万张32*32的图片,用最近邻方法进行分类,Szummer和Picard 分类“室内”/“室外”颜色和纹理特征 K-NN 投票Serrano SVM分类 SVM输出结果相加Paek和Chang 图像分割 使用贝叶斯网络,语义图像表示(全局),Spatial Envelope-Oliva和Torralba提出,NaturalnessOpennessRoughnessExpa

3、nsionRuggedness,语义图像表示(局部),Vogel和Schiele提出,词包模型,DenseHarris-LaplaceHessian-LaplaceHarrisHessianEdge-LaplaceHaar-HessianDoG(Difference of Gaussian),PatchSIFTgradient location and orientation histogram(GLOH)shape contextsteerable filtersmoment invariantsSURF,感兴趣区域检测器,描述子,State of Art方法,词汇表的构造(K-Means,

4、GMM,VQ,pLSA)图像相似性的度量(Distance Metric Learning,Kernel Methods(PMK,EMD)多特征融合(Random Forest/Ferns,SVM)图像空间信息的利用(Spatial Pyramid,ABS-pLSA,TSI-pLSA,LDA(Fei-Fei)感兴趣区域选取(Anna Bosch),多示例学习,多示例训练集由包(bag)组成,每个包里面包含多个实例(instance)。如果一个包为正例,则包中至少有一个实例为正例;如果一个包为反例,则包中所有的实例均为反例。方法:MaronDiverse DensityAndrew Mi-SVM

5、以及MI-SVMChen DD-SVM以及MILESQi DD-SVM变种周志华MIML框架(Multi-Instance Multi-Label),SVM进行图像分类,常用核函数,高斯核(Gaussian RBF):,拉普拉斯核(Laplacian RBF):,多项式核(polynomial):,无限多项式核(infinite polynomials):,Svetlana Lazebnik-Spatial Pyramid Matching Kernel(空间金字塔匹配核),Spatial Pyramid RBF Gaussian Kernel,Spatial Pyramid 2 Kernel

6、,Evaluation,Corel图像库中的10类,Libsvm,5折交叉验证C=2-3,2-1,215=2-15,2-13,25,Spatial Pyramid RBF Gaussian Kernel,Spatial Pyramid 2 Kernel,以上两种核的结果都有所提高1+4的形式最好自动学习出权重,多分类器融合的图像分类,多分类器融合框架,模糊积分,函数g:2T 0,1叫做g模糊测度,如果它满足如下性质:(I)g()=0;(II)g(T)=1;(III)g(A)g(B),if AB 并且 A,BT(IV)对于所有的A,BT并且 AB=g(AB)=g(A)+g(B)+g(A)g(B)

7、对于某一个-1,模糊积分,训练传统的Reward-Punishment算法设置初始gi对训练样本的分类进行Reward和Punishment对初始gi依赖,陷入局部最优解改进设置多组初始gi本文选取gi=t/N,结果,Corel图像库中的10类,Libsvm,线性核C=2-5,2-4,2105折交叉验证,结果比较,“海滩”被误分为“山川”,“山川”被误分为“海滩”,经常被误分的图片,融合方法与子分类器的精度对照,不同训练样本下的精度对照,改进:自动抛弃性能较差的分类器,主要研究内容,实施方案与可行性论证,组合多分类器框架的研究最优词汇表构造的研究最优空间信息进行图像分类的研究Internet图像挖掘研究,组合多分类器框架的研究,组合分类器框架选择分类器权重计算分类器选择,最优词汇表构造的研究,Filter方法预计方法:生成一个较大的词汇表(5000-10000)根据每个词汇的对类别的判别能力控制聚类,最优空间信息进行图像分类的研究,Kernel MethodsGaussian,2,Histogram Intersection根据训练图像学习出金字塔每个层次的最优权重,Internet图像挖掘研究,现有图像挖掘方法的不足:训练数据存在噪声不能很好的突破搜索引擎返回结果数量的限制解决方案:查询扩展多个搜索引擎结果集成文本分类技术与图像分类技术结合少量标记样本半监督学习,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号