首页 理论教育莲花山图像库:全球最大的图像数据集

莲花山图像库:全球最大的图像数据集

【摘要】:莲花山图像库到2008年为止有3927130个位置点,636748幅图像(视频),而且数目还在不断增加,其中13个子集一般作为算法评估的基准,如一般场景、事件和活动、航拍图像、热门目标、一般目标、人脸和姿态、视频剪辑、文字、自然图像的2.1D分层表示等。

上述图像库局限于仅仅标记了目标的粗糙边界,并不适合精细的区域分割或语义分解。因此在LabelMe图像库的基础上,出现了另一种包含更为详尽的视觉知识的图像库——莲花山图像库(Lotus Hill Research Institute Image Cor-pus)[25]。该图像库是由中国莲花山计算机视觉和信息科学研究院创建的,由全职标注人员用解释图(Parse Graph)的方式对每个图像或目标进行了标注,并按照WordNet的标准表示目标、部件的名字和关系。

莲花山图像库到2008年为止有3927130个位置点,636748幅图像(视频),而且数目还在不断增加,其中13个子集一般作为算法评估的基准,如一般场景、事件和活动、航拍图像、热门目标、一般目标、人脸和姿态、视频剪辑、文字、自然图像的2.1D分层表示等。

莲花山图像库不单纯是图像数据的存储管理和查询检索,而且是基于通用需求标记信息的标识法和组织法,构建的一种新的大型的、通用的、真实的图像数据集,实现了图像理解中信息组织和信息运用的两大基本任务。该图像库通过适当组合注释工具的功能模块,可以完成对图像的任何标记和注释工作,并利用知识库的引导加速这一过程。

随着目标种类的增加、同一类目标之间视觉差别的增大,目标识别研究对图像数据的数量和种类有着更为严格的要求。而大多数图像库都是人工收集并加以标注的,这耗费了大量的人力和物力。近些年,不少科研人员在尝试让计算机自动完成这项任务。Fergus等人[26,27]使用视觉信息对从网上获得的大量图像数据进行标注;Berg等人[28]则专注于建立几种动物类的图像数据库,他们使用搜索工具从网上搜索图像,通过狄雷克勒分配技术发掘一系列潜在主题和对应的图像样例;Schro等人[29]利用贝叶斯理论和支持向量机技术实现了图像数据库的自动收集;Collins等人[30]为了获得精确和大规模的图像数据集,设计了一种判别性学习方法,能主动在线学习快速分类对象并实现数据库的自动构建。随着目标识别系统的发展,相信会出现更多更好的图像库和图像数据收集算法。

模式识别的角度来说,数据集在系统性能评估中的应用方式主要有三种[31]:重替代法,就是使用相同的数据集,先进行训练再进行测试,这种方法非常简便,但测试结果通常是偏于乐观的;坚持把可用的数据集被分成两个子集,一个用于训练,一个用于测试,这种方法最为常用,但缺点是划分子集减少了训练和测试数据集的大小,而且需要人为决定用于训练集和测试集中的样本数目;留一法,循环地以每一个样本为测试对象,而数据集中的其他样本作为训练样本,该方法使用了所有样本的同时维持了训练数据集和测试数据集之间的独立性,但缺点是有很高的计算复杂度。本书的实验中在对图像库的使用上采取第二种方案,即划分出两个独立的子集作为训练集和测试集,它们包含的样本数量比例一般为8∶2或7∶3。