当前位置:文档之家› 三维模型的最佳视角选择标准

三维模型的最佳视角选择标准

a
接近零表明算法所选择的视角和用户选择的视角很接近。对于所有的用户,我们将这一值取平均 : 值,称为“视角选择误差” ( VSE )
VSE
1 a WS (。
5
结果
5.1 一致性 用户所选择的视角的一致性是需要着重考虑的。 我们用一种方法衡量用户所选择视角的非一 致性,该方法与计算视角选择算法性能时所用的方法相似。我们度量不同用户所选择视角之间的
a a

s vm
,同时算法 a
也选择了最佳视角 vm 。那么 vm 的好坏就和其与用户所选择视角的下述误差有关:
a ) min Ws (vm
1

a ), v v s GD(v, vm
( 1)
m
G(a, b) 定义了网格球上 a,b 两点之间的距离。这一度量方法对应于特定的模型以及特定的
用户所提供的标定数据。 Ws (vm ) 是 0 到 1 之间的值,因为单位球面上最长的距离为 。该值越
3
最佳视角选择算法
我们试验了一些视角选择算法,并且使用参与者提供的标定数据来对它们进行评估。这些算
法通过视角描述子来选择最佳视角,视角描述子用于衡量一个模型视球上从某个视点看过去时可 见表面的几何复杂度。最大化几何复杂度的视点就被认为是最具信息量的视点。使用的描述子不 同,算法也不尽相同。我们选择了 7 种描述子以提供基准性能值,用于以后的算法和研究。这些 描述子如下:
图 3 网格球面构造过程
一个模型可能具有对称性,这会导致从不同的视角看去得到的视图很相似。对于模型 m 的 一个视点 v,我们检测从其他视点看到的相似视图并建立一个相应的对称集,

v
{d ( I w , I v ) t , w V } 。
I v 对应于从视角 v 看到的深度图,d ( I w , I v ) 是 I v 和 I w 之间的旋转不变性相异度度量方法。
三维模型的最佳视角选择标准
Helin Dutagaci, Chun Pan Cheung, Adzal Godil
摘 要: 最佳视角选择问题对应于自动为三维对象选择最具代表性的视图。本文中,我们描述
了了一个用于评估最佳视角选择算法的标准。 该标准包括由 26 个人为 68 个模型人工选择的视角。 数据通过一个基于网络的主观实验来收集,参与者被要求为三维模型选择最具信息量的视角。在 这些真实数据的基础上,我们提供了定量的评价指标并且比较了七个最佳视角选择算法的性能。 常用术语 算法,度量,性能,实验,标准化 关键词 最佳视角选择,三维模型分析
( 4)
注意到这一方法考虑到了模型的对称性。这种非一致性越大,用户对于视角的喜好则越多样
6
化。表 1 给出了用户对于部分模型视角选择的非一致性度量结果。我们的研究结果表明,人们对 于大部分模型的视角选择还是具有较高的一致性的。 在图 4 中, 我们用红点标记人们的喜好视角。 每个模型分别从侧面, 正面和顶部呈现。 我们可以观察到红点几乎都集中在模型的某些特定区域。 对于花瓶模型,虽然红点分布比较多样化,但是非一致性值却很低(表明用户的偏好是一致 的) 。这是因为花瓶模型具有高度的对称性。对于兔子和大卫头部模型,所有的用户都倾向于能够 观察到面部的视角。 摇杆模型,作为模型集中最不熟悉的一类,拥有最高的非一致性。而手掌模型,在这里虽然没有 展示,一般的用户喜欢选择手背的视角,其他的用户则选择能够看到手掌心的视角。对于高铰接 性的动物比如蚂蚁和章鱼,非一致性也很高;可是,对于蚂蚁模型,大多数用户选择顶视图。 与之前关于人们对视图偏好的研究相一致,我们的结果显示对于大部分模型,人们更倾向于 选择半面视图(图 4-a,c,d) 。可是,对于某些种类的模型,比如人脸模型和人体模型,一些用户更 倾向于选择正面视图(图 4-b,e,f) 。 另一个小的结论是,当一个模型可以站立于地面时,没有用户会选择底视图。这一结果证实 了如论文[14]和[4]中所说的那样,自动检测模型的基底,能够大大减少最佳视角的搜索空间。
a
4
标准设计
4.1 三维模型数据集 我们所使用的三维模型数据集由 68 个三角网格模型组成。部分模型是标准的并且已被广泛 用于三维研究;并且也已经被作为最佳视角选择问题的测试对象。比如,犰狳,大卫头部模型, 茶壶,兔子等等。我们从 The Stanford 3D Scanning Repository 模型库 [18]以及 SHREC2007 水密模 型库[19]中也挑选了一部分模型。 图 2-a 展示了数据集中的部分模型。几乎大部分模型都是人们所 熟知的。图 2-a 中只有最后一行的两个模型是不为人所熟悉的。 4.2 搜集标定数据的用户界面 我们制作了一个网页,用户可以登录并参与到我们的实验中来[20]。每次展示给用户 68 个模 型中的一个。每个模型以随意的姿态出现。用户可以旋转模型至满意的姿态,然后点击提交按钮。 我们向用户解释了何为最佳视角,以确保用户不会去选择美学上的视角而是最具信息量的、能够 最大化识别范围的视角。图 2-b 展示了用户界面的截图。 迄今为止, 26 个参与者已经提交了他们的选择结果。我们建立了标定数据集并且使用它来 评估视角选择算法。三维模型数据集以及标定数据在我们的网站上都有提供[21]。
G(a, b) 定义了网格球上
点 vm 相关的对称集和
s
a, b 两点之间的距离。为了考虑模型的对称性,我们确定了与顶

s vm
。那么,对于一个模型,我们就有与

s vm
中元素个数相同的最佳
视角数量。模型 m 的标定数据就以对称集和 4.3.2 评估步骤

s vm
来定义。
有了标定数据以及算法的运行结果之后,我们就需要衡量结果的好坏。正如前面所说,算法 所选择的视角以及用户选择视角都会对应到网格球面上的顶点。 如果用户 s 为模型 m 选择了最佳视角并且以此计算出了相应的标定数据
1
引言
最佳视角选择问题对应于自动为三维对象选择最具代表性的视图。为大型三维数据库自动生
成缩略图是该问题的一个重要应用。随着在 CAD,分子生物学,医学以及娱乐领域的 3D 模型集 合的迅速扩大,通过自动生成缩略图对三维模型进行快速浏览变得可行。缩略图应该是看上去舒 适的并且能够使用户快速识别对象。最佳视角选择还有其他一些应用,比如自动摄像机替换,三 维场景生成,手术规划,以及基于视角的三维对象识别。 在过去的几年内,对于最佳视角选择已经提出了许多不同的算法。可是,仍没有一个量化标 准来对这些算法的性能进行客观的比较。在许多情况下,作者都是展示他们的算法所选择的视图 并且做了一些主观的评价。 本文中,我们提出了一个用于定量评价随驾视角选择算法的标准。我们设计了一个基于网络 的主观实验,参与者旋转三维模型以获得最具信息量的视角。26 个参与者参与此项实验;因此对 于 68 个模型,每个模型都获得了 26 个视图(图 1) 。基于这些主观视角,我们提出了一个定量的 性能评价方法。 本文如下组织:第二章我们概述了最近的一些最佳视角选择算法。在章节三,我们简单描述 了本文中用于比较的 7 种算法。第四章,我们描述了我们的标准;数据库,网络接口,数据的结 构以及定量评价方法。在第五章,我们提供的了最后结果,第六章做了全文总结。
我们使用基于梅林变换的图像匹配方法 [2],当然也可以使用其它匹配方法。我们将阀值 t 设置较 小,因为我们希望检测到一个对称模型的视点中能看到的几乎相同的视图。 当用户 s 为模型 m 选择最佳视角后,我们用 球上最近的顶点:
s s vm arg min vV GD ( pm , v) ,
s s 来表示相应的视点。我们将 pm 对应到网格 pm
1)视图面积:从某视点看去时对象的投影面积。最大化这一描述子的视角也就意味着最大的 外轮廓长度。 2)可见面积比例[11]:对象可见表面与全表面的比例。与前一个描述子的区别在于,这里我 们计算所有可见三角网格面积之和而不是投影面积。 3)表面积熵[15]:这一方法中,一个三角网格的投影面积和整个对象的投影面积的比例称作 该三角形关于一个特定视点的“概率” 。这一概率分布的熵就是基于表面积熵的视图描述 子。 4)外轮廓长度 [11]:从一个视角看去时,对象的外轮廓长度。 5)外轮廓熵 [9]:外轮廓的曲率分布熵。 6)曲率熵 [9]:可见表面的曲率分布熵。通过最大化这一数值,拥有最多样化曲率值的视角 就选为最佳视角。我们使用可见顶点的平均曲率来计算曲率熵。 7)网格显著度 [7]:网格显著度也是基于表面的局部曲率。每个顶点的平均曲率由两个高斯 滤波器对其加权, 一个尺度是另一个的两倍。加权曲率在这两种尺度上的绝对差对应于 在这一尺度对上的网格显著度。 然后, 一个顶点整体网格显著度就是通过计算连续尺度对 的显著度之和获得。那么最佳视角就选择最大化可视顶点显著值之和的那个。 我们使用在几何球面上采样顶点来作为一个模型的视点。我们用已选择的标准来衡量几何复 杂度,例如,一个视图面积或者外轮廓熵。最大化这一标准的视图就被认为是通过特定的算法选 择出的最佳视角。我们用 vm 来表示相关顶点,即模型 m 通过算法 a 选择出的最佳视角。
图 1 从某视角看去的样例模型。红点表示实验人员选择的视角。其他颜色的点表示不同算法选出的视角。
2
2
相关工作
人类对于三维模型模型视图的偏好分析是一个心理学的研究主题[1,13,3]。这些偏好视图通常
被称为“标准视图”或者“最佳视图” 。用于决定一个模型最佳视图的标准,比如初想视图,最具 审美价值的视图,以及最熟悉的视图,是多样化的并且彼此无关的。之前的物理心理学实验指出 对于某些类别的熟悉的物体,人们对其的偏好视图是一致的。 Polonsky 等人 [11]分析了一些最佳视角选择算法,将衡量方法与一些候选视图联系起来。这 一衡量方法事实上一个函数,其目标与对象本身或其投影的几何或统计属性相关。比如可视化投 影面积[10],视点熵[16],识别能力[12],曲率熵[9]。 Polonsky 等人 [11]通过展示一些模型的最佳 视图来比较这些算法。 Yamauchi 等人 [17]使用网格显著性来衡量一个视图的好坏。候选视角通过视球的一个划分来 获得。划分是基于投影视图的相似性并且各分区的形心作为代表视角。然后这些视角根据网格显 著性衡量来排序。 Mortara 和 Spagnuolo[8]提出使用网格划分来确定一个对象的有意义显著部分,而不是使用局部几 何特征来确定一个视图的信息量。然后可以最大化显著部分可见性的视点就被选为最佳视角。作 者在一个拥有 400 个模型的数据库上测试了他们的算法,然后人工确定这些视图是“好的” , “可 接受的” , 还是 “不可接受的” 。 可是, 这一评价不是基于一个事先获得的 “标定数据 ( ground truth) ” , 那么与其他算法的定量比较就不可能了。 Jagadeesan 等人[5]使用 Amazon’s mTurk Crowdsourcing 系统设计了一个主观实验来研究 CAD 模型的最佳视图。 在实验中, 展示给实验人员模型的 20 个视图并要求他们选择最好的一个。 可是, 这种评价方式是基于一些固定的视角的,与我们的系统中用户可自由旋转视角相反。 Theetten 等人 [14]提出使用平衡平面来选择模型的特征试图并且使用它们来进行三维对象的 识别和检索。他们定义平衡平面为模型可以稳定站立的一个平面。Laga[6]将最佳视角选择问题归 结为一个分类问题,就是使用一个学习策略来确定哪个视图可以获得最高的分类准确度。这一方 法基于这样一个假设,即属于同一语义类的模型有相似的最佳视角。 视角选择算法的性能大多通过视觉确定来评估, 缺少一个定量的方法来比较多种算法的性能。 本文中,我们提出了一个基于“标定数据”以及定量方法的方法论来评估视角选择算法的性能。
相关主题