Manhattan World(曼哈顿世界)¶
“曼哈顿世界”(Manhattan World)是计算机视觉和机器人领域的一个几何假设,指的是一种场景结构假设,即场景中的物体主要沿着三个互相垂直的方向排列。
- 这三个方向通常对应于:
水平方向1(例如:x 轴)
水平方向2(与 x 轴正交,例如:y 轴)
垂直方向(例如:z 轴,竖直方向)
作用¶
举例说明¶
- 假设你拍了一张室内照片,场景是一个标准的房间:
地板和天花板是水平的
墙壁垂直地面
桌子、门、窗户也都沿着这三个主方向对齐
这个房间就是一个典型的“曼哈顿世界”。
拓展: 非曼哈顿世界(Non-Manhattan World)¶
- 并不是所有场景都符合曼哈顿世界假设。例如:
山地、森林、自然风景
建筑风格复杂的城市(如巴黎或成都)
室内有斜屋顶或异形设计
- 为了解决这些情况,研究者提出了扩展版本,比如:
Atlanta World:允许多个方向,但每组仍成直角
Piecewise Manhattan World:局部区域满足曼哈顿世界,但整体不是
Non-Manhattan structures:完全不依赖正交结构,使用更通用的方法(如深度学习、几何优化)