移动端实现对象检测追踪有何挑战，高通又提出怎样的解决方案？ - 行业

查看引用/信息源请点击：映维网

计算机视觉的用例几乎无穷无尽

（映维网2019年10月29日）计算机视觉应用程序通常需要处理多帧图像，入通过视频捕获的图像。这个处理过程最重要的其中一个方面是，能够在对象移动以及视口更改时识别和追踪对象。从机器人视觉处理和自动驾驶起到，到安全录像和增强现实，这种功能的用例几乎无穷无尽。

尽管这对于功能强大的移动处理器而言似乎微不足道，而且我们人类可以轻松实现，但要在数字世界中重现这一功能确实不易。高通的FelixBaum日前撰文向我们介绍这一领域所面临的挑战，以及潜在的解决方案。下面是映维网的具体整理：

1.运动帧的挑战

分析视频帧提出了大量的挑战，其中很大一部分是由于给定场景涉及的变量数十分巨大。以下是开发对象检测与追踪应用程序时应考虑的挑战：

对象转换：对象可以随时间平移，旋转和缩放。

对象遮挡：对象可能会被其他对象部分或完全遮挡。

运动模糊：根据诸如运动对象的速度，记录帧速率等因素，图像可能会变得模糊。

快速运动：对象在帧之间的转换速度可能非常快，并且会根据对象本身的速度，以及对象相对于帧捕获速率而变化。

场景混乱：场景可能包含复杂的特征和大量对象。

对象之间的相似性：诸如人脸之类的对象可能包含大量相似的特征，所以很难进行区分。

环境影响：照明，雨水和雾度变化等影响都会影响图像质量。

追踪失败：对象可能消失，然后全部或部分重新出现。解决这个问题需要重新检测对象。

摄像头转换：摄像头的位置，方向和视口设置会随时间变化。

幸运的是，社区已经开发了一系列的方法，而且由于边缘处理能力的提高，现在大量的方法已经变得可用。