来源:网络 | 2021-12-23 11:07:34
你会相信人工智能是经过人工合成数据训练的,而不是真实世界的数据吗?你可能不知道,但你可能已经知道了——根据最新公布的调查结果,这没关系。
用于测试和培训人工智能应用程序的高质量、特定领域的数据集的匮乏,使得团队争先恐后地寻找替代方案。大多数内部方法要求团队收集、编译和注释他们自己的DIY数据——进一步加剧了偏见、边缘案例性能不足(即泛化能力差)和隐私侵权的可能性。
然而,一个可取之处似乎已经在眼前:合成数据的进步。这种计算机生成的真实数据本质上为团队目前面临的任务关键型问题列表上的几乎每一项提供了解决方案。
这就是《合成数据:2022年生产就绪人工智能的关键》简介的要点这项调查的结果是基于计算机视觉行业工作人员的回答。然而,调查结果具有更广泛的意义。首先,因为有广泛的市场依赖于计算机视觉,包括扩展现实、机器人、智能车辆和制造业。第二,因为为人工智能应用生成合成数据的方法可以推广到计算机视觉之外。