轻舟智航于骞:数据规模对模型性能至关重要,数据的质量和规模一样重要

花花2024-07-12热点分享386

专题:2024中国汽车论坛

  “2024中国汽车论坛”于7月11日-13日在上海举行,主题为 “引领新变革 共赢新未来”。北京轻舟智航科技有限公司CEO于骞出席并演讲。

  于骞指出,每天在路上有几十万台以上的车在跑,其中会产生巨量的数据,如何高效的使用这些数据,不断的迭代,使得产品能够以月甚至以周为单位去更新,这对产品体验至关重要。

  他强调数据规模对于模型性能提升也是至关重要的,他发现很多有意思的场景就是模型并没有做任何的变化,结果数据质量和数据分布,还有数据规模变得更好,使得体验增加了非常多。这就是数据带来的价值,一方面数据规模大是很重要的,但是数据质量、数据分布也是非常重要。

  不过,他也强调,尽管数据规模很大,但都是同质化的,或者说数据都是已经千篇一律,这种数据其实也是也是有问题的,所以通过数据挖掘,可以获得一个更好的分布,对于用相对来讲比较少的训练数据,可以实现一个更大的训练数据效果,来减少在这种训练中耗费的训练资源,因此数据的质量和数据规模一样重要。

  他还举例说明,比如挖土车,因为施工的场景对于高级辅助驾驶、自动驾驶是非常具有挑战的,有各式各样的挖土车。通过数据挖掘的方式也可以把这种比较少见的、特殊的车辆,能够更快速的用来训练车载模型。

相关文章

北交所,逆市大涨!军工股强势走高,有色板块大幅调整

北交所,逆市大涨!军工股强势走高,有色板块大幅调整

  北交所个股逆市活跃。   受有色金属、房地产、建筑装饰等多个板块回调影响,沪深股市今日开盘后持续震荡走弱,上证...

周末重磅!中美大消息,证监会发声!2025年中央一号文件发布!影响一周市场的十大消息

周末重磅!中美大消息,证监会发声!2025年中央一号文件发布!影响一周市场的十大消息

  何立峰与美财长贝森特举行视频通话   2月21日,中美经贸中方牵头人、国务院副总理何立峰应约与美...