轻舟智航于骞:数据规模对模型性能至关重要,数据的质量和规模一样重要

花花2024-07-12热点分享422

专题:2024中国汽车论坛

  “2024中国汽车论坛”于7月11日-13日在上海举行,主题为 “引领新变革 共赢新未来”。北京轻舟智航科技有限公司CEO于骞出席并演讲。

  于骞指出,每天在路上有几十万台以上的车在跑,其中会产生巨量的数据,如何高效的使用这些数据,不断的迭代,使得产品能够以月甚至以周为单位去更新,这对产品体验至关重要。

  他强调数据规模对于模型性能提升也是至关重要的,他发现很多有意思的场景就是模型并没有做任何的变化,结果数据质量和数据分布,还有数据规模变得更好,使得体验增加了非常多。这就是数据带来的价值,一方面数据规模大是很重要的,但是数据质量、数据分布也是非常重要。

  不过,他也强调,尽管数据规模很大,但都是同质化的,或者说数据都是已经千篇一律,这种数据其实也是也是有问题的,所以通过数据挖掘,可以获得一个更好的分布,对于用相对来讲比较少的训练数据,可以实现一个更大的训练数据效果,来减少在这种训练中耗费的训练资源,因此数据的质量和数据规模一样重要。

  他还举例说明,比如挖土车,因为施工的场景对于高级辅助驾驶、自动驾驶是非常具有挑战的,有各式各样的挖土车。通过数据挖掘的方式也可以把这种比较少见的、特殊的车辆,能够更快速的用来训练车载模型。

相关文章

押注特朗普获胜?近8000亿美元中资美元债市场率先抢跑

押注特朗普获胜?近8000亿美元中资美元债市场率先抢跑

美国大选已进入“白热化”阶段,资本市场也在不断调整博弈预期。作为存量规模超7000亿美元的中资美元债市场,近期指数走弱明显,10月至今21个工作日,Markit iBoxx亚洲中资美元债券指数振...

证监会主席吴清开展专题座谈会:研究谋划进一步全面深化资本市场改革开放的一揽子举措

证监会主席吴清开展专题座谈会:研究谋划进一步全面深化资本市场改革开放的一揽子举措

据证监会网站消息,为深入学习贯彻党的二十届三中全会精神,进一步全面深化资本市场改革,近日,证监会党委书记、主席吴清在北京开展专题座谈会,与10家在华外资证券基金期货机构、QFII机构等代...