自动驾驶之旅1

杂记1

1. 生成世界模型中的P=NP问题

可验证的问题可生成,自动驾驶Reward Model难以设计

2. CV大模型的目标

CV大模型的目标是理解物理世界常识,与世界进行互动,因此单帧的Web数据不足以支撑(联系具身智能的数据难题)

3. L4驾驶的算法冗余

L4驾驶需要存在所谓的算法冗余,在模型中除了深度学习部分还需要包含传统算法等非深度学习部分

4. PhD科研实习的优势

我认为科研实习的优势:

培养的能力

  • Presentation
  • 分析负面结果

Topic

  • 立足于更高也更现实的平台

参加企业及比赛

  • 数据挖掘的能力
  • 增进对数据和业务的理解
  • 对论文去伪存真
  • 摒弃边缘研究方向

5. 强化学习的问题

优化问题

对安全的小概率事件的合理考量

Agent问题

如何模拟真实世界动态交通参与者

Reward设计

如何解决乘客对安心感的考量和Prior问题