自动驾驶之旅1
杂记1
1. 生成世界模型中的P=NP问题
可验证的问题可生成,自动驾驶Reward Model难以设计
2. CV大模型的目标
CV大模型的目标是理解物理世界常识,与世界进行互动,因此单帧的Web数据不足以支撑(联系具身智能的数据难题)
3. L4驾驶的算法冗余
L4驾驶需要存在所谓的算法冗余,在模型中除了深度学习部分还需要包含传统算法等非深度学习部分
4. PhD科研实习的优势
我认为科研实习的优势:
培养的能力
- Presentation
- 分析负面结果
Topic
- 立足于更高也更现实的平台
参加企业及比赛
- 数据挖掘的能力
- 增进对数据和业务的理解
- 对论文去伪存真
- 摒弃边缘研究方向
5. 强化学习的问题
优化问题
对安全的小概率事件的合理考量
Agent问题
如何模拟真实世界动态交通参与者
Reward设计
如何解决乘客对安心感的考量和Prior问题
自动驾驶之旅1
http://www.wsgbxx.com/2026/02/09/杂记1/