自动驾驶之旅1

杂记1

1. 生成世界模型中的P=NP问题

可验证的问题可生成，自动驾驶Reward Model难以设计

2. CV大模型的目标

CV大模型的目标是理解物理世界常识，与世界进行互动，因此单帧的Web数据不足以支撑（联系具身智能的数据难题）

3. L4驾驶的算法冗余

L4驾驶需要存在所谓的算法冗余，在模型中除了深度学习部分还需要包含传统算法等非深度学习部分

4. PhD科研实习的优势

我认为科研实习的优势：

培养的能力

Presentation
分析负面结果

Topic

立足于更高也更现实的平台

参加企业及比赛

数据挖掘的能力
增进对数据和业务的理解
对论文去伪存真
摒弃边缘研究方向

5. 强化学习的问题

优化问题

对安全的小概率事件的合理考量

Agent问题

如何模拟真实世界动态交通参与者

Reward设计

如何解决乘客对安心感的考量和Prior问题

自动驾驶

自动驾驶之旅1

http://www.wsgbxx.com/2026/02/09/杂记1/

Author

wsgbxx

Posted on

February 9, 2026

Licensed under

MIT18.06 Previous

如果我的人生可以重开✗ 对别人的人生指手画脚✓ 其实都在打着指导别人的名义，偷偷列自己的后悔清单 Next