DiffSim Trinity подобрява обучението на автономни автомобили
Нова стъпка в обучението на автопилоти DiffSim Trinity е изследователски проект, насочен към подобряване на начина, по който се
Нова стъпка в обучението на автопилоти
DiffSim Trinity е изследователски проект, насочен към подобряване на начина, по който се обучават системите за автономно шофиране. В интервю за предаването „UpDate“ по Bloomberg TV Bulgaria Асен Начков, докторант в INSAIT, обясни идеята зад разработката и ролята ѝ при възпроизводство на движението в симулации.
Защо движението в симулациите има значение
Начков обясни, че управленските параметри на колата — ускорение, спиране и ъгъл на завиване — трябва да бъдат свързани с реалистична динамика. По думите му автопилотите учат статистически закономерности; например при червен светофар автомобилът трябва да спре, а при свободен десен завой и навигация за десен завой — да се завие надясно. Тези правила обикновено се добиват чрез трениране в симулатори, които пресъздават исторически пътни ситуации и позволяват алгоритмите да имитират човешкото поведение.
Ключов проблем, посочен в разговора, е как симулаторът превръща решението на алгоритъма — например „да ускоря“ — в конкретно преместване и промяна на позицията след малък времеви интервал. При много съществуващи симулатори тези изчисления не са достъпни за алгоритъма по време на обучението, което ограничава информацията, върху която моделите се оптимизират.
Диференцируема симулация като отговор
DiffSim Trinity цели да запълни този дефицит чрез прилагане на диференцируема симулация — технология, която моделира връзката между управлението на автомобила и неговото движение, т.е. динамиката на средата. Според Начков това предоставя допълнителни данни за обучението на автономните системи и разширява възможностите при оптимизация на поведението им.
Проектът използва симулатор, разработен от UEMO, която гостът описа като една от водещите компании в САЩ за автономни автомобили. В инженерната основа на DiffSim Trinity стои и платформа, наречена Waymax — симулатор, идващ от Waymo. Начков отбеляза, че Waymax е удобна за изследователска работа: не е тежък софтуер и позволява лесно паралелизиране върху много видеокарти, което я прави подходяща за големи изчислителни процеси.
Връзка с безопасността и индустриален интерес
Един от основните аргументи за разработката е потенциалът автономните коли да бъдат по-безопасни от човешките водачи. Начков посочи, че алгоритмите не изпитват умора и не губят концентрация при монотонно шофиране. Той допълни, че първоначални данни и анализи на инциденти показват по-малък дял тежки катастрофи с автономни автомобили в сравнение с човешкото управление, което дава основание да се вярва в по-висока безопасност на технологията.
Разговорите с индустрията вече са започнали — според Начков се водят дискусии за сътрудничество с Waymo. Той припомни и кратка историческа бележка, че Waymo е започнала като вътрешен проект в Google и през 2016 г. става самостоятелна компания, собственост на Alphabet.
Научни публикации и следващи стъпки
DiffSim Trinity представлява съвкупност от три академични статии с различен фокус. Първата беше представена преди два месеца и половина в Китай, а втората и третата са планирани за представяне в Сингапур „следващата седмица“, посочи Начков. Резултатите вече са налични и екипът събира идеи за надграждане.
Според него отзивите досега са положителни — има интерес от студенти и изследователи, а проектът се възприема като новаторски поради това, че изследва възможностите и ограниченията на диференцируемата симулация в контекста на автономните превозни средства.
Предизвикателства за масово внедряване и позицията на България
За по-широко приложение на технологиите Начков посочи няколко основни пречки: необходимост от големи капиталови инвестиции, задължителна сертификация за безопасност при пускане на флотилия и готовността на градските администрации да приемат иновации, които могат да променят икономическата структура на транспортния пазар.
По отношение на България той изтъкна наличието на научен потенциал и силна традиция в компютърните науки. Внедряването обаче зависи от адекватна политика и от фирми, които реално развиват технологията. Начков посочи, че конкурентното предимство на страната е в научния капацитет и таланта в институти като Insight, които той нарече „център за талант“.
За конференцията в Сингапур целта на екипа е да получи обратна връзка от международни изследователи и да събере идеи за следващи разработки; вече тече работа по нов проект, който ще надгражда настоящите идеи.


