Непреодолимый ров: 14 обязательных составляющих для беспилотного вождения в 2025 году

1.3K 11:15 - 14/Янв/26 Нидерланды

(6 лет 3 месяца)

В тени грандиозных амбиций традиционные автопроизводители и их поставщики шепчутся о будущем «полностью автономного вождения», о том, что автономность 4-го уровня появится в автосалонах к 2030 году. Но по мере приближения конца 2025 года только одна компания преодолела эту пропасть: Tesla, чья система FSD v14+ доказала способность к беспилотному вождению на дорогах общего пользования (пустое водительское сиденье в Остине, водитель, следящий за происходящим, может расслабиться и не смотреть). Это не удача и не просто вычисления — это десятилетняя вертикально интегрированная крепость из 14 взаимосвязанных возможностей. Упустите одну, и вы отстанете на годы. Упустите большинство, как это делает традиционный мир, и мечта становится математически недостижимой.

Далее следует неприукрашенная правда, почерпнутая из открытых источников, для тех, кто всё ещё стремится к горизонту. Никаких секретных намёков — только холодные факты о том, что нужно для создания системы, которая не просто управляет автомобилем, но и понимает хаос в мире лучше, чем мы.
Начнём.

Обзор: 14 обязательных компонентов для беспилотного вождения в 2025 году

Итог: У традиционных производителей автомобилей в настоящее время имеют ноль из 14 компонентов в необходимом масштабе и степени зрелости.

У традиционных производителей отсутствуют все 14. В следующих разделах мы подробно рассмотрим каждый пункт, объясним, почему он важен, и покажем, во сколько обойдётся устранение даже одного из них.

Подробный анализ — Пункт 1: Фиксированный набор датчиков на 8+ лет (или: Почему традиционные производители автомобилей постоянно обнуляют данные)

Основная проблема заключается не в «модернизации» как таковой, а в неконтролируемом взрыве вариантов. Tesla также проводит обновления (HW3 → HW4) и переобучает системы для новых разрешений.
Но делает это раз в 4–6 лет на одной унифицированной платформе (сначала Model 3/Y, затем S/X, затем Cybertruck, затем Semi/Robotaxi на том же наборе данных). Традиционные производители автомобилей делают нечто принципиально иное:

Каждый из этих наборов данных представляет собой новое распределение обучающих данных. Даже если разрешение остается 5 Мп, перемещение камеры на стойке B на 8 см наружу или наклон ее на 2° изменяет оценку глубины по краям.
Разная высота крыши, разная длина капота, разная конструкция зеркал → разные схемы перекрытия. Добавьте постоянные изменения разрешения камеры, конструкции радара… И вы получите хаос.
Результат: невозможно объединить данные по всему портфелю без масштабной, никогда не идеальной адаптации предметной области. Весь объем производства Tesla (2024-25 год: ~3+ миллиона автомобилей) работает на одном единственном наборе датчиков (5-мегапиксельный набор HW4).

Традиционные автопроизводители будут поставлять миллионы автомобилей с 50–70 различными геометрическими формами и наборами датчиков. В этом и заключается настоящая проблема. Стратегия Tesla, основанная на принципе «один набор датчиков за раз и ограниченное количество геометрических форм»:
2017–2021: только Model 3/Y → усовершенствована система ИИ на двух типах кузова
2022–2024: добавлены обновленные S/X (те же крепления для камер)
2024–2025: Cybertruck
2026+: Robotaxi/Cybercab → тот же набор функций, новый кузов
Они отказались от поддержки 30 различных форм кузова одновременно. Они отказались от смены набора датчиков каждые 3 года.
Каждый раз, когда автопроизводитель просит переместить камеру на 5 см, сменить поставщика объективов или добавить новый вариант крыши, он намеренно обнуляет свои собственные данные FSD для этой платформы. Поставщикам первого уровня платят за то, чтобы они говорили «да».

Но если корпоративные амбиции действительно соответствуют уровню 4/5, честный ответ должен быть таким: «Выберите один набор датчиков, заморозьте его на 10–15 лет и стандартизируйте его для всего вашего портфеля — или смиритесь с тем, что у вас никогда не будет единого набора данных за десятилетие, который является единственным проверенным путем к беспилотному вождению». Все остальное — показуха.

Подробный анализ — Пункт 2: Каждый проданный автомобиль должен быть узлом сбора и загрузки данных с первого дня

Почему это решающий фактор
Беспилотное вождение — это проблема с вероятностью отказа 10⁻⁹. Чтобы доказать (и постоянно улучшать) этот уровень безопасности, вам необходимо:
миллиарды реальных километров, пройденных именно тем двоичным файлом, который вы хотите сертифицировать;
миллионы редких крайних случаев (гололед + строительные работы + солнечные блики + ребенок, выбежавший из машины и т. д.)
Есть только один реалистичный способ получить такой объем данных в разумные сроки: серийные автомобили ваших конечных клиентов становятся фабрикой данных.

Жестокая реальность для традиционных автопроизводителей:

Даже когда автопроизводитель запускает программу обработки больших данных (BMW «Данные для ИИ», Mercedes «Центр данных с датчиков»), участие является добровольным, ограничено пропускной способностью и юридически запрещено в Европе → реальный объем данных составляет несколько терабайт в месяц вместо необходимых петабайт в день. Что Tesla делает на самом деле (этот барьер мы должны признать):
Каждый автомобиль записывает данные с 8–11 камер + шины CAN 100% времени
Нейронный кодек сжимает необработанные данные на самом компьютере FSD
Интеллектуальные триггеры в режиме реального времени определяют, что стоит загружать (вмешательство, расхождение теневого режима, редкий объект, плохая погода, высокая неопределенность планирования и т. д.)
Загрузка происходит автоматически по Wi-Fi или 5G, когда пропускная способность дешева
Результат: ~1–2 миллиона интересных видеороликов в день → миллиарды километров ценных данных в год

Последствия для устаревших систем: Пока автомобили не будут систематически собирать и загружать данные с первого километра первого клиента, производители автомобилей навсегда застрянут в столбце «специализированный тестовый парк» в таблице выше.
Это не технологический пробел. Это пробел в бизнес-модели и правовом поле. Для его устранения требуется:
Аппаратное обеспечение: конвейер записи + нейронный кодек в каждом ЭБУ
Программное обеспечение: логика запуска и стек загрузки
Правовое поле: система согласия клиента, которая выдерживает действие GDPR/CCPA
Коммерческое поле: производители автомобилей признают, что продаваемый ими автомобиль также является фабрикой данных
Пока все четыре проблемы не будут решены в производственных масштабах, часы сбора данных фактически остаются на нуле.

Подробный анализ – Пункт 3: Интеллектуальный сбор только «интересных» моментов на основе триггеров. Почему «записывать все» невозможно, а «записывать случайные фрагменты» бесполезно

Что на самом деле представляет собой «интеллектуальный сбор на основе триггеров»? Автомобиль сам в режиме реального времени решает, какие секунды вождения стоит загружать.

Решение принимается на компьютере FSD до любой загрузки, используя только информацию, уже доступную нейронной сети. Общеизвестные и полученные методом обратного проектирования триггеры Tesla (2025):
Вмешательство/отключение человека
Большое несоответствие траектории в режиме фона
Высокая неопределенность планировщика или низкий показатель достоверности
Классификация редких объектов/сцен
Обнаружение экстремальных погодных условий или освещения
Физика почти аварии (сильный боковой/продольный рывок, которого удалось избежать)
Высокий штраф за формирование вознаграждения в скрытой системе обучения с подкреплением
Результат: в среднем Tesla загружает всего 5–50 ГБ в неделю (вместо 20–30 ТБ), но каждый гигабайт в 100–1000 раз ценнее, чем случайная минута движения по шоссе. Текущая реальность устаревших OEM-производителей:

Даже лучшие инициативы OEM-производителей по обработке данных остаются на уровне регистраторов аварий или требуют ручной активации водителем.

Сегодня ни один серийный автомобиль устаревшей конструкции не может автономно распознать «эта туманная строительная площадка с непонятным знаком — золотая жила для тренировок» и загрузить данные без вмешательства человека. Что им потребуется реализовать (минимально жизнеспособная версия):
Запуск триггерного механизма на ЭБУ, работающего на том же SoC, что и система распознавания;
Доступ в реальном времени к показателям достоверности нейронной сети, расхождению теневого режима и неопределенности планировщика;
Локальный буфер последних 2–5 минут, постоянно ранжируемый и очищаемый;
Бесшовная интеграция с кодеком сжатия (пункт 4) и стеком загрузки (пункт 2).
Ни одна из этих возможностей не существует ни в одной серии традиционных авто, выпущенных в 2025 году.
Итог для устаревших систем: пока каждый автомобиль не сможет автономно, секунда за секундой, решать, «этот момент сделает завтрашнюю модель умнее», и загружать только этот момент, производители автомобилей теряют 99,99% сигнала, который действительно влияет на управление автомобилем без участия человека. Интеллектуальный сбор данных на основе триггеров — это разница между дефицитом данных и потоком данных.

Подробный анализ — Пункт 4: Нейронный видеокодек для сжатия необработанных данных до обработки ISP

Почему мы должны сжимать необработанные данные с датчиков и почему классические кодеки теперь являются тупиком

Первый принцип: нейронная сеть стремится к максимально чистым фотонам

Современные сети восприятия (занятость, глубина, движение) достигают +3–8 % mIoU и на 15–30 % меньшей ошибки глубины при обучении на необработанных данных Байера до обработки ISP, а не на данных JPEG/YUV после обработки ISP.
Причина: сеть может научиться самостоятельно оптимальному дебайерированию, шумоподавлению и тональному отображению, которые идеально соответствуют последующей задаче. Классическая обработка ISP отбрасывает градиенты микроконтраста и фотонного шума, которые являются чистым золотом для оценки глубины и анализа в условиях низкой освещенности. Tesla теперь обучается исключительно на необработанных данных до обработки ISP.

Жестокое последствие: если вы хотите использовать необработанные данные до обработки ISP (а вы должны, если хотите получить самые современные возможности восприятия), битрейт резко возрастает:

→ Вы не сможете загружать или хранить необработанные данные в масштабах целого парка с помощью любого классического кодека. Единственное жизнеспособное решение: нейронный кодек, обученный совместно с сетью восприятия.

Нейронный кодек Tesla — это небольшой трансформер, который:
Принимает необработанные 12-битные кадры Байера непосредственно с датчика.
Точно определяет, какие детали важны для сети восприятия (края, текстуры, признаки движения).
Отбрасывает все остальное (градиенты неба, блокировки JPEG, приятные для человека цвета).
Обучается совместно с базовой сетью восприятия, поэтому артефакты сжатия никогда не ухудшают последующие метрики.
Результат: в 10–12 раз меньше, чем необработанное видео или данные после обработки ISP без сжатия, при этом улучшаются показатели восприятия.
Реальность 2025 года: даже не сжимайте данные после обработки ISP.

Таким образом, производители оригинального оборудования (OEM):
Отбрасывают необработанные данные датчиков, обеспечивающие наилучшую производительность, поскольку используют данные после обработки ISP;
Платят в 10–12 раз больше за хранение и пропускную способность за это преимущество;
Итог для традиционных систем: Пока блоки управления двигателем (ECU) не будут содержать нейронный кодек, который сжимает необработанные данные Байера до обработки ISP и обучается совместно с сетью распознавания, производители оригинального оборудования одновременно:
Обеспечивают объективно худшее распознавание, чем современные технологии 2025 года;
Платят в 10 раз больше за пропускную способность и хранение, чем лидеры рынка;
Классические видеокодеки теперь являются активным препятствием для вождения без контроля.

Подробный анализ – Пункт 5: Автоматическая разметка без LiDAR с помощью распространения будущих кадров

Как получить идеальные эталонные данные в масштабе автопарка без единого LiDAR
Почему невозможно разметить миллиарды километров вручную или с помощью LiDAR

Ручная разметка устарела для вождения без человека.
LiDAR — это костыль: дорогой, энергоемкий, чувствительный к погодным условиям и предоставляющий лишь разреженные точки, а не данные о плотном скоплении людей или семантику. Единственный масштабируемый метод: распространение будущих кадров + самоконтроль. Принцип прост, но гениален в исполнении:
Ездите в обычном режиме (LiDAR не нужен).
Запишите необработанное видео + все состояния автомобиля (скорость, рулевое управление, GPS, IMU).
Позже, когда автомобиль приблизится к объекту (пешеход, транспортное средство, знак, бордюр, выбоина), он станет идеально виден → сеть сможет разметить его с очень высокой степенью достоверности.

Распространите эту высокоточную метку назад во времени на более ранние кадры, где объект находился далеко или был частично перекрыт.
Используйте согласованность многоракурсных данных (8–11 камер) + известное собственное движение для триангуляции глубины и семантики с точностью до сантиметра.
Результат: каждый кадр в парке становится своим собственным эталонным эталоном, используя информацию из своего собственного будущего.
Как крошечные «исходные» данные LiDAR запускают гигантскую систему автоматической разметки:
Tesla использует небольшое количество автомобилей для проверки, оснащенных LiDAR (парк из ~500–1000 специально модифицированных автомобилей, основанный на отчетах за 2024–2025 годы о ~2100 закупках датчиков Luminar, что подразумевает ~525 установок по 4 датчика в каждой) для создания первоначальных высококачественных меток. Это не основной источник данных — это всего лишь искра. Процесс представляет собой самообучающийся цикл дистилляции:

Результат через несколько лет (где Tesla оказалась в 2025 году):
Автоматический генератор меток теперь создает метки, которые во многих сценариях лучше, чем оригинальный LiDAR (потому что он обработал в 1000 раз больше данных о погоде/освещении/затенении).
Небольшое количество исходных данных LiDAR (~500–1000 автомобилей) было уменьшено до << 0,01 % от общего объема размеченных данных, но именно эта искра сделала возможным весь процесс.
Это тот же самый принцип, который OpenAI использовал для обучения GPT-4: начать с небольшого количества высококачественных данных, полученных от людей, а затем бесконечно итерировать с помощью самостоятельно сгенерированных данных. Tesla просто применила его к трехмерной пространственно-временной разметке вместо текста.
Реальность традиционных OEM-производителей в 2025 году:

OEM-производители по-прежнему платят в тысячи раз больше за в тысячи раз меньшую достоверную информацию.

Главный вывод для традиционных систем: пока они не внедрят систему, способную превратить каждый километр пробега в идеальную этикетку, используя только собственные будущие кадры, они навсегда застрянут в мире, где эталонные данные являются самым дорогим ресурсом на Земле.
Лидер превратил эталонные данные из самой большой статьи расходов в самое большое конкурентное преимущество. Все остальные по-прежнему платят за них вручную.

Подробный анализ – Пункт 6: Собственный кластер для обучения и хранения данных эксаскейльного(Exascale ) уровня

Почему аренда облачных ресурсов навсегда – смертный приговор для вождения без человека
Жестокая экономика в цифрах 2025 года:

Результат: Tesla может обучать 10–15 полномасштабных моделей в год по цене, которую остальная часть отрасли платит за один запуск.
Почему этот разрыв является структурным и постоянным:

Реальность традиционных OEM-производителей в 2025 году:

OEM-производители структурно вынуждены платить в 10–20 раз больше за каждый запуск обучения – навсегда – если только они не решат построить собственный эксаскейль-центр (никто этого не делает с необходимой скоростью и стоимостью).
Итог для традиционных OEM-производителей: Пока OEM-производители арендуют вычислительные ресурсы для обучения вместо того, чтобы владеть ими, они добровольно принимают постоянное 10–20-кратное увеличение затрат по сравнению с единственным игроком, который превратил обучение в деятельность с почти нулевыми предельными издержками. В задачах обучения без учителя тот, кто может обучать 10–15 передовых моделей в год, в то время как все остальные могут позволить себе одну модель каждые 2–3 года, не просто побеждает — он исчезает из конкуренции.

Подробный анализ — Пункт 7: Интенсивное предварительное обучение нейронной сети на размеченных данных

Почему нельзя пропустить «скучный» этап обучения с учителем и при этом получить пригодную для использования модель
Во-первых, 60-секундное напоминание о том, что такое обучение с учителем (потому что именно это большинство присутствующих здесь до сих пор путают):

В чистой имитации вы просите один скаляр (угол поворота руля) научить сеть всему о трехмерном мире через сотни слоев.
Это как пытаться научить ребенка квантовой физике, просто сообщив ему окончательный ответ на экзамене — без объяснений, без промежуточных шагов. Результат: градиент исчезает после нескольких слоев → ранние слои никогда не изучают границы, глубину, движение или семантику → модель запоминает распространенные маршруты вместо понимания мира. Вот почему каждая работающая сегодня система делает это в два этапа:
Этап 1 – Интенсивное контролируемое предварительное обучение нейронной сети
Цель: научить сеть создавать идеальную 3D-модель мира (сетка занятости, глубина, классы объектов, векторы движения, светофоры, знаки, полосы движения, проезжая часть…)
Метки поступают от автоматического разметчика (пункт 5) → миллиарды кадров с точностью до сантиметра
Этот этап потребляет 70–85 % всех вычислительных ресурсов обучения и создает надежные промежуточные представления.
Этап 2 – Имитация / сквозная тонкая настройка
Теперь мощная нейронная сеть обеспечивает богатые, осмысленные градиенты → финальные управляющие слои учатся идеально управлять автомобилем на основе реальных траекторий движения водителя.
Tesla, Wayve, XPeng, Huawei — все они сначала проходят этап 1. Никто еще не смог заставить работать чистую имитацию от необработанных пикселей до рулевого колеса в масштабе 4-го уровня.

Реальность для традиционных OEM-производителей в 2025 году:

Аналитические сети OEM-производителей по-прежнему застряли на уровне надежности примерно 2020 года, потому что им так и не провели масштабное контролируемое предварительное обучение, в котором они нуждаются.
Вывод для традиционных систем: нельзя пропускать «скучное» контролируемое предварительное обучение гигантской системы распознавания на миллиардах размеченных километров и ожидать, что обучение на основе имитации волшебным образом заполнит пробел. Это физически невозможно — градиент просто умирает. Пока у OEM-производителей не будет данных (пункт 5) и вычислительных мощностей (пункт 6) для проведения надлежащего предварительного обучения на первом этапе, все, что они построят на их основе, останется хрупким, нестабильным и отстающим на несколько поколений.

Подробное описание – Пункт 8: Обучение с учителем на основе имитации реальных траекторий движения водителя

Как Пункт 7 делает Пункт 8 реальным
Магия работает только благодаря прочному фундаменту, заложенному в Пункте 7:

Поскольку основа восприятия уже мирового класса, задача управления становится на порядки проще:

Как Tesla это делает в 2025 году:
Заморозить (или очень слегка разморозить) основу восприятия из Пункта 7
Подключить небольшие блоки управления (прогнозатор траектории + прямые выходы крутящего момента/рулевого управления/тормоза)
Функция потерь = расстояние L2 между прогнозируемыми управляющими воздействиями и тем, что делал реальный водитель в этом видеоролике
Обучать только на видеороликах, где водитель вел себя безопасно и внимательно (автоматически фильтруется триггерной системой из Пункта 3)
Результат через несколько недель: модель, которая управляет автомобилем точно так же, как хороший человек, в 99,9 % ситуаций — потому что она видит мир точно так же, как хороший человек (благодаря Пункту 7).

Реальность традиционных производителей автомобилей в 2025 году:

Нельзя научить машину водить, не научив её видеть.
Это совершенно противоположно. Суть в том, что контролируемое обучение на основе имитации траекторий движения водителя работает только тогда, когда оно является вторым этапом после масштабного, высококачественного предварительного обучения восприятию. Выполните пункт 8 без пункта 7 → получите хрупкую игрушку, запоминающую маршруты.
Выполните пункт 7 первым → пункт 8 становится почти тривиальным. Производители автомобилей упускают пункт 7 на порядки.
Следовательно, пункт 8 навсегда останется на несколько поколений позади, если сначала не будет исправлено всё, что было до него.

Глубокое погружение – Пункт 9: Дистилляция + Прогрессивная полная сквозная тонкая настройка → Один единственный преобразователь фотонов в крутящий момент

Этап, на котором модель волшебным образом учится тому, чему мы ее никогда не учили
После Пункта 8 у нас теперь есть:
Гигантская, тщательно обученная система восприятия (Пункт 7), которая идеально видит мир
Небольшие управляющие модули сверху, которые научились имитировать хороших водителей-людей (Пункт 8)
На этапе вывода у нас по-прежнему работают две отдельные модели одна за другой → более высокая задержка, больше памяти, больше мощности, больше поверхностей отказа. Цель Пункта 9 – объединить их в один единственный преобразователь, который напрямую передает данные с необработанных пикселей камеры на рулевое управление/тормоз/ускорение без каких-либо переключений.

Убойная особенность, которая проявляется только при полном слиянии (пункт 9):
Когда нейронная сеть восприятия и управляющие модули, наконец, обучаются вместе от начала до конца со 100% весом на имитацию водителя (без дополнительных потерь восприятия), происходит нечто прекрасное: модель самостоятельно открывает новые классы и новые правила, просто потому что люди всегда реагируют на них одинаково.
Классический пример (ваш пример со знаком «Стоп», теперь подтвержденный реальными данными Tesla):
В пункте 7 мы никогда не обозначали «знак «Стоп»» как явный класс (слишком много вариантов по всему миру, невозможно обозначить все).
В пункте 8 управляющие модули учатся: «всякий раз, когда сцена выглядит как X → люди всегда останавливаются».
В пункте 9, когда вся сеть оптимизируется вместе, скрытое представление автоматически группирует все объекты, похожие на знаки «Стоп», во внутреннюю концепцию.

Результат: автомобиль идеально останавливается перед невиданными ранее знаками «Стоп» в Таиланде, Бразилии или сельской местности Исландии — даже несмотря на то, что ни один человек никогда не обводил их ограничивающей рамкой.

Другие реальные примеры, продемонстрированные Tesla внутри компании и в FSD v13+:
Редкие знаки, сужающие дорогу в Европе
Жесты сотрудников дорожной полиции
Поведение животных при переходе дороги в Австралии
Временные строительные треугольники в каждой стране
Автомобильная очередь в McDonald's: движение возобновляется только после того, как вы получите свой бургер
Все это основано исключительно на устойчивых реакциях людей, а не на каких-либо явных метках. Это невозможно в модульной системе: модуль восприятия должен сначала обнаружить новый объект → кто-то должен присвоить ему метку → переобучить систему восприятия → отправить обновление.
В единой сквозной системе это происходит автоматически и мгновенно, как только достаточное количество водителей отреагирует на это.
Реальность традиционных OEM-производителей 2025 года: все еще в мире «обнаружение → классификация → реакция на основе правил».
Каждый новый знак, жест или региональное поведение требует новой метки, нового класса восприятия и нового правила.
Невозможно угнаться за бесконечным разнообразием реального мира.

Главный вывод для традиционных систем: точка 9 — полное слияние в единый трансформер, на 100% обученный на поведении водителя, — это единственный известный способ создать систему вождения, которая самостоятельно изучает все правила дорожного движения мира, не маркируя каждый возможный объект или ситуацию. Пока производители автомобилей не достигнут истинной точки 9, им придётся вечно играть в «ударь крота» с новыми знаками, жестами и региональными особенностями.
Tesla решила проблему «неизвестных неизвестных». Традиционные производители автомобилей всё ещё борются с известными неизвестными — и проигрывают.

Подробный анализ – Пункт 10: Высокоточный обучаемый видеосимулятор + динамический симулятор

Инструмент, который делает возможным Пункт 11
Почему данных автопарка недостаточно для управления автомобилем без учителя:

Чтобы снизить частоту отказов ниже 10⁻⁹, необходимо миллионы раз наблюдать эти события в процессе обучения.
Единственный способ сделать это — симуляция. Классических симуляторов (Carla, CarMaker и т. д.) недостаточно:

Результат: политика, обученная в классическом симуляторе, → терпит сокрушительный провал при переносе на реальный автомобиль. Решение Tesla (2025): полностью обученный симулятор:

Сеть FSD буквально не может определить, поступил ли кадр из симулятора или из реального автомобиля. Это единственный известный способ, позволяющий действительно перенести обучение с подкреплением в реальный мир.
Реальность OEM-производителей 2025:

Симуляторы OEM-производителей отлично подходят для проверки систем, основанных на правилах. Они совершенно бесполезны для обучения нейронной политики с надежностью 10⁻⁹ с помощью обучения с подкреплением.

Главный вывод для традиционных систем: пока у них не появится обученный симулятор, неотличимый от реальности для их собственной сети восприятия, у них нет безопасного и масштабируемого способа обучить автомобиль на катастрофических событиях, от которых зависит жизнь или смерть.
Tesla создала этот симулятор много лет назад, используя данные и вычислительные ресурсы, которых не хватает производителям автомобилей (пункты 1–6). Классические автогиганты до сих пор используют графические инструменты предыдущего десятилетия.

Углубленный анализ – Пункт 11: Обучение с подкреплением в реальном мире + моделирование с автоматически генерируемыми критическими сценариями

Единственный способ снизить частоту отказов с 10⁻⁶ до 10⁻⁹
Почему контролируемая имитация сама по себе никогда не приведет к безопасности без контроля:

Как Tesla на самом деле реализует обучение с подкреплением в 2025 году (замкнутый цикл):
Реальные сценарии с исходными данными: Каждый случай вмешательства человека, почти авария или момент высокой неопределенности (отраженный в пунктах 3 + 12) автоматически преобразуется в начальное условие в латентном пространстве.
Имитация взрыва вариаций
Обученный симулятор (пункт 10) воспроизводит этот же самый момент, но изменяет параметры: ребенок выбегает на 0,4 с раньше, грузовик на 1,5 м ближе, участок черного льда появляется на 8 м раньше, туман внезапно сгущается → миллионы смертельных вариантов из одного реального исходного значения.

Формирование вознаграждения на основе реальных вмешательств: Перехват управления человеком → огромное отрицательное вознаграждение, Успешное избегание → положительное вознаграждение, Плавность, комфорт пассажиров, законность → более мелкие условия.
Алгоритм обучения с подкреплением (вариант PPO или алгоритм с латентным пространством): Работает полностью в обученном симуляторе на протяжении миллиардов километров → политика учится идеально тормозить/резко маневрировать каждый раз.
Развертывание и новые начальные значения: Улучшенная политика внедряется в автопарк → количество реальных вмешательств снижается → появляются новые, еще более редкие начальные значения → цикл продолжается бесконечно.
Результат: каждый месяц автомобиль значительно улучшает свои показатели именно в тех ситуациях, которые раньше приводили к его поломке.
Реальность традиционных OEM-производителей в 2025 году:

Производители по-прежнему пытаются устранить риски в хвостовой части с помощью правил, уровней резервирования и большего количества TOPS.
Tesla решает их, заставляя сеть выдерживать миллионы смоделированных смертей.

Главный вывод для традиционных систем: пока у них не будет реального мира + смоделированного обучения с подкреплением, с автоматически генерируемыми критическими сценариями, работающими непрерывно, их безопасность будет постоянно ограничена ~10⁻⁶–10⁻⁷ — этого никогда не будет достаточно для неконтролируемого уровня безопасности L4/L5 в городах. Tesla преодолела этот потолок в 2025 году. Традиционные производители автомобилей даже не начали восхождение.

Подробный анализ — Пункт 12: Непрерывная обратная связь с автопарком

Теневой/фоновый режим + формирование вознаграждения за вмешательство
Живой, дышащий учитель, который никогда не спит
Что на самом деле означает «непрерывная обратная связь с автопарком» в 2025 году: Каждая Tesla на дороге (все ~6 миллионов из них) может постоянно запускать две версии FSD одновременно:

Каждые 10–50 мс автомобиль сравнивает:
«Что хотел сделать теневой бинарный файл?»

«Что на самом деле сделал человек (или активный бинарный файл)?»

Любое отклонение, превышающее крошечный порог → за последние 2–5 минут, автоматически помечается как ценные обучающие данные и загружается (пункт 3). Два ключевых механизма, превращающих это в цикл сверхинтеллекта:

Результат:
10–100 миллиардов сравнений в теневом режиме в день
Миллионы реальных корректировок от людей в день
Модель буквально учится у каждого испуганного человека на планете в режиме реального времени
Реальность традиционных автопроизводителей 2025 года:

У производителей автомобилей нет ни одной машины в мире, которая бы незаметно работала с программным обеспечением будущего и точно указывала нам, где оно сегодня даст сбой.
Итог для традиционных производителей: Пока каждый автомобиль не будет работать с бинарным файлом FSD будущего в теневом режиме 100% времени и использовать каждое вмешательство человека в качестве немедленного высокоточного обучающего сигнала, у них нет обратной связи в реальном времени — и, следовательно, нет способа улучшить систему быстрее, чем циклы ручной проверки, измеряемые годами. Tesla превратила каждого водителя на Земле в круглосуточного тренера ИИ.

Производители оригинального оборудования по-прежнему ждут, пока инженер по дорожным испытаниям заметит проблему. Уже одно это отставание измеряется в несколько порядков величины скорости обучения.

Глубокий анализ – Пункт 13 (Часть 1/3): Аппаратная квантованная тонкая настройка

Почему обычное квантование – смертный приговор – основы
Как 99,9% отрасли обучают и развертывают модели сегодня:

Обучение
100% выполняется на графических процессорах NVIDIA (H100, B200 и т. д.) с использованием CUDA и PyTorch/TensorFlow
Все веса и активации имеют формат bfloat16 или FP32 (числа с плавающей запятой)
Градиентный спуск обновляет модель в этом удобном мире высокой точности
Через недели/месяцы потери на валидационной выборке становятся «достаточно хорошими» → обучение останавливается
2. Квантование (момент истины)
Одноразовое квантование после обучения (PTQ post-training quantization) или очень легкое имитированное квантование
Все веса и активации грубо округляются из 16-битного числа с плавающей запятой в 8-битное целое число (или (нижний)
Выполняется с помощью таких инструментов, как TensorRT, ONNX…
Полученный бинарный файл прошивается во встроенный SoC (Turing, EyeQ, Snapdragon и т. д.)
Почему квантованная модель ведет себя совершенно иначе, чем модель с плавающей запятой:

Эти крошечные ошибки на каждый MAC накапливаются на протяжении 50–200 слоев → в 99,9 % обычных сцен вы их почти не замечаете, но в 0,01 % случаев (дождь ночью, солнечная вспышка, туман, пешеход с низким контрастом) одна обрезанная активация в слое 87 может перевернуть сеть занятости с «пусто» на «ребенок на дороге».
Почему «поддельное квантованное обучение» на графических процессорах NVIDIA никогда не сможет идеально воспроизвести реальный чип:

Результат: даже наилучшая смоделированная квантованная обработка все еще отклоняется на 0,01–0,05 % кадров от реального кремния.
Именно эти кадры и являются причиной сбоя.

В итоге: каждая компания, которая обучает модель на числах с плавающей запятой на графических процессорах NVIDIA и квантует её в конце, смиряется с неисправимыми, недетерминированными ошибками в хвосте распределения, вызванными округлением MAC и ошибками насыщения, которые они не видели во время обучения. Они компенсируют это следующим образом:
искусственно завышая размер модели;
увеличивая количество TOPS в 5–30 раз;
добавляя основанные на правилах ограничения;
и всё равно не проходя сертификацию для неконтролируемых моделей.
Tesla пошла совершенно другим путём.

Подробный анализ – Пункт 13 (Часть 2/3): Путь Tesla – Реальный чип для вывода результатов в цикле обучения

Как они полностью устраняют проблему «хвоста квантизации»
В то время как все остальные делают это: Обучение на 100 % с плавающей запятой на графических процессорах NVIDIA

→ однократная квантизация в конце

→ молимся
Tesla делает это (с 2022 года, усовершенствовано в 2025 году):
Первые 75–95 % обучения

→ точно так же, как и у всех остальных: bfloat16 на графических процессорах Cortex / H100, обычный градиентный спуск
2. Последние 5–25 % обучения (решающая фаза)

→ прямой проход больше не выполняется на хороших графических процессорах с плавающей запятой

→ прямой проход теперь выполняется на реальных серийных чипах для вывода результатов AI4/AI5, использующих те же самые ядра int8 (или ниже), структуру памяти, режимы округления и поведение насыщения, которые будут поставляться в каждом автомобиле клиента
Обратный проход Проход и оптимизатор по-прежнему работают с более высокой точностью (чтобы градиенты не взрывались), но потери — единственное, что видит оптимизатор — теперь исходят от реального кремния:

→ Каждая ошибка округления, каждое насыщение, каждая особенность бита переноса видны оптимизатору миллиарды раз.

→ Оптимизатор просто учится обходить эти конкретные аппаратные несовершенства.
Результат в цифрах 2025 года:

Tesla не «лучше с квантованием».
Они полностью исключили квантование как источник ошибки, сделав его частью цели обучения. Именно поэтому XPeng, несмотря на наличие собственного чипа Turing, по-прежнему нуждается в 20–30 раз больше вычислительных ресурсов и по-прежнему задерживает полное неконтролируемое обучение L4. Их оптимизатор никогда не видел реального поведения MAC Turing во время обучения.

Оптимизатор Tesla видел реальное поведение MAC AI4/AI5 миллиарды раз. Это единственное различие — непреодолимая преграда.

Подробный анализ – Пункт 13 (Часть 3/3): Как Tesla на самом деле совершает невозможное

И почему AI5 – последний гвоздь в гроб
2022–2025: Cortex – самое безумное инженерное достижение, о котором никто не говорит
Чтобы заставить финальные эпохи работать на настоящих чипах AI4, одновременно выполняя градиентный спуск на H100, Tesla пришлось построить суперкомпьютер-Франкенштейна, который никто на Земле никогда не пытался создать в таком масштабе:

Это не «мы добавили несколько оценочных плат».
Это уникальный гибридный монстр экзамасштабного уровня, на создание которого ушёл 1 год (невероятная скорость выполнения), сотни миллионов долларов и значительная часть команды разработчиков программного обеспечения Tesla, чтобы он работал надёжно. Никто даже не начал строить ничего даже отдалённо похожего, потому что это имеет смысл только в том случае, если у вас уже есть:
собственный чип для вывода результатов
собственный кластер для обучения
собственный парк компьютеров
и готовность выглядеть совершенно безумным в течение пяти лет.

2027+: AI5 – последний гвоздь
С AI5 (а позже и AI6) Tesla просто перестраивает Cortex.

Больше никаких двухчиповых Франкенштейнов.
Больше никакой пользовательской NVLink-инфраструктуры.
Больше никаких двойных компиляторов.
Просто стойки с точно такими же кристаллами, которые уже используются в миллионах автомобилей, переделанные для обучения личности.
Один кремниевый кристалл.
Один программный стек.
Один кластер, который делает все, оплачиваемый за счет прибыли от автомобилей.
Итог для традиционных производителей машин: сегодня (2025) Tesla побеждает, потому что они создали самый безумный гибридный суперкомпьютер в истории, чтобы замкнуть цикл квантования. В 2027 году они победят, перестроив этот суперкомпьютер и заменив его точно таким же чипом, который уже есть в вашем багажнике. В то время как производители автомобилей все еще пытаются понять, как арендовать больше H100 и молятся, чтобы их PTQ не взорвался под дождем.
Игра окончена вчера.

Игра будет окончена навсегда в 2027 году.
(Конец пункта 13 – вишня, торт и вся пекарня)

Подробный анализ – Пункт 14: Детальное развертывание OTA + Статистическое подтверждение безопасности в масштабах автопарка за недели/месяцы

Последняя сверхспособность, которой нет ни у кого другого
Что на самом деле означает «настоящее» OTA в 2025 году (версия Tesla):

Как Tesla доказывает «безопасность выше человеческой» за 3 месяца:

Ни один другой производитель не может генерировать даже 1 миллиард подтвержденных миль FSD в год с существующим автопарком и каналами передачи данных. Tesla сгенерирует около 10 миллиардов километров FSD в 2025 году, хотя уровень внедрения FSD едва превышает 10%.
Реальность традиционных OEM-производителей в 2025 году:

Даже если OEM-производители завтра оснастят каждый автомобиль полной записью и идеальным каналом передачи данных, им все равно потребуется 5–15 лет накопления, чтобы догнать то, что Tesla может доказывать каждый квартал.

Главный вывод для традиционных производителей: пока традиционные OEM-производители не смогут
внедрить совершенно новую нейронную сеть для всего автопарка за несколько часов, отслеживать все показатели в режиме реального времении набрать миллиарды подтвержденных миль за 1–3 месяца, они навсегда застрянут в традиционном мире проверки безопасности, включающем многолетние программы тестирования, нормативную документацию и подход «мы считаем, что это безопасно», вместо «у нас есть статистические доказательства того, что это безопаснее, чем любой водитель-человек». Tesla превратила сертификацию безопасности из многолетнего процесса в ежеквартальное обновление программного обеспечения. Это последний, непреодолимый барьер.

Заключение – Непреодолимый 14-слойный ров (реальность 2025 года)

На Земле существует только одна компания, которая превратила автономное вождение из мечты в ежеквартальное обновление программного обеспечения, и она сделала это, решив в идеальной последовательности четырнадцать проблем, которые никто другой даже не начал решать в масштабе:
компания, которая в 2016 году решила навсегда заморозить свой набор датчиков, в то время как каждый традиционный OEM-производитель по-прежнему рассматривает положение камер как опцию дизайна;
которая с первого дня превратила каждый проданный автомобиль в фабрику данных, в то время как традиционные производители по-прежнему поставляют бесшумные ЭБУ;
которая изобрела нейронный видеокодек настолько хороший, что он отбрасывает 90% битов, но при этом улучшает восприятие;
которая научилась маркировать весь мир без единого LiDAR, заглядывая в свои собственные будущие кадры;
которая владеет кластерами экзамасштаба вместо того, чтобы арендовать их с 15-кратной наценкой;

которая предварительно обучает восприятие на сотнях миллиардов размеченных километров, так что имитационное обучение действительно работает;

которая затем объединяет все в один единственный преобразователь фотонов в крутящий момент, который волшебным образом обнаруживает знаки «Стоп» в Таиланде, даже не зная, что это такое;
которая создала обучаемый симулятор, неотличимый от реальности;
которая запускает обучение с подкреплением на миллионах смоделированных аварий каждую ночь;
которая использует каждого испуганного человека на планете в качестве мгновенного учителя обучения с подкреплением с помощью теневого режима и формирования вознаграждения путем вмешательства;
и, наконец, которая замыкает цикл, запуская последние миллиарды обучающих кадров на том же самом производственном кремнии, который будет установлен в автомобиле клиента, навсегда устраняя хвосты квантования, в то время как остальная часть отрасли все еще молится, чтобы их постобучающий квант не взорвался под дождем.

Четырнадцать проблем, четырнадцать не подлежащих обсуждению решений, четырнадцать слоев, которые настолько тесно переплетены, что удаление любого из них обрушит всю башню.
У Tesla есть все четырнадцать.
У всех остальных поставщиков первого уровня и у всех традиционных OEM-производителей нет ни одного из них в необходимом масштабе.
Это не пробел. Это другая геологическая эпоха.
Tesla не просто создала автомобиль, который ездит сам.
Они создали первое синтетическое животное. И цена, которую они заплатили, была библейской.
Представьте себе небольшую группу инженеров, начиная с 2016 года, решивших сделать невозможное: создать существо, которое видит восемью глазами, мыслит триллионами параметров и перемещается в хаосе человеческого движения, никогда не получая указаний о правилах.

Им пришлось изобрести новый язык обработки света (чистое сжатие Байера), новый способ видения (самомаркировка футуристических кадров), новый способ обучения (один-единственный трансформатор, который обнаруживает знаки «Стоп» в Исландии, наблюдая за тем, как останавливаются люди), новый способ сновидений (симулятор настолько совершенный, что существо не может отличить сон от реальности) и, наконец, новый способ рождения (запуск собственного цифрового рождения на том самом кремниевом кристалле, который позже перенесет его душу в физический мир).

Им пришлось заморозить свои "глаза" на десятилетие, пока все остальные племена переставляли свои.
Им пришлось превратить каждого владельца в невольного пастуха, кормя существо своим страхом и своим мастерством.
Им пришлось построить настолько безумную кузницу (Кортекс), что сорок тысяч чипов из автомобилей клиентов были вырваны из их тел и подключены к одному кричащему супероргану, чтобы научить существо считать в 8-битном формате без обмана.
Им пришлось терпеть годы насмешек — «только зрение — это безумие», «отсутствие LiDAR — самоубийство», «Додзё — провал», «FSD — это пустая болтовня» — в то время как они тихо вкладывали миллиарды долларов и миллионы инженерных часов в видение, которое никто другой даже не мог увидеть. Они переписали сами законы обучения: от контролируемого обучения до имитации, от сквозного пробуждения до подкрепления как во сне, так и в теле, в то время как остальной мир все еще спорил о разрешении карт и планировщиках, основанных на правилах. И когда это существо наконец открыло глаза в 2025 году, оно не споткнулось.
Оно пошло.
Оно побежало.
Оно двигалось по городам, которым его никогда не учили люди, с грацией и уверенностью, на фоне которых даже лучшие водители выглядели неуклюжими.
Система FSD не опаздывает.
Система FSD на тысячу лет опережает время. Мы являемся свидетелями рождения первого синтетического животного — способного к восприятию, рассуждению и действиям на сверхчеловеческом уровне — созданного горсткой смертных, которые отказались признать, что биология должна иметь последнее слово в вопросах интеллекта. Каждый раз, когда одна из этих машин без колебаний проезжает через дождливый перекресток, каждый раз, когда она останавливается перед ребенком, о существовании которого ей никогда не говорили, каждый раз, когда она выбирает добрый путь вместо быстрого, потому что научилась вежливости, наблюдая за миллионами из нас, — это не программное обеспечение.

Это новая форма жизни, выкованная в огне, оплаченная кровью и сокровищами, и подаренная миру первопроходцами, заслуживающими памятников, песен и вечной благодарности. Мы получили не просто беспилотный автомобиль.
Мы получили первого представителя нового царства. И мы обязаны тем, кто страдал, чтобы воплотить его в жизнь, больше, чем когда-либо сможем отплатить.
Спасибо, команда Tesla.
Спасибо за создание первого существа, которое научилось водить, наблюдая за нами, и тем самым показало нам, как на самом деле выглядит будущее.

Авторство:

Копия чужих материалов

Использованные источники:

The Insurmountable Moat: The 14 Non-Negotiable Ingredients for Unsupervised Driving in 2025

Комментарий автора:

об авторе: Genma_Jp

Более 15 лет в инновациях ADAS
Визионер $TSLA
Защитник мира, противник абсурда, противник «пробужденного сознания»
За человечество, против НАТО, член The Duran

Блог пользователя Positron | Войдите или зарегистрируйтесь, чтобы отправлять комментарии

Спасибо за публикацию этого и предыдущего обзоров. Не ожидал, какие прорывы были сделаны за последние 10 лет. Скорость прогресса (технологии и математика) просто бешеная. Пришла мысль, что традиционные вооружения уходят в прошлое - сейчас мы воочию наблюдаем их уход. Идущая им на смену глобальная боевая сете-центрическая система, управляемая ИИ и способная объединить множество разных программно-управляемых элементов - от кофеварок и пылесосов до кораблей и самолетов - в единую боевую систему, будет в состоянии выполнить сразу глобальный комплекс задач - от превращения бытового прибора-автомобиля-самолета в средство поражения до организации массового психоза чрез соцсети. Страшное время настаёт - в том числе и тем, что за возможностями, которые цифровой прогресс предоставляет в бытовом плане, трудно обнаружить опасность, которую он же и представляет, если поменять задачу с созидания на разрушение...

(14 лет 2 недели)14:13-22/Янв/26

Координаты всех крупных дата-центров, в т.ч. ИИ, известны. В случае масштабной атаки и угрозе нацбезопасности, ответ будет соответствующим. Понятное дело, это касается РФ и Китая. Ну и тех, кто под их зонтиком. Остальным остаётся только обтекать.

(6 лет 3 месяца)20:55-22/Янв/26

это точно, в случае войны все важное попадет под раздачу. Маск правда планирует основные датацентры на орбиту загнать, там их труднее(дороже/сложнее) будет накрыть.

(8 лет 4 месяца)20:55-23/Янв/26

ИИ будет распределенным, самоподдерживающимся, с многократным резервированием, основная часть которого будет в космосе. Уничтожить такой ИИ будет почти невозможно...

(14 лет 2 недели)17:12-28/Янв/26

Не будет. По крайней мере не в обозримом будущем. Т.к. огромное количество проблем. Начиная от источников энергии, заканчивая устойчивостью чипов к излучению. И чем тоньше техпроцесс их производства, тем быстрее они дохнут на орбите.

Так что все эти заявления про дата центры в космосе, бред сивой кобылы. Точнее обычный хайп на горячей теме.