Ноль ручного кода, миллион строк: OpenAI рассказала, как Codex построил продукт с нуля
Команда OpenAI за пять месяцев построила внутренний продукт объемом около миллиона строк кода — и ни один человек не написал ни строчки вручную. Весь код, включая логику приложения, тесты, CI-конфигурацию, документацию и внутренние инструменты, генерировали агенты Codex на базе GPT-5. По оценке компании, такой подход сократил время разработки примерно в десять раз.
Проект стартовал в конце августа 2025 года с пустого репозитория. За все время три инженера (позже — семь) открыли и смержили около 1 500 pull request'ов, что дает в среднем 3,5 PR на человека в день. При этом продуктом уже пользуются сотни людей внутри OpenAI и внешние альфа-тестеры. Принцип, который команда возвела в философию: "Люди направляют. Агенты исполняют".
Главное открытие — роль инженера радикально меняется. Вместо написания кода люди проектировали среду, формулировали намерения и строили петли обратной связи для агентов. Когда что-то ломалось, ответом было не "попробовать написать лучше", а "какой возможности не хватает агенту, чтобы справиться самому?". Документацию, например, организовали как навигационную карту: короткий файл AGENTS.md на ~100 строк со ссылками на структурированную папку docs/, а не монолитную инструкцию, в которой агент теряется.
Архитектурные ограничения проверялись механически — через линтеры и CI, а не через ревью. При таком темпе генерации кода энтропия растет быстро, поэтому команда ввела непрерывный автоматический рефакторинг: агенты не только пишут новый код, но и постоянно "убирают за собой". Со временем уровень автономии рос — от отдельных функций до сквозной разработки фич, когда агент сам воспроизводит баг, пишет исправление, прогоняет тесты и открывает PR.
OpenAI назвала этот подход harness engineering — "инженерия
Читать на habr.com