
Midjourney: гайд для новичка 2026 — как пользоваться
Midjourney — это нейросеть, которая по текстовому описанию рисует изображения. Вы пишете словами, что хотите увидеть, а через несколько секунд получаете четыре варианта картинки. Сегодня это один из самых сильных инструментов для AI-арта: с его помощью делают концепты, постеры, обложки, рекламные кадры и, что особенно важно для нас в AIVFX, — опорные кадры для AI-видео. В этом гайде разберём Midjourney с нуля: где её запустить, как писать запросы, какие настройки реально нужны новичку и как из статичной картинки получить движущийся ролик.
Что такое Midjourney и где она доступна
Midjourney работает по принципу «текст в картинку» (text-to-image). Вы даёте описание — оно называется промпт — а модель генерирует изображение. Никакого фотошопа, кистей и слоёв: вся работа идёт через текст и несколько параметров. На 2026 год основная рабочая версия модели — V7, а в апреле 2026 на сайте появилась ещё более быстрая V8.1, которая лучше понимает детали промпта и умеет сразу выдавать картинки в разрешении 2K без отдельного апскейла.
Раньше Midjourney жила только внутри мессенджера Discord — это многих новичков отпугивало. Сейчас есть два способа работы, и оба входят в одну подписку:
- Веб-сайт midjourney.com — удобный сайт с галереей, ползунками настроек и редактором. Регистрация через Google-аккаунт, всё наглядно. Это рекомендованный путь для новичка.
- Discord-бот — старый способ через команды вида «/imagine». Даёт больше автоматизации и живую ленту, но требует разбираться в чат-командах. Опытные пользователи часто остаются на нём.
Совет простой: начинайте с сайта. Там та же самая модель, те же функции, но вместо заучивания команд вы просто кликаете по кнопкам и двигаете ползунки. Загрузить своё изображение как референс на сайте — это пара кликов, тогда как в Discord нужно сначала где-то разместить картинку, скопировать ссылку и вставить её в текст промпта вручную.

Регистрация и первый запуск — пошагово
Разберём по шагам, как сделать самую первую картинку через веб-версию. Бесплатного тарифа у Midjourney в 2026 году нет, поэтому понадобится платная подписка (про цены — ниже).
- Откройте сайт midjourney.com и нажмите «Sign In». Войдите через Google-аккаунт или Discord — отдельный пароль придумывать не нужно.
- Оформите подписку. На старте достаточно базового тарифа — этого хватит, чтобы попробовать инструмент на сотнях картинок.
- Найдите поле ввода вверху экрана — это строка для промпта. Именно сюда вы пишете описание того, что хотите получить.
- Введите простое описание на английском, например: «a cozy coffee shop interior, warm morning light, cinematic». Английский Midjourney понимает заметно лучше русского.
- Нажмите Enter. Через 30–60 секунд появится сетка из четырёх вариантов изображения.
- Выберите понравившийся вариант. Кнопки апскейла увеличивают и детализируют картинку, кнопки вариаций создают похожие версии, а кнопка повторного запуска генерирует новую четвёрку.
- Скачайте финал — наведите на изображение и сохраните его в полном разрешении.
Главный навык новичка — не «найти секретный промпт», а научиться итерациям. Первая картинка почти никогда не идеальна. Сгенерировали → посмотрели → поправили описание → сгенерировали снова. Так за 5–10 кругов вы приходите к нужному результату.
Как писать промпт — структура
Промпт — это не одно слово, а описание сцены. Чем конкретнее вы говорите модели, что хотите, тем точнее результат. Удобно держать в голове такую структуру: субъект → действие/поза → окружение → свет → стиль → технические детали.
Сравните. Слабый промпт: «a woman». Сильный промпт: «a young woman in a red wool coat, walking through a foggy Parisian street at dawn, soft diffused light, 35mm film photography, shallow depth of field». Второй вариант задаёт героиню, одежду, действие, место, время суток, характер света и стиль съёмки — и модель выдаёт намного более осмысленную картинку.

Несколько практичных правил для новичка:
- Пишите на английском. Модель обучена в основном на английских описаниях. Не знаете язык — переведите промпт через любой переводчик, это нормальная практика.
- Конкретика важнее длины. Не лейте воду из десятков прилагательных. Лучше пять точных слов («golden hour», «overcast», «neon») чем двадцать общих.
- Описывайте свет и стиль отдельно. Свет («backlight», «soft window light») и стиль («oil painting», «3D render», «photorealistic») сильнее всего влияют на настроение кадра.
- Уберите лишнее через Raw. Если хотите фотореализм без «художественной» автообработки модели, в новых версиях включается режим Raw — он убирает дефолтную стилизацию и точнее следует тексту.
Ключевые параметры — что реально нужно
Параметры — это короткие команды через два дефиса, которые дописываются в конце промпта. Их десятки, но новичку по-настоящему нужны четыре. Остальные осваиваются по мере необходимости.
- --ar — соотношение сторон (aspect ratio). Задаёт формат кадра. «--ar 16:9» — горизонтальное видео и обложки, «--ar 9:16» — вертикаль для Reels и Shorts, «--ar 1:1» — квадрат, «--ar 2:3» — портрет. Это первый параметр, который стоит запомнить.
- --v — версия модели (version). Указывает, какой моделью рисовать: «--v 7» для V7 или новую V8.1 на сайте. Если не указывать — берётся версия по умолчанию из ваших настроек.
- --sref — референс стиля (style reference). Вы даёте ссылку или загружаете картинку, и Midjourney перенимает её визуальный стиль (цвета, фактуру, настроение), не копируя содержание. Незаменимо, когда нужно выдержать единый визуальный язык во всей серии кадров.
- --cref / Omni Reference — консистентность персонажа (character reference). Самая важная функция для видео и серийного контента. Вы загружаете изображение героя, и модель сохраняет его лицо и внешность на разных кадрах. В V7 эта механика развилась в Omni Reference — она держит не только лицо, но и объекты, и узнаваемые детали гораздо точнее, чем раньше.
Почему --cref / Omni Reference заслуживает отдельного внимания: без него один и тот же персонаж на двух картинках выглядит как два разных человека. А для рекламного ролика или серии кадров критично, чтобы герой был узнаваемым от сцены к сцене. Именно эта функция превращает Midjourney из «генератора красивых случайных картинок» в инструмент для production.
Подписки и цены в 2026 году
Бесплатной версии у Midjourney нет — нужна подписка. На 2026 год четыре тарифа, оплата помесячно или раз в год (годовая даёт около 20% скидки):
- Basic — $10/мес. Стартовый тариф. Ограниченное число «быстрых» генераций в месяц. Подходит, чтобы попробовать и делать небольшие объёмы.
- Standard — $30/мес. Добавляет режим Relax Mode — неограниченную медленную генерацию. Самый ходовой выбор для тех, кто работает регулярно.
- Pro — $60/мес. Больше быстрых часов, режим повышенной приватности (Stealth) и более высокая пропускная способность для рабочих потоков.
- Mega — $120/мес. Максимальный объём для тех, кто генерирует картинки промышленными партиями.
Все тарифы дают доступ и к сайту, и к Discord-боту, и ко всем версиям модели. Новичку логично взять Basic на первый месяц, чтобы освоиться, а при регулярной работе перейти на Standard ради безлимитного Relax Mode — это самый выгодный режим, если вы не торопитесь и можете подождать пару минут на каждую генерацию.
Самое интересное: из кадра Midjourney — в AI-видео
Здесь начинается то, ради чего мы в AIVFX используем Midjourney как первый этап производства видео. Сама по себе Midjourney видео не делает — она рисует статичные изображения. Но эти изображения становятся идеальной отправной точкой для видеомоделей. Технология называется image-to-video («изображение в видео»): вы даёте готовый кадр, а нейросеть оживляет его — добавляет движение камеры, мимику, ветер, свет, динамику сцены.

Рабочий конвейер выглядит так:
- В Midjourney генерируете опорный кадр — продумываете композицию, свет, героя, стиль. Это даёт полный контроль над «картинкой» будущего видео.
- Если в ролике несколько сцен с одним героем — используете Omni Reference (--cref), чтобы персонаж оставался узнаваемым во всех кадрах.
- Готовый кадр загружаете в видеомодель: Kling, Runway, Google Veo или другие. Пишете короткий промпт движения — например, «камера медленно наезжает, героиня поворачивает голову».
- Видеомодель выдаёт клип на несколько секунд. Из таких клипов уже собирается полноценный ролик.
Почему это лучше, чем генерировать видео сразу из текста? Потому что при «текст в видео» вы почти не контролируете итоговую картинку — модель сама решает, как всё будет выглядеть. А связка «Midjourney → image-to-video» даёт полный контроль над визуалом на старте: вы сначала доводите кадр до идеала в спокойном режиме, и только потом оживляете его. Для рекламы, где важна каждая деталь и узнаваемость бренда, это решающее преимущество. Именно так строится значительная часть нашего пайплайна в AIVFX.
Частые ошибки новичков
- Слишком короткий промпт. «cat» даёт случайную кошку. Опишите породу, позу, фон, свет и стиль — результат изменится кардинально.
- Промпт на русском. Модель путается. Переводите на английский — это бесплатно и сразу поднимает качество.
- Перегруз противоречиями. «фотореализм в стиле акварельного мультика» сбивает модель с толку. Выбирайте один ведущий стиль.
- Игнор соотношения сторон. Сгенерировали квадрат, а нужна вертикаль для Reels — кадр придётся переделывать. Ставьте --ar сразу.
- Ожидание идеала с первого раза. Midjourney — это итерации. Один промпт, прогнанный 5–10 раз с правками, всегда лучше, чем один «волшебный» запрос.
- Попытка оживить неудачный кадр. Если статичная картинка слабая, видео из неё тоже будет слабым. Сначала доведите кадр, потом анимируйте.
Midjourney против Flux, Nano Banana и GPT Image
Midjourney — не единственный генератор изображений, и у конкурентов свои сильные стороны. Коротко, чтобы вы понимали ландшафт:
- Flux — отлично рисует фотореалистичные сцены и, главное, аккуратный текст на картинке (надписи, вывески, упаковка), с чем Midjourney традиционно справляется хуже. Хорош для дизайна, где нужны буквы.
- Nano Banana (Google) — силён в редактировании и точечных правках готовых изображений по текстовой команде: заменить объект, поменять фон, дорисовать деталь. Это скорее «умный редактор», чем чистый генератор с нуля.
- GPT Image — встроен в ChatGPT, удобен тем, что можно вести диалог и пошагово уточнять картинку обычными словами, без параметров. Берёт удобством, а не максимальным художественным качеством.
- Midjourney — лидер по художественной выразительности, кинематографичности и атмосфере кадра. Если нужна «вау-картинка» как основа для красивого видео — это всё ещё первый выбор.
Вывод простой: эти инструменты не конкуренты, а набор для разных задач. Нужна атмосферная сцена для ролика — Midjourney. Нужен текст на картинке — Flux. Надо отредактировать готовое фото — Nano Banana. Хотите поболтать и поправить картинку словами — GPT Image. В реальной работе мы комбинируем их, а Midjourney чаще всего стоит в начале цепочки как генератор опорных кадров.
Подытожим. Midjourney в 2026 — это зрелый инструмент, который освоит и полный новичок: регистрируетесь на сайте, пишете описание по структуре «субъект — окружение — свет — стиль», добавляете --ar для формата и --cref для консистентного героя, и за несколько итераций получаете кадр студийного уровня. А дальше этот кадр оживает в Kling, Runway или Veo — и у вас в руках готовый фрагмент видео. Связка «картинка → движение» и есть тот мостик, который превращает генерацию изображений в полноценное видеопроизводство.
Нужен AI-ролик для вашего бизнеса?
Опишите задачу — пришлём смету и сроки в течение дня. Готовый ролик за 72 часа.
Обсудить проект