🎬 Module 4 sur 6

Images & Vidéo IA

Maîtrise la génération d'images et de séquences vidéo pour créer des B-Rolls professionnels. Apprends le langage cinématographique pour des prompts ultra-précis.

~45 min
6 sections
Intermédiaire

Rappel : l'importance des B-Rolls

Dans les modules précédents, tu as appris à écrire un script percutant et à choisir un avatar IA convaincant. Mais une vidéo UGC performante ne repose pas uniquement sur un visage qui parle à la caméra — les B-Rolls sont ce qui transforme un simple talking-head en contenu professionnel.

🎯 Qu'est-ce qu'un B-Roll ?

Un B-Roll est une séquence visuelle intercalée entre les plans de ton avatar (le A-Roll). Il sert à illustrer, démontrer et renforcer le message verbal. En UGC, les B-Rolls sont essentiels pour maintenir l'attention du spectateur et augmenter la crédibilité perçue.

💡
Règle des 3 secondes Un spectateur sur les réseaux sociaux décroche si le plan ne change pas toutes les 2 à 3 secondes. Les B-Rolls créent ce rythme visuel indispensable au scroll-stopping.

📊 Pourquoi les B-Rolls font la différence

📈

+40% de rétention

Les vidéos avec B-Rolls adaptés retiennent l'audience significativement plus longtemps que les talking-heads purs.

🎯

Crédibilité perçue

Montrer le produit en situation, des textures, des gros plans — tout cela renforce la confiance du spectateur.

Rythme narratif

Alterner A-Roll et B-Roll crée un rythme dynamique qui maintient l'attention et guide le regard.

🧠

Renforcement du message

Le cerveau retient mieux quand le visuel illustre le propos. "Texture veloutée" + gros plan = impact maximal.

🔁 Types de B-Rolls en UGC

📦 B-Roll Produit — Unboxing, gros plans, utilisation
Le B-Roll produit montre l'objet sous tous ses angles : textures, packaging, détails de finition. C'est le type le plus courant en UGC e-commerce. Avec l'IA, tu peux générer des visuels produit photoréalistes sans photographe ni studio.
🌍 B-Roll Lifestyle — Mise en situation, ambiance
Ce type place le produit ou le concept dans un contexte de vie : une cuisine, un bureau, une salle de sport. Il aide le spectateur à se projeter. L'IA excelle pour créer ces ambiances sans avoir besoin de tourner sur place.
📊 B-Roll Data/Texte — Chiffres clés, comparatifs
Statistiques animées, bullet points visuels, écrans de résultats — ce type de B-Roll renforce les arguments rationnels du script. Particulièrement efficace lors du bloc "Social Proof" de ton script UGC.
B-Roll Abstrait — Transitions, textures, mouvement
Des séquences purement visuelles et esthétiques : transitions fluides, particules, textures macro, mouvements cinématographiques. Elles rythment la vidéo sans ajouter d'information — mais créent une sensation de qualité premium.
🔥
Le game-changer de Hoox Grâce à l'IA générative intégrée dans Hoox, tu n'as plus besoin de stock footage payant ni de shooting. Tu génères tes B-Rolls images et vidéo directement depuis la plateforme, adaptés à ton script et à ta marque.

Génération d'images dans Hoox

Hoox intègre plusieurs modèles de génération d'images à la pointe de l'IA. Chacun a ses forces — mais un modèle se distingue clairement comme la référence absolue. Découvre-les tous et apprends quand utiliser chacun.

Démo génération d'images Hoox

▶ Vidéo démo — Génération d'images dans Hoox

⭐ LA RÉFÉRENCE

Nano Banana Pro (Google Gemini 3 Pro Image)

Nano Banana Pro est LE modèle de référence pour la génération et l'édition d'images IA dans Hoox. Basé sur Google Gemini 3 Pro, il représente une rupture technologique dans la qualité, la polyvalence et la rapidité de génération.

Résolution jusqu'à 4K
Génération en moins de 10s
Rendu texte multilingue précis
Synthèse guidée par raisonnement
Consistance de personnages
Fusion multi-images
Lightbox studio-grade control
Moteur GemPix 2
Pourquoi Nano Banana Pro est la référence Ce modèle combine le meilleur de tous les mondes : rapidité de génération (<10s), qualité photoréaliste 4K, rendu texte multilingue impeccable, et surtout une capacité unique de raisonnement visuel. Il comprend véritablement ce que tu veux grâce à la synthèse guidée par raisonnement. C'est ton choix par défaut pour 90% des cas d'usage.

🎨 Les autres modèles disponibles

🖼️

REve & Reve Fast

Reve Image 1.0 par Halfmoon AI. 12 milliards de paramètres, #1 au classement Artificial Analysis Image Arena. Typographie exceptionnelle (entraîné sur 50M d'échantillons de polices). 2K natif, upscale 4K.

Typographie

Flux 2 Pro & Max

Black Forest Labs. 4 mégapixels photoréalistes, support multi-référence (jusqu'à 10 images), rendu texte précis, consistance de personnages. Max ajoute le contexte web en temps réel.

Multi-référence
🌟

Seedream 4.5 & 5 Lite

ByteDance. Génération 2K-4K avec compréhension spatiale avancée. Support multi-référence (jusqu'à 14 images), préservation produit/personnage, rendu design-oriented.

Design produit
🚀

Z-Image Turbo

Alibaba Tongyi-MAI 6B. Inférence en 8 étapes, génération sub-seconde, qualité photoréaliste. Ultra économique ($0.005/MP). Idéal pour l'itération rapide.

Ultra-rapide
🎭

Grok Image

xAI Aurora. Réseau MoE autorégressif, rendu photoréaliste, instructions texte précises, input multimodal (texte + image). Large gamme de styles : réaliste, anime, peinture.

Polyvalent

📐 Formats et ratios

Tu choisis le ratio d'image directement dans Hoox. Le format 9:16 (vertical) représente environ 90% des usages UGC car c'est le format natif de TikTok, Reels et Shorts. Les ratios 1:1 et 2:3 sont aussi disponibles selon le modèle sélectionné.

ℹ️
Le bon réflexe Commence toujours par Nano Banana Pro. Si tu as un besoin très spécifique (typographie complexe → REve, itération ultra-rapide → Z-Image Turbo, multi-référence produit → Seedream), alors bascule sur le modèle spécialisé.

L'importance du prompt : langage cinéma

La qualité de tes B-Rolls dépend directement de la qualité de tes prompts. Pour écrire des prompts précis, tu dois maîtriser le vocabulaire cinématographique. C'est ce langage qui te permet de communiquer exactement ce que tu veux à l'IA — qu'il s'agisse d'une image fixe ou d'une séquence vidéo.

⚠️
Rappel crucial Dans Hoox, le contrôle caméra se fait exclusivement par le prompt textuel. Il n'y a pas de menu déroulant ni de slider pour les mouvements de caméra. Ton prompt EST ton outil de mise en scène — maîtrise-le.

🎥 3.1 — Les valeurs de plan

La "valeur de plan" décrit la distance entre la caméra et le sujet. C'est le premier choix à faire dans ton prompt — il détermine l'intimité et le contexte du plan.

PlanDescriptionPrompt keywordUsage UGC
Plan général (PG)Vue très large, le sujet est petit dans l'environnementwide shotAmbiance, contexte, lifestyle
Plan d'ensemble (PE)Le sujet en entier dans son décorfull shotMise en situation produit
Plan moyen (PM)Personnage cadré de la taille aux piedsmedium shotAvatar + produit ensemble
Plan américainCadré mi-cuisse, plan classique du cinémaamerican shotDémonstration produit
Plan rapproché (PR)Cadré épaules/poitrine, accent sur le visageclose-up shotÉmotion, témoignage
Gros plan (GP)Visage seul ou détail produitclose-upTexture, détails, réaction
Très gros plan (TGP)Détail extrême : yeux, ingrédient, textureextreme close-upImpact visuel fort, macro
InsertGros plan sur un objet, détail narratifinsert shotLogo, packaging, ingrédient

📐 3.2 — Les angles de prise de vue

L'angle de caméra influence la perception psychologique du spectateur. Un même sujet filmé en plongée ou en contre-plongée raconte une histoire différente.

AngleDescriptionPrompt keywordEffet psychologique
Niveau des yeuxCaméra à hauteur du sujeteye levelNeutralité, proximité, confiance
PlongéeCaméra au-dessus, regarde vers le bashigh angleDomination, vue d'ensemble, vulnérabilité
Contre-plongéeCaméra en-dessous, regarde vers le hautlow anglePuissance, prestige, grandeur
Vue zénithaleCaméra directement au-dessus (90°)overhead / bird's eyeVue graphique, flat lay, organisation
Vue au solCaméra posée au solground levelImmersion, perspective dramatique
Dutch angleCaméra inclinée sur l'axe horizontaldutch angle / tiltedTension, créativité, rupture

🎬 3.3 — Les mouvements de caméra

Les mouvements de caméra apportent du dynamisme et guident l'attention du spectateur. En vidéo IA, tu les décris dans le prompt textuel pour orienter le modèle.

MouvementDescriptionPrompt keywordUsage recommandé
PanoramiqueRotation horizontale de la caméra sur son axepan left / pan rightRévéler un décor, suivre un sujet
TiltRotation verticale de la camératilt up / tilt downRévéler un produit de haut en bas
Travelling avantCaméra avance vers le sujetdolly in / push inIntensifier, créer de l'intimité
Travelling arrièreCaméra recule du sujetdolly out / pull backRévéler le contexte, conclusion
Travelling latéralCaméra se déplace latéralementtracking shotSuivre un mouvement, dynamisme
Zoom in/outChangement de focale sans déplacer la camérazoom in / zoom outAttirer l'attention, transition
OrbiteLa caméra tourne autour du sujetorbit / arc shotPrésenter un produit en 3D
SteadicamMouvement fluide stabilisésteadicam / smooth motionImmersion, fluidité premium

📷 3.4 — Les objectifs caméra (lenses)

Le choix de l'objectif influence la profondeur de champ, les proportions et l'atmosphère du plan. Mentionner un objectif dans ton prompt donne un style photographique spécifique au rendu IA.

ObjectifEffet visuelPrompt keywordUsage UGC
24mmGrand angle, exagère les perspectives24mm wide angle lensPlans larges, architecture, lifestyle
35mmNaturel, proche de la vision humaine35mm lensScènes de rue, ambiance naturelle
50mmLe "nifty fifty", rendu réaliste50mm lensPortraits, produits, polyvalent
85mmFlou d'arrière-plan marqué, compression85mm portrait lensPortraits premium, beauté
100mm MacroDétails extrêmes, très faible PDC100mm macro lensTextures, ingrédients, skincare
Tilt-shiftZone de netteté sélective, effet miniaturetilt-shift lensEffet créatif, flat lay unique
AnamorphiqueCinématique, flares horizontaux, ratio largeanamorphic lensRendu cinéma premium

💡 3.5 — L'éclairage dans le prompt

L'éclairage est un des éléments les plus impactants pour le rendu final. Décrire la lumière dans ton prompt transforme radicalement l'ambiance de l'image ou de la vidéo générée.

☀️ Lumière naturelle — Golden hour, overcast, backlit
Keywords : golden hour lighting, soft natural light, overcast diffused light, backlit silhouette, morning light, sunset warm tones.

La lumière naturelle donne un rendu authentique et chaleureux — parfait pour le lifestyle et les témoignages UGC. Le golden hour (une heure avant le coucher du soleil) est le standard premium.
🎬 Éclairage studio — Trois points, Rembrandt, rim light
Keywords : studio lighting, three-point lighting, Rembrandt lighting, rim light, softbox lighting, key light dramatic shadows.

L'éclairage studio donne un contrôle total sur l'ambiance. Le Rembrandt (triangle de lumière sur la joue) ajoute un aspect cinématique. Le rim light crée un halo de séparation entre le sujet et le fond.
🌙 Éclairage créatif — Néon, volumétrique, low-key
Keywords : neon lighting, volumetric light rays, low-key dramatic lighting, high-key bright lighting, colored gels, cinematic moody lighting.

Pour des rendus plus artistiques ou tech-oriented. Les néons et gels colorés fonctionnent très bien pour la mode, le gaming, ou les produits tech. Le volumétrique ajoute une profondeur atmosphérique cinématique.

🧩 3.6 — Construire un prompt complet

Un bon prompt combine plusieurs de ces éléments de manière structurée. Voici la formule recommandée :

Formule de prompt [Valeur de plan] + [Angle] + [Sujet/Action] + [Éclairage] + [Objectif] + [Mouvement caméra] + [Ambiance/Style]

Voyons des exemples concrets :

Exemple 1 — Skincare B-Roll // Gros plan produit, ambiance premium
Extreme close-up, eye level, of a luxury serum bottle with golden liquid droplets falling on glass surface, studio lighting with rim light, 100mm macro lens, shallow depth of field, slow dolly in, dark moody background, photorealistic, 9:16
Exemple 2 — Food/Lifestyle // Plan d'ensemble, ambiance chaleureuse
Wide shot, overhead bird's eye view, of a beautifully arranged brunch table with fresh pastries, coffee, flowers and hands reaching for food, golden hour natural light streaming through window, 35mm lens, warm tones, lifestyle aesthetic, photorealistic, 9:16
Exemple 3 — Tech Product // Orbite autour du produit, rendu cinéma
Medium close-up, low angle, of a sleek wireless earbuds case opening on a matte black surface, neon blue and purple lighting, anamorphic lens with horizontal flares, slow orbit shot, cinematic color grading, futuristic atmosphere, 9:16
💡
Pro tip : sois spécifique, pas vague ❌ "A nice photo of a cream" → trop vague, l'IA improvise tout.
✅ "Extreme close-up, 100mm macro, of a rich moisturizer cream swirl with golden particles, studio lighting, shallow DOF" → l'IA sait exactement ce que tu veux.

🤖 Les GPTs Hoox pour t'aider

Hoox met à ta disposition des assistants ChatGPT spécialisés qui t'aident à rédiger des prompts optimisés en utilisant tout le vocabulaire cinématographique vu dans cette section.

Génération de séquences vidéo

Tu sais maintenant générer des images. L'étape suivante : transformer tes images en séquences vidéo animées pour créer des B-Rolls dynamiques. Hoox intègre les meilleurs modèles de génération vidéo IA du marché.

Démo génération vidéo Hoox

▶ Vidéo démo — Génération de séquences vidéo dans Hoox

🔄 Le workflow Image → Vidéo

1

Génère ton image de référence

Utilise les modèles image (Nano Banana Pro, Flux, etc.) pour créer le premier frame de ta séquence. C'est ton point de départ visuel.

2

Choisis un modèle vidéo

Sélectionne le modèle adapté à ton besoin (cinématique, rapide, mouvement contrôlé…). Chaque modèle a ses forces.

3

Rédige le prompt de mouvement

Décris le mouvement souhaité en utilisant le vocabulaire cinéma de la Section 3 : mouvements de caméra, rythme, direction.

4

Configure et génère

Règle la durée du clip dans l'interface Hoox selon le modèle sélectionné, puis lance la génération.

ℹ️
Image-to-Video vs Text-to-Video Tous les modèles vidéo supportent l'image de référence (image-to-video). Le text-to-video est aussi possible, mais le résultat est plus aléatoire si le prompt n'est pas ultra-précis. En partant d'une image, le modèle a un point d'ancrage visuel et le résultat est beaucoup plus fidèle à ta vision.

🎯 Les modèles vidéo disponibles

Famille Veo 3.1

Les modèles Veo de Google offrent un excellent équilibre entre réalisme, cohérence et rendu propre. Vidéos crédibles et polyvalentes.

Veo 3.1

Le standard. Excellent équilibre réalisme et cohérence visuelle. Clips crédibles pour tous les usages.

Polyvalent

Veo 3.1 Fast

Même qualité, optimisé pour la rapidité et l'itération. Parfait pour tester plusieurs variantes.

Itération rapide

Veo 3.1 First & Last Frame

Génère une vidéo à partir d'images clés de début et de fin. Excellent contrôle narratif.

Contrôle narratif

Veo 3.1 Extend

Étend une vidéo existante tout en maintenant la continuité visuelle et narrative.

Extension

Famille Kling (Kuaishou)

L'écosystème Kling est le plus complet disponible dans Hoox — du standard au motion control avancé en passant par l'édition vidéo.

Kling 2.5 Standard

Rendu naturel et crédible sans sur-stylisation. Idéal pour des vidéos réalistes sobres.

Naturel

Kling 2.6 Pro

Plus de détails, stabilité accrue, qualité visuelle premium par rapport au 2.5.

Premium

Kling 2.6 Motion Control

Transfère le mouvement d'une image ou d'une pose vers la vidéo animée. Contrôle gestuel.

Motion Transfer

Kling 2.6 Motion Control Pro

Version avancée pour des gestes complexes et expressifs avec plus de fidélité.

Gestes avancés

Kling 3.0 Pro & Standard

Dernière génération. Qualité visuelle encore améliorée et meilleure compréhension des prompts.

Dernière gen.

Kling O3 Pro & Standard

Variantes optimisées de la gamme Kling 3, avec ajustements de performance et de rendu.

Optimisé

Kling O3 Edit Pro & Standard

Modèles dédiés à l'édition vidéo — permettent de modifier et retoucher des séquences vidéo existantes directement dans Hoox.

Édition vidéo

Sora 2 (OpenAI)

Les modèles Sora d'OpenAI excellent dans la création de clips synthétiques dynamiques, particulièrement adaptés aux formats social media.

Sora 2

Clips dynamiques courts optimisés pour les réseaux sociaux. Bon rendu général et prompt adherence.

Social media

Sora 2 Pro

Version cinématographique premium. Profondeur visuelle supérieure, storytelling soigné — idéal pour les B-Rolls haut de gamme.

Cinématique

Autres modèles

Seedance 1.5

Vidéos fluides avec des transitions marquées et un rythme narratif efficace. Très bon pour les séquences avec un sens du mouvement et du tempo — particulièrement utile pour les B-Rolls qui nécessitent une chorégraphie visuelle.

Transitions fluides
💡
Comment choisir ton modèle vidéo ? Pour des B-Rolls cinématiques haut de gamme → Sora 2 Pro ou Veo 3.1. Pour itérer rapidement → Veo 3.1 Fast. Pour du contrôle de mouvement précis → Kling 2.6 Motion Control. Pour un rendu naturel et sobre → Kling 2.5 Standard. Pour des transitions dynamiques → Seedance 1.5.

Smart Media Management

Tu as maintenant des dizaines d'images et de séquences vidéo générées. Comment les organiser, retrouver et réutiliser efficacement ? C'est là qu'intervient le Smart Media Management de Hoox.

Démo Smart Media Management Hoox

▶ Vidéo démo — Smart Media Management dans Hoox

🧠 La bibliothèque intelligente

L'espace Médias de Hoox n'est pas un simple dossier de fichiers. C'est une bibliothèque intelligente où l'IA analyse automatiquement chaque image et vidéo que tu importes ou que tu génères. Tu peux ensuite rechercher, filtrer et réutiliser tes médias de manière intuitive.

🔍

Recherche sémantique

Recherche tes médias par description naturelle : "femme avec crème visage lumière dorée" retrouve instantanément les visuels correspondants.

🏷️

Tags automatiques

L'IA analyse et tague automatiquement chaque média (type de plan, couleurs dominantes, objets détectés, ambiance).

📁

Organisation par projet

Classe tes médias par campagne, par client ou par catégorie. Retrouve tout en quelques secondes.

♻️

Réutilisation facile

Un B-Roll réussi ? Réutilise-le dans plusieurs vidéos sans le re-générer. Économise du temps et des crédits.

💡
Bonne pratique : construis ta banque de B-Rolls Prends l'habitude de générer plus de B-Rolls que nécessaire pour chaque projet. En quelques semaines, tu auras une bibliothèque riche et réutilisable qui accélérera considérablement ta production.

Quiz & exercice pratique

🧠 Quiz — Images & Vidéo IA

0/5

Q1 Quel est le modèle de référence pour la génération d'images dans Hoox ?

Flux 2 Pro
Z-Image Turbo
Nano Banana Pro (Gemini 3 Pro)
REve Fast

Q2 Quel keyword de prompt correspond à un mouvement de caméra qui tourne autour du sujet ?

dolly in
orbit / arc shot
tracking shot
pan right

Q3 Quel ratio d'image est le plus utilisé en UGC (environ 90% des cas) ?

9:16 (vertical)
16:9 (horizontal)
1:1 (carré)
4:3 (classique)

Q4 Quel objectif est recommandé pour un gros plan macro de texture produit (skincare, food) ?

24mm grand angle
50mm standard
85mm portrait
100mm macro

Q5 Comment le contrôle caméra fonctionne-t-il dans les modèles vidéo de Hoox ?

Via un menu déroulant dans l'interface
Via des sliders de paramètres
Exclusivement via le prompt textuel
Automatiquement par l'IA sans intervention

🎯 Exercice pratique

Crée ton premier B-Roll complet

Mets en pratique tout ce que tu as appris dans ce module. Choisis un produit (réel ou fictif) et crée un B-Roll image + vidéo de A à Z.

  • Écris un prompt image complet en utilisant la formule : valeur de plan + angle + sujet + éclairage + objectif + ambiance
  • Génère l'image avec Nano Banana Pro (le modèle de référence)
  • Teste le même prompt avec un autre modèle (Flux 2 Pro ou REve) et compare les résultats
  • Sélectionne ta meilleure image et utilise-la comme référence pour générer une séquence vidéo
  • Choisis le modèle vidéo adapté et rédige un prompt de mouvement (mouvement caméra + rythme)
  • Organise tes résultats dans la bibliothèque Smart Media
Prêt à aller plus loin avec Hoox ? Découvrez nos offres ou prenez rendez-vous avec notre équipe.