Portrait et cohérence - ChatGPT + MidJourney

Un article de Fantomas-2
Publié le --/--/----
Dans la section #IA
Article public d'intéret général
352 visiteurs
8 points
1 participant
8 points POUR
0 point CONTRE
 
Conforme ou séditieux?

Utilisation de ChatGPT pour obtenir une description détaillée avec un prompt simple

L’utilisation de ChatGPT pour créer des descriptions complexes peut être intéressante, tout est question de "shopping de parties de description". J’aime aussi ajouter "comme si vous donniez des instructions précises à un illustrateur" dans mes prompts.

Requête

"In English, generate the description of the face of a dynamic redhead woman in her mid-thirties, clever and romantic."

Réponse

"She has an oval face, framed by waves of shoulder-length, fiery red hair that seems to catch every glimmer of light, giving her an aura of vibrancy. Her eyes are a captivating green, sharp and perceptive, always sparkling with intelligence and a hint of mischief. They are windows to a clever mind, often found dancing with laughter or narrowing in deep thought. A smattering of freckles, reminiscent of a starry constellation, graces her nose and cheeks, adding to her unique charm. Her lips are naturally rosy, curving into a smile that’s both enigmatic and inviting, suggesting a romantic soul with stories to tell. Her skin has the soft glow of someone who loves the outdoors, yet it carries a certain delicacy, hinting at careful attention and self-care. This dynamic redhead moves with confidence and grace, her expressive face often reflecting the intensity of her emotions, from profound joy to thoughtful contemplation."

Donner le prompt à MidJourney

Prompt MidJourney pour l’exemple : "Cartoon portrait of a redhead woman in her mid-thirties. <ChatGPT response>".

Notez qu’un abonnement Discord peut être nécessaire pour donner de longs prompts à MidJourney. La première limite de longueur sera Discord, pas MidJourney. La partie entre <> est la réponse ChatGPT collée.

Créer un collage de référence avec plusieurs itérations

En utilisant par exemple GIMP, c’est le moment de créer un collage de différents résultats avec des prompts utiles (humeurs, situations), réutilisés de manière itérative avec les paramètres --cref et --cw pour maintenir la cohérence, en sélectionnant les résultats les plus utiles à ajouter au collage pour renforcer la cohérence.

Image de référence

Résultat du collage itératif.

Notez que ce collage peut aussi être donné à DALL·E comme référence pour faire des requêtes, de manière similaire au paramètre cref de MidJourney. Par exemple, ce prompt utilisé avec l’image a donné de bons résultats : "Generate a mini goddess of nature based on the character given in the initial image containing eight different references to the same character."

Prompt final

"Realistic photography of a redhead woman in her mid-thirties. She is in a train, looking at the viewer with a thin smile. --cref (MJ url of the collage) --cw 33 --style raw --stylize 50 --ar 987:1597".

Image finale

Utilisation du collage comme référence.

2 commentaires
Un Observateur
()
je suis en train de tester ça.
ça va être trop pratique pour faire des vidéos avec le même avatar.
C'était un gros problème
Un Observateur
()
L'idée que je n'avais pas vu ailleurs avant d'en avoir l'intuition est de donner un collage de référence avec le paramètre --cref, il semble que plus le collage est cohérent, plus le résultat sera fidèle.

Par contre, cela prend du temps pour créer un tel collage si on part d'un personnage fictif, car il faut explorer un bon nombre de résultats pour conserver un bon niveau de similitude. Mais cela fait boule de neige : pour générer la troisième et la quatrième image de référence j'ai passé un collage des deux premières, et ai utilisé un collage de quatre images ensuite, puis six, puis huit pour le collage final.

Il est aussi possible de partir d'un collage de plusieurs photos réelles (attention au consentement...) pour aider davantage MidJourney, plutôt que de fournir une seule référence.
(Vous n'avez pas (encore) les droits nécessaires pour répondre à cet article)
© 2003-2025 [paranoïaque] - Les CGU - Réseau Social Discret - Mode Nuit