Un espace latent est une représentation cachée ou interne (c'est-à-dire qu'il ne s'agit pas d'une donnée observable brute) puisqu'il est le résultat du traitement par un algorithme d'apprentissage. Un espace latent peut être une représentation plus compacte ou compressée. Typiquement dans un espace latent « sémantique » les objets qui se ressemblent le plus sont positionnés plus près les uns des autres. La position dans l’espace latent peut être considérée comme étant définie par un ensemble de variables latentes qui émergent des ressemblances entre les objets. Cette ressemblance est évaluée à l'aide d'une métrique propre à chaque type d'espace, par exemple on utilise le cosinus pour mesurer la distance entre deux objets représentés par des vecteurs sémantiques compacts, par exemple des vecteurs-mots.
D'après DataFrance
Donc si on résume, l'espace latent est un espace hypothétique qui est créé par la machine lors de son processus afin de répondre au prompt qu'on lui donne. C'est un espace que l'on que très peu représenter dans sa totalité puisque nous avons pas la même façon de procéder que la machine. Dans le sens où il nous est impossible de représenter des espaces avec des milliers de dimensions, la machine, elle, en est capable.
Ce qui est vraiment intrigant finalement ce sont les images qui sont des « hybrides ». Ces images qui sont déformées ou qui apparaissent comme des « erreurs de réponse » ou des défauts de compréhension entre l'humain et la machine. Certains créateurs s'emparent de ce médium à travers ce phénomène.