Il presente contributo intende approfondire il tema dell’immagine artificiale generativa per la rappresentazione identitaria del paesaggio urbano e si inserisce in un più ampio contesto che riguarda l’indagine sulla comunicazione visiva della città contemporanea. Infatti, l’atto generativo si offre come opportunità per una produzione continua e fluida di rappresentazioni, riferite a diverse tematiche di uno specifico luogo; ma cosa accade se viene chiesto ad un software generativo di produrre immagini che riguardano l’identità di una città in particolare? La maggior parte dei risultati sono visivamente appaganti, ma difficilmente il soggetto raffigurato è pertinente al contesto desiderato. Sintomo di questa criticità è sicuramente l’intenzione per la quale tali sistemi sono stati progettati, dovendo rispondere a richieste tendenzialmente generiche. Alla luce di queste iniziali considerazioni, si vuole porre l’attenzione proprio su alcune criticità che riguardano i sistemi generativi di immagini, noti come text-to image, sulla rappresentazione identitaria di un luogo. In particolare, si intende indagare su due aspetti: la questione sintattica che riguarda i prompt [1] con i relativi risultati e l’origine del dataset con il quale il programma stesso elabora le immagini. Tale indagine si propone, senza pretese di esaustività, come riflessione nell’ottica di un uso più consapevole e progettuale di tali sistemi, analizzandone gli aspetti dal punto di vista dell’immagine.
La percezione del paesaggio da parte dell'AI. Note sull'ambiguità del dataset e dei prompt nei programmi generativi
De Natale
2024-01-01
Abstract
Il presente contributo intende approfondire il tema dell’immagine artificiale generativa per la rappresentazione identitaria del paesaggio urbano e si inserisce in un più ampio contesto che riguarda l’indagine sulla comunicazione visiva della città contemporanea. Infatti, l’atto generativo si offre come opportunità per una produzione continua e fluida di rappresentazioni, riferite a diverse tematiche di uno specifico luogo; ma cosa accade se viene chiesto ad un software generativo di produrre immagini che riguardano l’identità di una città in particolare? La maggior parte dei risultati sono visivamente appaganti, ma difficilmente il soggetto raffigurato è pertinente al contesto desiderato. Sintomo di questa criticità è sicuramente l’intenzione per la quale tali sistemi sono stati progettati, dovendo rispondere a richieste tendenzialmente generiche. Alla luce di queste iniziali considerazioni, si vuole porre l’attenzione proprio su alcune criticità che riguardano i sistemi generativi di immagini, noti come text-to image, sulla rappresentazione identitaria di un luogo. In particolare, si intende indagare su due aspetti: la questione sintattica che riguarda i prompt [1] con i relativi risultati e l’origine del dataset con il quale il programma stesso elabora le immagini. Tale indagine si propone, senza pretese di esaustività, come riflessione nell’ottica di un uso più consapevole e progettuale di tali sistemi, analizzandone gli aspetti dal punto di vista dell’immagine.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.