Nuovo studio: i ricercatori insegnano all'AI a riconoscere ciò che disegni

Tempo di lettura: 2 minuti
Di Torio Alleghi
- in
"AI che identifica vari schizzi umani con precisione"

RomeRicercatori dell'Università di Surrey e della Stanford University hanno sviluppato un nuovo metodo per aiutare l'intelligenza artificiale a comprendere gli schizzi umani. Questo metodo funziona efficacemente anche per chi non ha abilità nel disegno. Il modello è in grado di riconoscere gli schizzi di scene con un'accuratezza simile a quella umana.

La dottoressa Yulia Gryaditskaya, docente presso il Centre for Vision, Speech, and Signal Processing (CVSSP) di Surrey, ha affermato che il disegno è un metodo molto efficace per comunicare visivamente. Ritiene che a volte possa essere più chiaro e flessibile rispetto alla parola. Strumenti che ci aiutano a interpretare i disegni possono migliorare l'interazione tra uomo e computer e rendere il processo di progettazione più rapido e semplice. Esempi includono:

<ul>

<li>Ricerca di immagini attraverso schizzi</li>
<li>Realizzazione di immagini tramite disegno</li>
<li>Miglioramento dei flussi di lavoro nel design</li>
<li>Comunicazione visiva potenziata</li>
</ul>

Persone di tutte le età utilizzano i disegni per esplorare idee e comunicare. Tuttavia, l'intelligenza artificiale ha incontrato difficoltà nell'interpretare gli schizzi. Di solito, l'IA richiede un processo dettagliato per etichettare ogni singolo pixel di un disegno. In seguito, l'AI impara da queste etichette.

Il nuovo metodo ha addestrato l'IA utilizzando una combinazione di disegni semplici e spiegazioni scritte. L'IA ha imparato a riconoscere i pattern dei pixel e a confrontarli con le descrizioni. Questo approccio ha fornito all'IA una comprensione delle immagini superiore rispetto ai metodi precedenti. L'IA è stata in grado di identificare e etichettare con un'accuratezza dell'85% aquiloni, alberi, giraffe e altri oggetti. Altri modelli che utilizzavano pixel etichettati non hanno ottenuto risultati altrettanto buoni.

Il nuovo metodo è in grado di distinguere i tratti di penna destinati a ogni oggetto. Funziona egregiamente con schizzi approssimativi di persone non esperte e con disegni di oggetti su cui non è stato specificamente addestrato.

La professoressa Judith Fan, docente di Psicologia all'Università di Stanford, ha dichiarato che il disegno e la scrittura sono attività umane fondamentali. Esse permettono alle persone di registrare ciò che vedono e pensano. Secondo lei, questa ricerca è un passo verso la creazione di sistemi di intelligenza artificiale capaci di comprendere idee sia grafiche che testuali.

La ricerca è condotta dall'Istituto per l'Intelligenza Artificiale Centrata sulle Persone dell'Università di Surrey, all'interno del programma SketchX. SketchX cerca di capire come vediamo le cose osservando come le disegniamo. Il professor Yi-Zhe Song, che co-dirige l'Istituto e il programma SketchX, ha dichiarato che questo studio dimostra come l'IA possa supportare attività umane di base come il disegno. Comprendendo i disegni semplici quasi come fanno le persone, questa tecnologia ha un grande potenziale per stimolare la creatività di tutti, indipendentemente dalle loro abilità artistiche.

I risultati della ricerca verranno presentati alla conferenza IEEE/CVF su Visione Artificiale e Riconoscimento di Pattern 2024. L'evento si terrà a Seattle dal 17 al 21 giugno 2024.

Lo studio è pubblicato qui:

http://dx.doi.org/10.48550/arXiv.2312.12463

e la sua citazione ufficiale - inclusi autori e rivista - è

Ahmed Bourouis, Judith Ellen Fan, Yulia Gryaditskaya. Open Vocabulary Semantic Scene Sketch Understanding. Submitted to arXiv, 2024 DOI: 10.48550/arXiv.2312.12463
Intelligenza Artificiale: Ultime notizie

Condividi questo articolo

Commenti (0)

Pubblica un commento
NewsWorld

NewsWorld.app è un sito di notizie premium gratuito. Forniamo notizie indipendenti e di alta qualità senza addebitare per articolo e senza un modello di abbonamento. NewsWorld ritiene che le notizie generali, di business, economiche, tecnologiche e di intrattenimento dovrebbero essere accessibili a un alto livello gratuitamente. Inoltre, NewsWorld è incredibilmente veloce e utilizza tecnologie avanzate per presentare articoli di notizie in un formato altamente leggibile e attraente per il consumatore.


© 2024 NewsWorld™. Tutti i diritti riservati.