L’apprendimento robotico sta attraversando una rivoluzione concettuale. Mentre i metodi tradizionali richiedono agli operatori umani di dimostrare fisicamente ogni singola azione che un robot deve apprendere, 1X Technologies ha annunciato il lancio del suo 1X World Model, un aggiornamento AI che consente al robot umanoide NEO di trasformare qualsiasi richiesta in una capacità AI on-demand, utilizzando un modello video basato sulla fisica del mondo reale.
“Dopo anni di sviluppo del nostro World Model e di progettazione di NEO per renderlo il più simile possibile a un essere umano, NEO ora può imparare da video su scala internet e applicare direttamente quella conoscenza al mondo fisico,” ha dichiarato Bernt Børnich, fondatore e CEO di 1X. “Con la capacità di trasformare qualsiasi prompt in nuove azioni—anche senza esempi precedenti—questo segna il punto di partenza della capacità di NEO di insegnarsi da solo a padroneggiare quasi tutto ciò che si possa pensare di chiedergli.”
Con questo aggiornamento, 1X afferma che NEO può utilizzare dati video affinati su dati robotici per eseguire compiti AI, anche con oggetti e ambienti mai incontrati prima. L’azienda con sede a Palo Alto, California, ha progettato NEO per l’uso domestico ed è disponibile attraverso il programma di accesso anticipato di 1X per 20.000 dollari, che include consegna prioritaria nel 2026. È disponibile anche un modello di abbonamento a 499 dollari al mese.
Il concetto di World Model rappresenta un cambio fondamentale nell’approccio all’addestramento dei robot. Invece di richiedere dimostrazioni fisiche per ogni compito, il sistema consente a NEO di apprendere osservando video di esseri umani che eseguono azioni nel mondo reale. Questa capacità si basa su tre pilastri tecnologici fondamentali.
Primo, un modello generativo video che comprende la fisica del mondo reale e può prevedere come gli oggetti si comportano nello spazio e nel tempo. Secondo, un sistema di inverse dynamics che traduce le visualizzazioni generate dal modello in movimenti precisi dei motori e degli attuatori del robot. Terzo, un’architettura di transfer learning che permette di applicare conoscenze generali apprese da video umani a situazioni robotiche specifiche.
Con questo aggiornamento, gli utenti possono dare a NEO un semplice prompt vocale o testuale, e il robot utilizza ciò che sta osservando per generare visualizzazioni di azioni future. Un modello di dinamica inversa integrato traduce poi queste visualizzazioni in movimenti precisi perché NEO completi la richiesta, ha spiegato 1X.
“Con l’1X World Model, puoi trasformare qualsiasi prompt in un’azione robotica completamente autonoma—anche con compiti e oggetti che NEO non ha mai visto prima,” ha affermato Daniel Ho, ricercatore AI presso 1X.
Le dimostrazioni nell’ultimo video di 1X mostrano la capacità di NEO di generalizzare oltre i dati di addestramento. Per prompt semplici come preparare un pranzo al sacco, il robot visualizza ed esegue, anche con oggetti non familiari.
Il robot può anche gestire compiti completamente nuovi, come azionare un sedile del water, aprire una porta scorrevole, stirare una camicia, spazzolare i capelli di un essere umano e altro ancora, senza alcun esempio precedente nel suo dataset, ha dichiarato 1X. Questo evidenzia il trasferimento di ampia conoscenza umana attraverso il World Model.
La capacità di generalizzazione è particolarmente impressionante quando si considera la complessità degli ambienti domestici. A differenza degli ambienti industriali strutturati, le case presentano una variabilità estrema in termini di layout, illuminazione, disposizione degli oggetti e condizioni ambientali. I modelli tradizionali hanno storicamente faticato con cambiamenti nell’illuminazione, disordine o caos che sono comuni nelle case. L’1X World Model applica una comprensione simile a quella umana per navigare estrema variabilità, mantenendo la compostezza in mezzo a rapidi cambiamenti ambientali, secondo l’azienda.
Dove i modelli AI tradizionali per robot umanoidi si sono affidati a dati raccolti da operatori umani, l’1X World Model consente a NEO di raccogliere i propri dati e padroneggiare autonomamente nuove capacità. Questo apre la porta affinché i robot alla fine insegnino a se stessi qualsiasi cosa, ha affermato 1X.
Dove il miglioramento nelle capacità AI per gli umanoidi è stato limitato dalla velocità con cui i dati robotici possono essere raccolti da operatori umani, 1X ha affermato che il suo World Model non solo si auto-migliora da NEO che raccoglie i propri dati, ma beneficia anche del miglioramento dei modelli video, dato che il world model utilizza un modello video come nucleo.
Questo rappresenta un cambio di paradigma fondamentale nell’economia dell’addestramento robotico. Tradizionalmente, la raccolta dati robotici ha seguito un processo costoso e laborioso: un operatore umano esperto deve fisicamente teleoperare il robot per dimostrare ogni azione, queste dimostrazioni devono essere ripetute centinaia o migliaia di volte in condizioni diverse, i dati raccolti devono essere etichettati e curati manualmente, e il processo deve essere ripetuto per ogni nuovo compito o variazione ambientale.
Con il World Model, questo processo si trasforma radicalmente. Il robot può apprendere osservando video disponibili pubblicamente su internet, può auto-generare variazioni e scenari senza intervento umano, può trasferire conoscenze apprese in un contesto a situazioni completamente nuove, e può continuare a migliorare autonomamente attraverso l’esperienza accumulata.
Dal punto di vista commerciale, 1X sta sperimentando con due modelli di pricing distinti. Il modello di acquisto diretto a 20.000 dollari con consegna prioritaria nel 2026 si rivolge a early adopter e aziende che vogliono proprietà completa. Il modello di abbonamento a 499 dollari al mese offre un punto di ingresso più accessibile per utenti domestici e piccole imprese.
Il modello di abbonamento presenta caratteristiche interessanti dal punto di vista business. Abbassa drasticamente la barriera all’ingresso per l’adozione, crea flussi di entrate ricorrenti e prevedibili per 1X, consente aggiornamenti software continui e miglioramenti delle capacità, e permette a 1X di raccogliere dati di utilizzo aggregati per migliorare il modello.
Dal lato degli utenti, l’abbonamento offre flessibilità di scalare su o giù in base alle necessità, accesso continuo agli ultimi aggiornamenti e capacità, minore rischio finanziario rispetto all’acquisto diretto, e nessuna preoccupazione per manutenzione o obsolescenza hardware.
1X ha progettato NEO specificamente per l’uso domestico, ma le implicazioni del World Model si estendono ben oltre questo segmento. Nel contesto domestico, NEO può gestire pulizia e manutenzione generale della casa, preparazione di pasti semplici e supporto culinario, assistenza agli anziani e supporto alla mobilità, e compiti di organizzazione e gestione domestica.
Per le piccole imprese e il retail, le applicazioni potrebbero includere supporto in negozi e boutique per compiti ripetitivi, assistenza in ristoranti e café per preparazione e servizio, supporto in uffici per gestione documenti e organizzazione spazi, e manutenzione di piccoli spazi commerciali.
Nel settore dell’ospitalità e servizi, i robot potrebbero essere impiegati in hotel per servizi in camera e pulizia, in strutture residenziali assistite per supporto agli ospiti, in coworking spaces per gestione e manutenzione, e in piccole strutture ricettive per automazione di servizi base.
Nonostante i progressi impressionanti, rimangono sfide significative. L’affidabilità in scenari critici per la sicurezza richiede ulteriore validazione, specialmente in compiti che coinvolgono interazione diretta con persone vulnerabili. La gestione di situazioni veramente imprevedibili o eccezionali resta un’area di sviluppo. La velocità di esecuzione potrebbe non essere ancora ottimale per tutti i compiti, specialmente quelli che richiedono rapidità. Il consumo energetico e l’autonomia operativa in scenari reali devono essere dimostrati.
Dal punto di vista del software, il World Model, pur avanzato, potrebbe ancora produrre occasionalmente azioni inappropriate o inefficienti. La dipendenza da connettività internet per l’elaborazione potrebbe essere una limitazione in alcuni scenari. L’aggiornamento e il miglioramento continuo del modello richiedono infrastrutture cloud robuste.
Un’altra considerazione riguarda le implicazioni etiche e di privacy. Un robot domestico con capacità di apprendimento autonomo solleva questioni importanti: quali dati raccoglie e come vengono utilizzati, come viene garantita la privacy degli utenti nelle loro case, quali meccanismi di sicurezza esistono per prevenire comportamenti indesiderati, e come viene gestito il consenso informato per la raccolta dati.
1X non è l’unica azienda che lavora su robot umanoidi con capacità avanzate di AI. Figure AI, supportata da OpenAI, sta sviluppando robot umanoidi con capacità di linguaggio naturale avanzate. Tesla con Optimus sta perseguendo un approccio altamente integrato verticalmente. Boston Dynamics con Atlas sta spingendo i limiti delle capacità fisiche e della dinamica. Sanctuary AI sta lavorando su intelligenza artificiale generale per robot umanoidi.
Ciò che distingue l’approccio di 1X è il focus specifico sul transfer learning da video come meccanismo principale di apprendimento. Mentre altri approcci tendono a enfatizzare la raccolta di dati robotici dedicati o l’apprendimento per rinforzo in simulazione, 1X scommette che la vasta quantità di conoscenza umana codificata nei video disponibili pubblicamente possa essere sfruttata direttamente.
Il lancio del World Model rappresenta un punto di partenza piuttosto che un punto di arrivo. Le direzioni di sviluppo future probabilmente includeranno espansione delle capacità del modello per compiti sempre più complessi, miglioramento della velocità e dell’efficienza dell’esecuzione, integrazione con altri sistemi di AI per capacità multimodali avanzate, e sviluppo di meccanismi di apprendimento continuo e cumulativo.
Sul fronte hardware, NEO stesso continuerà probabilmente a evolversi con miglioramenti in destrezza manuale e precisione dei movimenti, maggiore autonomia energetica, sensori più avanzati per percezione ambientale, e design più robusto per uso intensivo.
Dal punto di vista dell’ecosistema, 1X potrebbe sviluppare un marketplace di “skill” dove gli utenti possono condividere prompt e comportamenti, API per sviluppatori terzi per creare applicazioni personalizzate, integrazione con sistemi smart home e IoT, e partnership con produttori di elettrodomestici per ottimizzazioni specifiche.
Il World Model di 1X rappresenta un passo significativo verso robot che apprendono in modo più simile agli esseri umani—osservando, comprendendo e applicando conoscenze generali a situazioni specifiche. Questo approccio potrebbe finalmente sbloccare il potenziale dei robot domestici, superando le limitazioni dei metodi di addestramento tradizionali che hanno ostacolato il settore per decenni.
Per le aziende che operano nell’automazione, nell’AI o nella robotica, l’approccio di 1X offre importanti lezioni strategiche. L’innovazione a volte richiede ripensare completamente i presupposti fondamentali piuttosto che miglioramenti incrementali. Il trasferimento di conoscenza da domini ricchi di dati (come i video internet) a domini dove i dati sono scarsi (come i compiti robotici) può essere un moltiplicatore di forza enorme. I modelli di business subscription-based possono democratizzare l’accesso a tecnologie avanzate precedentemente fuori portata.
Allo stesso tempo, il successo commerciale di NEO e del World Model dipenderà da fattori che vanno oltre la pura capacità tecnica, tra cui affidabilità dimostrata in scenari reali prolungati, costi operativi totali competitivi rispetto ad alternative, facilità d’uso per utenti non tecnici, e costruzione di fiducia attraverso trasparenza e sicurezza dimostrabile.
In definitiva, l’1X World Model ci ricorda che il futuro della robotica potrebbe non essere costruito su robot che eseguono ciecamente istruzioni pre-programmate, ma su macchine che comprendono il mondo, apprendono dall’osservazione e si adattano continuamente—proprio come facciamo noi esseri umani ogni giorno.
