Google ha gia’ dovuto correggere il nuovo sistema di limiti di Gemini: dopo le proteste degli utenti, i prompt piu’ pesanti non dovrebbero piu’ bruciare una quota sproporzionata e le richieste fallite non dovrebbero consumare capacita’. Il punto pratico, per chi usa Gemini da Android, e’ meno spettacolare del comunicato: conviene smettere di ragionare in “numero di messaggi” e iniziare a controllare modello, file caricati e tipo di richiesta.




La modifica arriva dopo il passaggio a un sistema basato sul consumo di calcolo, con finestre di circa cinque ore e un limite settimanale piu’ ampio. Android Central e 9to5Google riportano che Google sta introducendo un tetto alla quota consumabile da una singola richiesta, conteggiando solo le richieste completate e promettendo breakdown piu’ chiari. Tradotto: se si chiede a Gemini un lavoro leggero, il costo dovrebbe restare basso; se si caricano PDF lunghi, immagini, video o si usa Deep Research, il contatore puo’ salire in fretta.
Questo e’ il classico caso in cui l’AI mobile sembra una funzione magica finche’ non incontra il limite operativo. Sul telefono, Gemini e’ comodo proprio perche’ sta dentro il flusso quotidiano: ricerche, allegati, Gmail, file, foto, app Google. Ma piu’ il sistema diventa integrato, piu’ serve una piccola disciplina da laboratorio. Non per fare i contabili del token a colazione, ci mancherebbe, ma per evitare di scoprire il limite nel momento peggiore.
Cosa controllare se Gemini su Android consuma troppo limite
Primo controllo: apri Gemini e verifica quale modello stai usando. Google dice che la scelta del modello verra’ ricordata tra le sessioni, salvo cambio manuale o fallback automatico quando si raggiunge un cap. Se il telefono continua a usare un modello Pro per domande banali, stai pagando in quota un livello di potenza che magari non serve.
Secondo controllo: separa le richieste leggere da quelle pesanti. Riassumere una nota breve e analizzare un documento lungo non sono la stessa cosa. Per contenuti lunghi, file multipli o prompt molto articolati, conviene preparare meglio la richiesta: obiettivo chiaro, output atteso, vincoli essenziali. Una domanda vaga con allegati enormi e’ il modo piu’ elegante per trasformare Gemini in una caldaia a consumo variabile.
Terzo controllo: se una generazione fallisce, non rilanciarla dieci volte identica. Google ha chiarito che gli errori non dovrebbero essere addebitati alla quota, ma questo non significa che ogni loop sia gratis o innocuo. Cambia prompt, riduci allegati, prova un modello piu’ leggero o spezza il lavoro in passaggi. Il problema non e’ solo il limite: e’ capire se Gemini sta facendo il lavoro giusto o sta solo macinando calcolo.
Quarto controllo: guarda le notifiche e la schermata dei limiti. La pagina di supporto di Google indica che Gemini avvisa quando ci si avvicina al limite e, quando lo si raggiunge, mostra quando verra’ ripristinato. Da web si puo’ passare da gemini.google.com, aprire le impostazioni e controllare Usage Limits; da Android il percorso puo’ variare in base al rollout, quindi il dato importante e’ cercare il pannello limiti prima di essere bloccati.
Mini runbook per usarlo meglio
- Usa Flash o Flash-Lite per domande rapide, bozze, riscritture brevi e appunti.
- Passa a Pro solo per codice, ragionamento complesso, file lunghi o decisioni dove serve piu’ qualita’.
- Prima di caricare documenti pesanti, elimina pagine inutili e spiega a Gemini cosa deve estrarre.
- Per Deep Research, video, immagini o lavori lunghi, metti in conto un consumo superiore e controlla la quota prima.
- Se compare un fallback automatico a un modello piu’ leggero, non ignorarlo: e’ un segnale che il limite e’ vicino o gia’ raggiunto.
Cosa cambia davvero
La correzione di Google e’ positiva, ma non elimina il problema di fondo: Gemini sta diventando una piattaforma a consumo opaco, non un semplice assistente con tot messaggi al giorno. Per l’utente Android questo significa che l’abbonamento non va valutato solo sul nome del modello o sulla promessa “AI Pro”, ma su trasparenza dei limiti, prevedibilita’ del consumo e possibilita’ di scegliere consapevolmente il livello giusto.
La lettura AndroidLab e’ semplice: il compute-based pricing ha senso tecnicamente, perche’ non tutte le richieste costano uguale. Pero’ se l’interfaccia non spiega bene cosa consuma quota, l’utente percepisce solo un rubinetto che si chiude a sorpresa. Google sta correggendo la parte piu’ fastidiosa, ma deve ancora rendere il contatore comprensibile come quello della batteria: non perfetto, ma abbastanza chiaro da orientare il comportamento.
In breve
- Google sta correggendo i limiti compute-based di Gemini dopo le proteste degli utenti.
- Le richieste fallite non dovrebbero consumare quota; le richieste pesanti avranno un tetto di consumo piu’ controllato.
- Su Android conviene distinguere tra richieste leggere, modello Pro, Deep Research e allegati lunghi.
- Il controllo piu’ utile e’ verificare modello selezionato, notifiche di limite e pannello Usage Limits.
- Il nodo vero resta la trasparenza: un assistente AI utile deve far capire quanto costa usarlo, non solo quanto e’ intelligente sulla carta.