IT knowledge base
CTRL+F per cercare la tua parola chiave

unCAPTCHA: utilizzo dei servizi Google per ignorare Google reCAPTCHA

Immagine
unCAPTCHA è un sistema automatizzato sviluppato da esperti dell'Università del Maryland che può aggirare il reCAPTCHA di Google con una precisione dell'85%. Ci sono riusciti riconoscendo la versione audio del messaggio per le persone con disabilità.
Il metodo sfrutta una vulnerabilità nella versione audio di reCAPTCHA - in esso viene pronunciato un codice numerico, che deve quindi essere inserito nel campo di controllo. L'algoritmo utilizza diversi servizi per aiutare a determinare i numeri, incluso il servizio di riconoscimento vocale di Google Cloud.
Immagine
I ricercatori hanno pubblicato il codice per il loro progetto su GitHub . UnCAPTCHA utilizza strumenti di riconoscimento vocale come Bing Speech Recognition, IBM, Google Cloud, Google Speech Recognition, Sphinx e Wit-AI.

Principio di funzionamento

Il formato del comando audio è una serie di numeri di lunghezza diversa pronunciati a velocità, accenti e rumori di sottofondo diversi. Per attaccare questo captcha, i suoni vengono identificati e divisi automaticamente in pezzi.
Ogni bit del segnale audio di ogni numero viene caricato in 6 diversi servizi di trascrizione audio online gratuiti (IBM, Google Cloud, Google Recognition, Sphinx, Wit-AI, Bing Speech Recognition) e questi risultati vengono aggregati. Dopo la concatenazione, la stringa più probabile viene identificata euristicamente. Successivamente, i numeri vengono digitati in sequenza nel captcha. Durante i test, la precisione è stata osservata dal 92% per i singoli numeri e fino all'85% nel riconoscimento completo del comando audio.
unCAPTCHA non è il primo sistema del suo genere. Nel marzo di quest'anno, sono state fornite informazioni su un attacco utilizzando ReBreakCaptcha , un sistema quasi identico a unCAPTCHA.

Video dimostrazione del lavoro of

I test mostrano che unCAPTCHA può risolvere 450 problemi reCAPTCHA con una precisione dell'85,15% in 5,42 secondi. Questo è meno di quello di cui un essere umano ha bisogno per ascoltare un singolo file audio reCAPTCHA.

non CAPTCHA

Il codice del progetto è scritto in python utilizzando la popolare libreria selenium e FFmpeg, un insieme di librerie open source che consentono di registrare, convertire e trasmettere segnali audio digitali.
→ Il codice sorgente è pubblicato su github .
Secondo il link è disponibile dai creatori degli strumenti di studio.
Gli sviluppatori hanno informato Google della loro ricerca, a seguito della quale sono già state aggiunte nuove misure di protezione contro tali attacchi.