C’est un proof of concept assez ouf sur lequel je suis tombé et mis en évidence par Li Zhuang, Feng Zhou et J. D. Tygar de l’université de Berkeley.
Imagine. Quand tu tapes au clavier, ça fait du bruit, des clics, des tics tics tac (rangers du risque). Bref, à chaque fois que tu tapes une lettre, y a un son. Et bien dis toi que des chercheurs ont réussi à mettre au point un algo qui avec un enregistrement audio de 10 minutes est capable de te sortir ce que tu tapes au clavier après 30 minutes d’analyse sur une bécane tout à fait classique. On est bien d’accord, aucune autre liaison entre l’algorithme et ce que tu tapes, autre que le son que ça fait, n’est utilisée. Mais la façon dont ça fonctionne, est awesome.
Comment ça fonctionne ?
En fait c’est presque tout con. En théorie.
Sans forcément rentrer dans les détails de série de Fourniret Fourrier, quand on tape du texte, chaque son produit par la pression d’une touche est stocké pour consultation ultérieure et on lui donne un identifiant qui est propre à l’empreinte de ce son.
Lorsque suffisamment de ces sons sont stockés, on passe alors à l’analyse. Chaque « échantillon » qui compose le son est comparé aux autres, pour voir si il a pas la même gueule à tout hasard. Une fois les associations faites, l’algo regarde quand ils ont été utilisé, et surtout à côté desquels.
Là où ça devient vraiment ouf, c’est maintenant. En appliquant un modèle de Markov (t’inquiète, je savais pas non plus ce que c’était avant de lire l’article ce matin :-)) reliant chaque cause à ses conséquences sous forme de proba, on arrive à savoir a quoi correspond tel et tels son.
Atta, regarde un exemple de schéma :
Atta, un exemple de schéma
Les activité en fonction du temps.
Il y a, d’après ce schéma, 60% de chance qu’il flotte. Or si il pleut, il y a peu de chances que tu ailles dehors pour faire un tour. Par contre les chances sont quasi égales que tu fasses du shopping ou du ménage (c’est ça ouais, j’reste jouer bien au chaud moi, t’as vu ça où ?)
Si il fait beau par contre, il y a très peu de chance que tu fasses du ménage (tu m’étonnes John). Il y a par contre 2 fois plus de chances d’aller faire un tour que d’aller faire du shopping (toujours d’après ce modèle).
Bref tu vois que les activités sont intimement liées (ouuuuh qu’elles sont intimes les liaisons) à leurs contextes. Maintenant, remplace tout ça par des lettres. Genre « Rainy » par un « P », « Walk » par un « F », « Shop » par un « A » et « Clean » par un « E » et t’as un truc pour les lettres.
Cette partie était chiante, vite, une autre que je comprends.
Bah oui, parce que mine de rien dans notre langue, on peut tirer des statistiques. Y a quand même plus de chances qu’un « z » soit suivi d’un « e » que d’un « p »
Donc on a des sons triés (genre 534 de type 1, 322 de type 2… 12 de type 28), par voie de conséquence (MAMAN !!! REGARDE ! J’ai utilisé cette expression une fois dans ma vie !!) on sait à quelle fréquence un type de son revient. Mais aussi on sait QUAND chaque type de son est utilisé. Et oui ! Souviens toi Barbara, on a aussi un son « brut », sans montage ni découpage. Il est donc facile pour l’algo de voire que la 231 eme répétition d’un son de type 1 a eu lieu pour la 25 eme fois derrière un son de type 19 et juste avant un son de type 12 ce dernier étant répéter deux fois. Coïncidence ? JE NE CROIS PAS !
Phase finale et décryptage
On peut donc, enfin l’algo avec une bécane qui mouline par ce que nous avec un crayon et du papier on va vite se faire chier, commencer à décrypter ce bordel en comparant ça avec des statistiques lexicales (du style analyse d’un dictionnaire : Genre le type 1 là ça a tout l’air d’être une voyelle). A cela, il est possible d’ajouté un vérificateur d’orthographe et ou un schéma du clavier utilisé (azerty, qwerty ou autre) pour encore plus de précision en analysant le temps entre chaque pression le bordel est capable de mapper le clavier. A l’oreille.
Finalement, ce truc ça à tout l’air d’être un accordeur quoi. Je suis sous le charme du concept.
Bref, tout ça pour dire qu’un jour, il suffira de laisser traîner un micro pour savoir tout ce qui a été tapé sur une bécane. HEUREUSEMENT on nous dit que ces recherches servent aussi la cause de la reconnaissance vocale.
Ouf, nous voilà rassurés.
Via et le doc de pres’ des chercheurs qui est absolument passionnant mais en Anglais ou tu apprends que le taux de mots reconnus est de 75 à 90%. Et qu’au bout d’une heure le truc est capable de chopper les mots de passe avec des caractères aléatoires. Et donc qu’on est dans la merde.