web-dev-qa-db-fra.com

Ne jamais épeler un mot de la même manière deux fois?

Il y a longtemps, je lisais à propos de Renaissance-Era Ciphers et je me suis souvenu cette citation :

David Kahn, auteur de la Codebreakers, citations Giovanni Battista Porta qui a publié, en 1563, un célèbre livre cryptographique, de Furtivis Literrum Noise:

"Il a exhorté l'utilisation de synonymes dans des plaintes, notant que" cela fera également des difficultés dans l'interprétation si nous évitons la répétition du même mot ". Comme l'Argentis, il a suggéré orthographiés délibérées de mots plaintes : 'Car c'est mieux pour qu'un scribe soit pensé ignorant que de payer la pénalité pour la détection des plans, "a-t-il écrit".

Cette idée de des mots mal orthographiés m'intrigue à moi. Je me demande, c'est une technique qui pourrait potentiellement être efficace contre les systèmes de surveillance de masse modernes?

Par exemple, dans un système de surveillance de masse de style NSA qui drapeaux Certains désignés Mots-clés, Pourrait délibérer mal orthographié des mots (dans un email ou des SMS, par exemple ) Soyez potentiellement utilisé pour éviter la détection?

the bobm is hdiden isnide teh parlaimnet biuldnig

L'idée est que cela fonctionnerait comme un captcha, ce qui rendrait le message obscurcié pour les ordinateurs mais toujours lisible par l'homme. Est-ce réaliste?

24
jackvsworld

Si je cherche Google pour "Parlaimnet Biuldnig", je vois:

Afficher les résultats pour la recherche de bâtiment du Parlement à la place pour Biuldnig de Parlaimnet

Donc non, de tels mauvais sort ne sont pas suffisants pour tromper les systèmes automatisés ou agir en tant que captcha.

Cependant, la recherche de Google "The Bobm" ne me propose pas de correction. La technique n'est donc pas nécessairement totalement inutile. Je ne serais pas beaucoup de magasin par elle, cependant.

Si vous faites partie d'un complot, vous pouvez en tout cas d'accord avec les mots de code et transmettre:

Le renard est caché à l'intérieur du Henhouse

Il est peu probable que cela apparaisse via un balayage large et peu profond pour bavardage terroriste. J'espère. Si je me trompe, je suppose que ma porte est sur le point d'être éclaté.

La mesure proposée est donc:

  • peu fiable: vous ne savez pas si votre texte peut être corrigé automatiquement avec succès
  • d'applicabilité limitée: vous devez parler à une personne que vous souhaitez conversation secrètement, mais avec qui vous ne pouvez pas utiliser de cryptage fort ou même un code simple convenu.
  • légèrement nocif pour le canal de communication, dans le sens où vous "utilisez" une partie de la capacité des humains à effectuer une correction d'erreur sur votre message. Plus il est "faux" de commencer, plus une erreur accidentelle l'appelle inintelligible au destinataire.
  • potentiellement auto-vaincre. Si les criminels qui l'utilisent de manière prévisible, les autorités peuvent alors commencer à noter la communication d'une précision d'orthographe et traiter des mauvais sort excessifs ou incharactéristes comme facteur de suspicion. Ne serait pas trop difficile de balayer des personnes qui peuvent épeler parfaitement bien en parlant à certains de leurs correspondants, mais apparemment pas quand ils parlent aux autres. Bien que si j'étais les autorités, je m'attendais à ce que la première tentative d'un tel balayage se trouve fondamentalement, vous plus de la plupart des adolescents ;-) De toute façon, la technique pourrait être aussi identifiable que les mots qu'il cherche à dissimuler.

Avec ces restrictions, il pourrait avoir une utilisation limitée, sur un strictement "pourrait aussi bien lui donner un essai" ".

Ce n'est pas un million de kilomètres de la pratique assez courante en chinois, d'utiliser des jeux de mots ou d'autres mots sains pour éviter la censure et la surveillance: cela ne fonctionne pas vraiment Travailler comme mesure de sécurité, car les autorités peuvent conserver Dans une certaine mesure, mais cela aide parfois quelque peu. Il y avait aussi un moment où le "viagra" mal orthographique (y compris en utilisant des homoglyphes ou des homoglyphes proches comme "1" pour "i") était toute la rage parmi les spammeurs, car les filtres de spam automatisés utilisaient une simple correspondance de mots. Vraisemblablement cela a aidé quelque peu, pendant un moment.

20
Steve Jessop

Tapez votre exemple dans un moteur de recherche de votre choix. Au moins, Google n'a aucun problème à corriger les mots pertinents, Bing les corrige même tous.

Saisir:

le Bobm est HDIDEN ISNide TehAimnet Biuldnig

Google:

la bombe est cachée isnide de la construction du Parlement

Bing:

la bombe est cachée à l'intérieur du bâtiment du Parlement

Les ordinateurs sont devenus plutôt bons pour corriger la mauvaise orthographe humaine. Ce type d'obfuscation pourrait pour - certains algorithmes - aide contre des attaques connues en plainte, mais elle introduit également un autre problème potentiel:

Si le message peut être déchiffré, de telles erreurs "aléatoires" aident à identifier l'auteur. Les humains sont vraiment mauvais "générateurs de nombres aléatoires". Donc, si les erreurs ne sont pas introduites automatiquement ou que chaque membre de la conversation utilise les mêmes erreurs (qui l'affaiblissent davantage), étant donné suffisamment de messages, cela contient plus d'informations que le contenu.

7
linac