La linguistique computationnelle permettra-t-elle de connaître l’identité de Satoshi Nakamoto? 

| 4 min read

Satoshi Nakamoto est le pseudonyme qui fut utilisé par la ou les personnes qui ont développé le crypto-actif Bitcoin. Auteur du célèbre livre blanc sur le Bitcoin, Nakamoto est également à l’origine de la diffusion et de l’implémentation de référence du Bitcoin. Il s’est notamment fait remarquer en étant le premier à résoudre le problème de la double dépense pour une monnaie de type numérique avec l’utilisation d’un réseau pair à pair. 

La linguistique computationnelle nous permettra-t-elle de connaître l’identité de Satoshi Nakamoto ? 

Photo: AdobeStock

L’identité de Satoshi Nakamoto est un mystère. Un certain nombre de personnes ont prétendu être le célèbre programmeur et sa véritable identité fait l’objet de plusieurs hypothèses sérieuses et farfelues. 

Satoshi Nakamoto n’avait donné aucun renseignement personnel jusqu’à 2012 où un profil homonyme pour la Fondation P2P indique qu’il est un homme Japonais de 37 ans et vivant au japon. Un certain nombre de spécialistes se sont intéressés à son utilisation de la langue anglaise. Le mystérieux programmateur serait un excellent utilisateur de la langue de Shakespeare et utiliserait des expressions typiquement britanniques (telle que « bloody hard »). Par ailleurs le premier bloc du Bitcoin contient le texte The Times 03/Jan/2009 Chancellor on brink of second bailout for banks. Un programmateur suisse, Stefan Thomas, a présenté graphiquement l’horodatage de chacun des messages de Nakamoto sur le forum Bitcoin et à l’aide de ces indications sur l’heure d’écriture de plus de 500 messages attribuables à Nakamoto, Thomas montre que les heures de connections rendent l’hypothèse d’une localisation de Nakamoto au Japon peu probable. 

Il est évidemment possible que le programmateur utilisant le pseudonyme « Satoshi Nakamoto » soit un japonais ayant une très bonne maitrise de la langue anglaise et utilise des expressions typiquement britanniques (il peut d’ailleurs avoir étudié en Grande-Bretagne). De plus le travail de Thomas sur les heures d’écriture du programmateur ne fonctionne pas si on prend pour hypothèse que le programmateur vit la nuit, ce qui est loin d’être rare pour ce type de profil.

Lire aussi: Vient-on de découvrir un message de 1999 de Satoshi Nakamoto?

En partant de la globalité des éléments écrits par Nakamoto, on peut définir un style type. En effet chaque individu possède un style d’écriture, ce style est très difficile à changer et peut être utilisé pour identifier l’auteur d’un document anonyme. C’est une technique en linguistique computationnelle qui est parfois appelée « stylométrie ». Cette méthode est souvent utilisée pour tenter d’identifier l’auteur d’une lettre anonyme. On se concentre sur l’utilisation de mots-clefs récurrents, la tournure des phrases, l’utilisation de la grammaire et de la ponctuation. La stylométrie peut atteindre des taux de réussite particulièrement élevés et la littérature scientifique parle souvent de capacité de détection à hauteur de 80/85%. Oui mais… pour pouvoir détecter l’auteur d’un message il est nécessaire de posséder des bases de données riches. On va comparer le contenu du message avec différents profils possédés dans la base de données. Pour le cas précis de Nakamoto on sera naturellement enclin à capter les données brutes des blogs de GitHub de plusieurs programmateurs travaillant dans le domaine puis à extraire des patterns dans le style d’écriture.

Malgré les possibilités offertes par la linguistique computationnelle, connaitre la véritable identité de Nakamoto semble encore un défi particulièrement redoutable. En effet, la majorité des textes de Nakamoto sont assez succincts ce qui rend l’identification d’un style assez difficile. Par ailleurs l’hypothèse, très vraisemblable, selon laquelle Nakamoto serait une équipe de travail rend la détection d’ « un » style quelque peu illusoire. 

Le mystère de l’identité de Nakamoto reste encore bien gardé… 

Ce texte est signé Jean Langlois-Berthelot, chargé de recherche en informatique appliquée.

_________________________________

Suivez nos liens d’affiliés:

Pour acheter des cryptomonnaies; Zone SEPA Europe et citoyens français:

Pour acheter des cryptomonnaies au Canada:

Pour acheter des cryptomonnaies à travers le monde:

Pour investir dans le minage ou les masternodes:

Pour transiger vos cryptos de façon anonyme:

Pour générer des intérêts grâce à vos bitcoins:

Pour sécuriser ou stocker vos cryptomonnaies:

Pour accumuler des cryptos en jouant:

  • Au poker sur la plateforme de jeux CoinPoker
  • À un fantasy football mondial sur la plateforme Sorare

________________