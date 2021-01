L’Union européenne a publié le contrat pour les vaccins Astrazeneca il y a quelques heures. Il l’a fait sur son site internet, en PDF, rien d’extraordinaire. Cependant, toute personne qui accède au fichier verra que certaines parties (en particulier les pages 4 et 5) sont barrées. L’Union européenne et Astrazeneca ont caché certains contenus, mais il semble qu’ils aient commis une petite erreur: n’ont pas supprimé les favoris.

Lorsque vous créez un PDF formaté, les titres, sous-titres et puces restent indexés. Cela permet, par exemple, que dans un PDF de 41 pages, comme c’est le cas, on peut aller rapidement au point qui nous intéresse le plus. Le problème est que les signets enregistrent une partie du texte. En d’autres termes, une partie du barré est visible. Ou bien, pour l’UE, le fichier a changé et celui qui est maintenant disponible a été corrigé.

Méfiez-vous des marqueurs

À droite, le document original est barré et à gauche le contenu affiché dans les signets.

Comme expliqué sur le site Web d’Adobe, « les marqueurs généré automatiquement lors de la création du PDF à partir des entrées de la table des matières des documents créés par la plupart des programmes de PAO. Ces signets sont généralement balisés et peuvent être utilisés pour apporter des modifications au PDF. »

Lesdits marqueurs ils ont une hiérarchie, ils sont donc classés du plus haut au plus bas: titre de la section, sous-titres et, dans ce cas, les points, à leur tour classés en « 1. », « a. », « i. », etc. Le « problème » avec le PDF téléchargé par l’Union européenne est que Ces marqueurs, n’ayant pas été supprimés, permettent d’accéder au contenu presque complet du texte.

Et nous disons «presque» parce que le lecteur de signets Adobe Acrobat semble avoir une certaine limite de caractères qu’il peut afficher. Il n’indexe pas non plus le contenu marqué comme un paragraphePar conséquent, si quelque chose est barré dans un seul paragraphe, ni le contenu des tableaux ne peut être consulté. Mais ce n’est pas le seul type de «censure» que les entités ont appliqué. Il y en a un numérique, dont nous voyons déjà qu’il n’est pas parfait, et il semble y en avoir un analogique.

Haut de la page 10, bas de la page 11, qui semble numérisé.

Nous avons des exemples dans pages 11 et 34. Vous pouvez y voir que les pages semblent avoir été ajoutées par la suite, comme si elles avaient été imprimées, numérisées puis incorporées dans le PDF. La lettre est pixélisée, ce qui ne se produit généralement pas dans les PDF, et Adobe Acrobat ne nous permet pas de sélectionner le texte, mais nous permet plutôt de sélectionner une zone (ce qui se produit lorsque nous accédons à un PDF numérisé).

Malheureusement, ceux qui veulent accéder au document original ils ne pourront pas, puisque le document a été modifié. Celui disponible actuellement sur le site Web de l’Union européenne, qui est presque trois fois plus lourd que le fichier d’origine, n’a pas de signets, de sorte que le contenu censuré ne peut pas être consulté.