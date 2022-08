D’éminents démographes demandent au US Census Bureau d’abandonner une méthode controversée de protection de la confidentialité des participants aux enquêtes et aux recensements, affirmant qu’elle met en péril la facilité d’utilisation des chiffres qui sont à la base de l’infrastructure de données du pays.

Le Census Bureau a adopté pour la première fois l’utilisation d’algorithmes de confidentialité différentiels avec la publication l’année dernière de la première série de données du recensement de 2020. Ces chiffres ont été utilisés pour déterminer le nombre de sièges au Congrès que chaque État obtient, ainsi que pour redessiner les districts politiques dans le cadre d’un processus décennal appelé redécoupage.

Les démographes et d’autres chercheurs demandent dans une lettre au directeur du Bureau du recensement, Robert Santos, que l’agence abandonne les projets futurs d’utilisation des algorithmes sur deux autres publications de données importantes – les estimations annuelles de la population et les chiffres de l’American Community Survey. Les estimations démographiques annuelles sont utilisées dans la distribution de 1,5 billion de dollars de financement fédéral chaque année. L’American Community Survey fournit les données les plus complètes sur la façon dont les gens vivent aux États-Unis en posant des questions sur les temps de trajet, l’accès à Internet, la vie de famille, les revenus, les niveaux d’éducation, les handicaps, le service militaire et l’emploi.

Les méthodes de protection de la vie privée “sont inappropriées pour les ensembles de données d’une importance cruciale, qui sont fondamentales pour la démocratie américaine et pour l’équité dans le redécoupage, l’allocation des fonds et la planification des services gouvernementaux de toutes sortes”, indique la lettre.

Le Census Bureau a déclaré que les algorithmes de confidentialité différentiels sont nécessaires car, sans eux, la croissance de données tierces facilement disponibles combinée à l’informatique moderne pourrait permettre aux pirates de reconstituer l’identité des participants à ses recensements et enquêtes en violation de la loi. . Les anciennes méthodes de protection ne sont plus efficaces, selon l’agence statistique.

L’an dernier, un panel de trois juges fédéraux a refusé d’empêcher le Census Bureau d’utiliser les algorithmes après que leur utilisation ait été contestée dans le cadre d’un procès intenté par l’État de l’Alabama.

La consultante en recensement Terri Ann Lowenthal a déclaré que la lettre reflétait “le malaise important quant à l’utilité continue des données du Bureau de recensement à la lumière des nouveaux efforts pour protéger la confidentialité dans le monde moderne”.

“Les préoccupations vont au cœur de la mission du bureau, donc je suis sûr que la direction de l’agence les prendra au sérieux et, espérons-le, trouvera des solutions acceptables basées sur un engagement significatif des parties prenantes”, a déclaré Lowenthal, un ancien membre du Congrès spécialisé dans les questions de recensement.

La lettre a été dirigée par les membres du comité directeur de la Coopérative fédérale-État pour les estimations de la population, qui promeut la coopération et la communication entre le Bureau du recensement et les agences d’État responsables de la recherche démographique. Ses membres ont commencé à recueillir des signatures pour la lettre la semaine dernière auprès d’autres chercheurs et présenteront la lettre à Santos au cours des prochaines semaines.

Les algorithmes de confidentialité différentiels ajoutent des erreurs intentionnelles aux données pour masquer l’identité d’un participant donné. Il est plus visible dans les zones géographiques les plus petites, telles que les îlots de recensement. Pour le prochain recensement en 2030, les démographes ont recommandé d’utiliser d’autres méthodes pour protéger la confidentialité comme la combinaison de blocs avec peu de personnes.

Certaines des données détaillées qui ont été rendues publiques lors des recensements précédents ne seront pas publiées aux niveaux géographiques les plus petits, et les efforts pour appliquer l’algorithme ont retardé la publication de la prochaine série de données de recensement de 2020 jusqu’à l’année prochaine, près de deux ans après. aurait dû être libéré, selon la lettre.

“Ces données clés pour la planification du gouvernement local seront obsolètes lorsqu’elles seront enfin publiées”, a-t-il déclaré.

Le professeur émérite de sociologie de la City University of New York, Andrew Beveridge, a averti ce week-end lors de la conférence Joint Statistical Meetings à Washington que les fournisseurs de données privés sont prêts à “bondir” et à combler le vide si les chercheurs estiment que les données du Census Bureau sont inutilisables. Cela pourrait conduire à la privatisation de l’infrastructure statistique américaine, a déclaré Beveridge lors d’une présentation lors du plus grand rassemblement de statisticiens et d’utilisateurs de données en Amérique du Nord.

Les démographes affirment dans leur lettre que la crédibilité de l’agence statistique est en jeu, affirmant que “l’expérience de ces dernières années a sapé la confiance des utilisateurs dans le Census Bureau”.

Le mois dernier, lors d’une réunion parrainée par les Académies nationales sur la confidentialité différentielle, Santos a été interrogé sur la possibilité de revenir aux méthodes de confidentialité précédentes.

“Je comprends d’où tu viens. Je ressens votre douleur », a déclaré Santos. “Nous avons décidé que si nous voulons protéger les données dans la société d’aujourd’hui… ce n’est pas possible.”

Mike Schneider, l’Associated Press