Le monde numérique a apporté une commodité et une connectivité sans précédent, mais il a également suscité de vives inquiétudes quant à la confidentialité des données. Alors que nous partageons de plus en plus notre vie en ligne, le besoin de technologies robustes pour améliorer la protection de la vie privée est devenu primordial. L'apprentissage sur l'appareil est devenu un outil puissant pour protéger les données personnelles tout en permettant des capacités avancées. Dans ce blog, nous allons explorer l'apprentissage sur appareil, son rôle dans l'amélioration de la vie privée et la manière dont il est utilisé.
L'apprentissage sur l'appareil, parfois appelé apprentissage fédéré, est une approche d'apprentissage automatique qui permet d'entraîner des modèles directement sur l'appareil de l'utilisateur à l'aide des données disponibles sur cet appareil. Seules les mises à jour des paramètres du modèle sont envoyées à un serveur distant ou à un nuage. Cela signifie que le smartphone, la tablette ou tout autre appareil d'un utilisateur peut apprendre et s'adapter à ses préférences sans avoir à envoyer constamment ses données à des serveurs distants. Cela permet aux utilisateurs de mieux contrôler leurs données, de protéger leur vie privée et de réduire la nécessité d'envoyer des données individuelles brutes à des serveurs externes.
L'apprentissage sur appareil fonctionne selon les quatre principes suivants :
Grâce à l'apprentissage sur l'appareil, les détaillants en ligne peuvent obtenir des informations sur les préférences et les comportements des consommateurs sans avoir à suivre leurs préférences individuelles. Le principe est le suivant : l'appareil de chaque consommateur télécharge le modèle actuel et l'améliore grâce à l'apprentissage à partir des données de son téléphone. Les mises à jour du modèle provenant de chacun de ces appareils sont ensuite collectées, compilées, puis réinjectées dans le modèle central et améliorées. Ainsi, les spécialistes du marketing se contentent d'apprendre le modèle ou le comportement d'achat global sans jamais connaître les préférences ou les comportements individuels des consommateurs.
Examinons un exemple concret de séquence de collecte de données utilisant l'apprentissage sur appareil :
L'apprentissage sur l'appareil n'est pas parfait du point de vue de la protection de la vie privée. Lorsque les paramètres du modèle quittent l'appareil de l'utilisateur, des informations sur les données d'apprentissage locales sous-jacentes sont toujours divulguées. Pour éviter cela, l'apprentissage sur appareil est souvent associé à d'autres technologies de protection de la vie privée, telles que la confidentialité différentielle et le calcul sécurisé, que nous aborderons dans différents articles sur notre blog.
L'anonymat k est un concept et une technique de protection de la vie privée qui joue un rôle essentiel dans la sauvegarde des données sensibles. Voyons ce qu'est le k-anonymat et comment il est utilisé pour protéger les informations personnelles.
Le k-anonymat est un modèle de protection de la vie privée conçu pour protéger l'identité des personnes lorsque leurs données sont partagées, publiées ou analysées. Il garantit que les données ne peuvent pas être liées à une personne spécifique en les rendant indiscernables des données d'au moins "k-1" autres individus. En termes plus simples, le k-anonymat masque les informations personnelles au sein d'une foule, ce qui rend impossible l'identification d'une personne en particulier.
Le "k" dans l'anonymat k représente le nombre minimum de personnes similaires (ou "ensemble d'anonymat") au sein de l'ensemble de données avec lesquelles les données d'une personne doivent se fondre pour garantir la protection de sa vie privée. Par exemple, si k est fixé à 5, les données doivent être impossibles à distinguer des données d'au moins quatre autres personnes.
Pour mettre en œuvre l'anonymat k, les données doivent être généralisées afin de les rendre moins identifiables, tout en garantissant que chaque point de données est identique à un minimum de "k-1" autres entrées. Deux méthodes sont couramment utilisées à cette fin :
Les détaillants en ligne utilisent le k-anonymat pour protéger les données des clients tout en analysant l'historique des achats et les préférences afin d'améliorer leurs services et leurs recommandations.
Par exemple, des utilisateurs individuels peuvent être associés à des cohortes de données en fonction de leurs centres d'intérêt sur leur appareil mobile. Un annonceur peut alors cibler des personnes appartenant à des cohortes spécifiques. De cette manière, l'annonceur ne prend connaissance d'aucune information personnelle identifiable (PII) et apprend seulement qu'une personne donnée appartient à certaines cohortes. Et tant que les cohortes sont k-anonymes, elles protègent les utilisateurs contre la ré-identification, en particulier pour des valeurs élevées de k.
L'inconvénient de l'utilisation du k-anonymat est que la révélation de la seule cohorte à laquelle appartient un utilisateur peut parfois entraîner la fuite d'informations sensibles sur l'utilisateur. Cela est particulièrement vrai lorsque les cohortes sont basées sur des sujets sensibles tels que la race, la religion, l'orientation sexuelle, etc. Une solution simple à ce problème consiste à utiliser des catégories de cohortes prédéfinies et visibles par le public, comme dans Google Topics.
Dans tous les cas, les cohortes peuvent toujours être combinées ou corrélées et utilisées pour réidentifier les utilisateurs sur plusieurs sites. Cela dit, le k-anonymat est souvent associé à d'autres mesures de protection de la vie privée afin de réduire davantage la probabilité de réidentification.
Alors que les internautes passent de plus en plus de temps en ligne, les consommateurs exigent un meilleur contrôle de leur vie privée numérique. Ils se sentent particulièrement mal à l'aise avec les technologies de suivi numérique telles que les cookies tiers, qui permettent aux spécialistes du marketing de recueillir des informations sur leur comportement de navigation. Mais l'élimination des cookies tiers met les professionnels du marketing dans une situation délicate. Depuis plus de vingt ans, leurs entreprises s'appuient sur les cookies pour trouver de nouveaux clients.
Les agences gouvernementales aux États-Unis et en Europe ont répondu aux demandes des consommateurs en adoptant des réglementations qui offrent plus de protection et de contrôle aux utilisateurs sur la manière dont leurs données sont collectées et traitées. De nombreux navigateurs web ont déjà supprimé progressivement les cookies. Google est le dernier à avoir tenu bon et il est prévu qu'il élimine complètement les cookies d'ici à la fin de 2024.
Mais l'élimination pure et simple des cookies ne résoudra pas le problème de la protection de la vie privée des consommateurs. Les empreintes numériques ne cessent de s'étendre et les entreprises doivent être plus vigilantes que jamais pour protéger les données de leurs clients. Il existe une énorme opportunité de construire un écosystème publicitaire qui respecte plus que jamais la vie privée des utilisateurs.
Les technologies d'amélioration de la protection de la vie privée (PET) sont devenues un allié essentiel pour la sauvegarde des données des consommateurs. Cette technologie émergente utilise des techniques cryptographiques et statistiques avancées pour protéger les informations des consommateurs tout en permettant aux spécialistes du marketing de glaner des informations précieuses.
Les PET sont un ensemble d'outils et de méthodes conçus pour aider les organisations à préserver la confidentialité des données numériques. Ils fournissent une couche de défense contre la surveillance non désirée, les violations de données et la collecte injustifiée de données en renforçant le contrôle de l'utilisateur et en protégeant les données pendant leur cycle de vie. Les PET jouent un rôle essentiel dans le maintien de la vie privée, de la sécurité et de la liberté dans le domaine numérique.
Plusieurs types de PET sont utilisés dans l'écosystème de la publicité numérique :
Les PET joueront un rôle essentiel dans la création d'un écosystème publicitaire principalement axé sur la protection de la vie privée. Optable étudie l'utilisation de plusieurs types de TEP dans le cadre de la création d'un environnement respectueux de la vie privée dans lequel les clients peuvent collaborer en toute sécurité avec leurs partenaires de données. La série de blogs suivante démystifiera le monde complexe des PET et examinera de plus près la façon dont les annonceurs les utilisent.
Chez Optable, nous considérons l'interopérabilité avant tout sous l'angle des systèmes critiques de la publicité numérique. Lorsque l'on considère les systèmes utilisés pour la planification, l'activation et la mesure des campagnes publicitaires, on se rend rapidement compte que ces systèmes étaient tous intrinsèquement interopérables depuis longtemps grâce au partage généralisé des données. L'identité et le partage des données étant en voie de disparition pour diverses raisons, il est nécessaire de trouver de nouveaux moyens d'interopérer au sein de chacun de ces systèmes. Les salles blanches sont un moyen de parvenir à l'interopérabilité des données dans la publicité, et c'est la raison pour laquelle nous avons investi de manière significative dans ce domaine.
Mais le problème avec les salles blanches, c'est que les deux parties doivent accepter d'utiliser la même salle pour interopérer. L'idée centrale des technologies de salle blanche est que deux parties ou plus se réunissent autour d'un environnement informatique neutre, ce qui leur permet de se mettre d'accord sur les opérations à effectuer sur leurs ensembles de données respectifs, sur la structure de leurs ensembles de données d'entrée, sur les résultats générés par les opérations et, surtout, sur les personnes qui ont accès aux résultats. En outre, diverses technologies de protection de la vie privée peuvent être utilisées pour limiter et restreindre les résultats et les informations relatives aux ensembles de données d'entrée sous-jacents qui sont révélés.
Alors, à quoi ressemble une véritable interopérabilité pour les plateformes de collaboration de données, conçues dès le départ pour la publicité numérique ? Voici trois piliers importants :
✅ Intégration avec les principales couches de service de salle blanche DWH. Une couche de service de salle blanche DWH est l'ensemble des primitives (API et interfaces) mises à disposition par les principaux DWH (Google, AWS, Snowflake, etc.), qui permet de joindre des ensembles de données d'organisations disparates et de limiter les calculs. Optable rationalise cela en automatisant le flux de données minimisées vers/depuis les DWHes, et en fédérant le code à ces environnements. Le résultat final ? Un collaborateur disposant de données d'audience dans Snowflake peut facilement faire correspondre ses données d'audience avec les données d'un client d'Optable, le tout dans Snowflake en utilisant les primitives DCR de Snowflake pour permettre la confiance, sans que le client d'Optable n'ait à lever le petit doigt. Dans cet exemple, l'appariement lui-même se fait à l'intérieur de Snowflake, mais la même chose peut être faite avec d'autres couches de service de salle blanche de DWH.
Compatibilité avec des protocoles de calcul multipartites ouverts et sécurisés tels que Private Set Intersection (PSI). Que se passe-t-il si votre partenaire souhaite faire correspondre ses données d'audience avec les vôtres, mais qu'il ne peut pas transférer ses données dans un DWH basé sur le cloud ? Les protocoles SMPC tels que PSI permettent un appariement en double aveugle sur des ensembles de données cryptées, sans nécessiter le décryptage de l'ensemble des données. Les implémentations open-source fournissent une couche de service de salle blanche indépendamment vérifiable, bien que limitée dans ses objectifs. Le résultat final ? Un collaborateur disposant de données d'audience sur place peut exécuter un appariement crypté avec un client d'Optable à l'aide d'un utilitaire libre et gratuit.
✅ Résolution d'entité intégrée, gestion et activation d'audience, avec une intégration profonde à tous les principaux environnements cloud et de données. Dans le monde réel, peu d'organisations disposent de l'ensemble de leurs données utilisateur proprement connectées dans un environnement unique. Bien sûr, elles existent, mais le plus souvent, les organisations doivent effectuer un travail considérable pour rassembler, normaliser, assainir et connecter leurs données utilisateur afin de pouvoir planifier, activer et mesurer efficacement à l'aide de systèmes de collaboration de données. Il n'est donc pas étonnant que lorsque l IAB a publié son rapport sur l'état des données au début de cette année, les personnes interrogées ont cité des délais allant de plusieurs mois à plusieurs années pour mettre en place une technologie de salle blanche ! En outre, même lorsqu'une entreprise a rassemblé ses données d'utilisateur, ses partenaires ont souvent besoin d'aide pour résoudre les problèmes d'entité. C'est la raison pour laquelle Optable facilite la connexion des données utilisateur dans n'importe quel environnement ou système cloud en une vue cohérente et unifiée de l'enregistrement de l'utilisateur, dès la sortie de la boîte, sans aucun code requis. Vous avez une partie de vos données utilisateur dans votre CRM ? Une autre partie se trouve dans un système de stockage en nuage ? Et une autre dans votre DWH ? Aucun problème.
Chez Optable, nous pensons que ces piliers sont la base sur laquelle l'interopérabilité peut se développer, et nous nous associons à des pairs de l'industrie qui partagent la même vision. Restez à l'écoute pour d'autres annonces passionnantes sur ce front !
L'une des idées fausses les plus répandues sur les salles blanches et la collaboration en matière de données est qu'il est nécessaire d'avoir des tonnes de données identifiées.
La plupart des éditeurs que nous rencontrons sont préoccupés par la question suivante : "Disposons-nous vraiment de suffisamment de données pour générer des revenus significatifs ? Ne serons-nous pas limités par la taille du match, et ne pourrons-nous donc pas diffuser des médias à grande échelle ?"
En général, ils sont surpris d'apprendre que l'atténuation des faibles volumes de données identifiées fait partie des solutions offertes aujourd'hui par cette catégorie de technologie de collaboration en matière de données.
Quel que soit le peu de données identifiées dont dispose un éditeur donné, il peut bénéficier d'une croissance grâce aux technologies de collaboration en matière de données. La raison en est simple : toute campagne est meilleure lorsqu'elle commence avec des données réelles.
Après avoir trouvé un annonceur, l'éditeur a plusieurs options : l'une d'entre elles, très simple, consiste simplement à obtenir des informations sur l'audience trouvée. L'éditeur peut mieux comprendre les clients ou les prospects de la marque en fonction de ses propres données, ce qui lui permet de créer de meilleurs produits médiatiques. Cela montre également à la marque que l'éditeur touche la bonne audience pour elle. Les Insights sont proposés sous la forme d'un rapport qui fournit des chiffres globaux - par définition, il s'agit d'un produit qui ne porte pas atteinte à la vie privée.
La deuxième, et la plus importante, est la possibilité de créer une audience de prospection à partir du match. L'application de prospection d'Optable crée automatiquement une audience élargie qui offre échelle, performance et valeur lorsqu'il s'agit d'atteindre le bon public. De plus, nous le faisons dans le respect de la vie privée, puisque l'éditeur n'apprend pas l'intersection - seule l'audience de prospection devient éligible pour le ciblage.
Considérant que l'audience d'un éditeur est constituée d'utilisateurs identifiés et non identifiés qui partagent un certain nombre de caractéristiques, l'application de prospection en salle blanche d'Optable permet à un éditeur de configurer un modèle qui crée finalement une audience adressable suffisamment importante pour générer une croissance significative.
Pour les marques, l'utilisation de données sur les clients ou les prospects n'a pas non plus de facteur limitatif - en fait, peu de marques peuvent se vanter d'avoir des données significatives sur tous leurs clients. Pour tous les autres, l'objectif est de disposer de quelques données - suffisamment pour permettre à nos systèmes de prendre de meilleures décisions en matière d'audience.
Nous facilitons la collaboration entre les éditeurs de données pour toutes les parties : notre solution de bout en bout comprend une intégration directe pour l'activation directement à partir de la salle blanche, et offre une interopérabilité sans friction.
Compte tenu de l'émergence des médias de détail et de la démocratisation des données grâce aux API des entrepôts de données, la collaboration en matière de données devient rapidement une opportunité majeure de revenus.
Les éditeurs tournés vers l'avenir et désireux d'accroître leurs revenus doivent donner la priorité à des solutions à l'épreuve du temps et respectueuses de la vie privée pour générer des revenus.
Les organes de presse canadiens se sont engagés dans une bataille féroce avec Google et Meta au sujet du projet de loi C-18, également connu sous le nom de Loi sur les nouvelles en ligne, qui a été récemment promulgué. Cette loi, adoptée par le gouvernement canadien le 22 juin 2023, vise à soutenir l'écosystème journalistique canadien en établissant une taxe que les "intermédiaires d'information numérique" tels que Google et Meta doivent payer aux propriétaires de contenu vers lesquels ils établissent des liens.
Selon un schéma familier observé dans des lois similaires comme le News Media and Digital Platforms Mandatory Bargaining Code de l'Australie, Meta et Google ont riposté en supprimant les liens de leurs plateformes, notamment Instagram, Facebook et Google Search. Malheureusement, cette réaction sape l'essence même du projet de loi et devrait infliger un préjudice financier au journalisme canadien. Alors que Google et Meta affirment qu'ils ne cherchent qu'à obtenir une part de marché équitable pour leurs services, les éditeurs soutiennent que cela est injustifié puisque Google et Meta génèrent des milliards de revenus publicitaires alors que les journalistes peinent à joindre les deux bouts.
La dynamique en jeu ici est encore compliquée par le fait que les agences de médias et les marques, responsables d'une part importante des revenus des médias d'information, contrôlent les dépenses publicitaires. Ces dépenses publicitaires sont la principale source de revenus de Google et Meta, qui représentent 80 % des recettes publicitaires en ligne du pays.
Traditionnellement, les marques canadiennes et leurs agences ont alloué la majorité de leurs budgets publicitaires à ces deux sociétés. Cependant, la tendance est de plus en plus forte, sous l'effet d'une législation récente et d'une évolution plus générale de la publicité, d'investir directement les budgets médias auprès des éditeurs locaux. Face à cette impasse, de nombreuses agences et marques se sont engagées à soutenir les éditeurs canadiens. Par exemple, l'A2C au Québec a déjà pris des mesures pour encourager la collaboration entre les agences, les marques et les éditeurs locaux. Certaines agences considèrent cette question comme une question d'éthique et de responsabilité sociale. Des personnalités du monde des agences, comme Sarah Thompson, présidente de Dentsu Media, et Brian Cuddy, SVP Responsible Media Solutions chez Cossette, se sont fait les avocats du soutien aux éditeurs de presse canadiens. En réponse à l'annonce de Facebook selon laquelle toutes les nouvelles canadiennes seront retirées de leurs plateformes dans les semaines à venir, Sarah s'est rendue sur son LinkedIn pour partager son soutien aux nouvelles locales : "Nous sommes à un moment où il est nécessaire d'agir pour soutenir les médias locaux, qui sont plus que des nouvelles".
Outre les développements au sein de l'écosystème canadien, on observe des tendances émergentes dans la manière dont les spécialistes du marketing allouent leurs budgets pour les médias payants. Les responsables de la publicité souhaitent de plus en plus investir dans la publicité contextuelle et exploiter les données de première main des éditeurs pour un meilleur ciblage. Les canaux programmatiques, qui manquent de transparence en termes de retour sur investissement des médias, font également l'objet d'un examen plus approfondi. Par conséquent, la préférence va de plus en plus à l'achat direct. En outre, les stratégies de mesure s'éloignent de l'attribution numérique de la dernière décennie pour se tourner vers des méthodes plus traditionnelles, telles que l'analyse de la notoriété de la marque, la modélisation du mix média, la mesure de l'audience par des tiers et l'utilisation de données et d'études de recherche sur les consommateurs.
En substance, ces tendances indiquent un changement dans les attitudes et les choix des directeurs généraux et des dirigeants d'agences. Ils soutiennent activement un internet plus ouvert et plus équitable par le biais de leurs investissements publicitaires.
À l'instar d'autres législations, il est probable que Google et Meta devront verser des millions de dollars directement aux propriétaires de médias pour éviter l'imposition. Toutefois, le processus de finalisation de ces accords prendra du temps, laissant les éditeurs souffrir d'une baisse de trafic et d'une concurrence accrue avec ces géants de la technologie pour les revenus publicitaires. À long terme, il est possible que Google et Meta modifient leurs plateformes en supprimant complètement les liens. Le paysage économique a évolué pour ces entreprises, et il n'est pas déraisonnable de considérer leur première suppression de liens comme un test visant à évaluer les effets à long terme sur l'engagement des utilisateurs et les recettes potentielles.
Pour minimiser les risques, les éditeurs peuvent prendre des mesures proactives pour assurer la pérennité de leurs activités.
Voici quelques recommandations :
Les éditeurs canadiens bénéficient d'un soutien prometteur de la part des agences, des marques et du public, ce qui indique une trajectoire positive. Associée à la croissance des technologies de collaboration des données à l'épreuve du temps, cette situation offre aux éditeurs de médias d'information des possibilités remarquables de révolutionner leur production de revenus publicitaires. La loi sur l'information en ligne, qui préfigure l'avenir de la consommation d'informations, revêt une grande importance non seulement pour les Canadiens, mais aussi pour les Américains, puisque des projets de loi similaires ont été déposés au Congrès. Au milieu de ces avancées, nous nous trouvons à un moment critique pour l'internet ouvert, le journalisme et la démocratie dans son ensemble. De nombreux éditeurs canadiens ont déjà établi un partenariat avec Optable pour protéger leurs activités publicitaires, et pour ceux qui ne l'ont pas encore fait, nous sommes prêts à leur apporter notre aide !
Le Tech Lab de l'IAB publie aujourd'hui la version 1.0 de la norme d'interopérabilité en salle blanche Open Private Join and Activation (OPJA). Tout au long de l'année dernière, avec un nombre croissant de collaborateurs de l'industrie et de membres des groupes de travail " Privacy Enhancing Technologies" (PETs) et " Rearc Addressability" du Tech Lab, notre équipe a joué un rôle de premier plan dans le développement d'OPJA, dans le but de permettre une activation publicitaire interopérable et sans risque pour la vie privée, basée sur des données PII.
Au-delà de notre travail sur la proposition initiale, nous avons plusieurs objectifs plus larges avec OPJA :
Même si nous pensons que les fournisseurs de salles blanches et les plateformes de collaboration peuvent proposer leur propre version du cas d'utilisation de l'activation (beaucoup le font déjà), nous espérons qu'ils feront un effort pour évaluer et aligner leurs implémentations afin de mieux adhérer à l'OPJA, et nous avons l'intention de leur faciliter la tâche.
Pour atteindre nos objectifs, il était impératif de convenir d'une méthode fiable et indépendante permettant de faire correspondre et d'activer les données des utilisateurs dans le cadre d'une salle blanche multi-fournisseurs.
Il est essentiel d'effectuer ce travail de manière ouverte, car cela garantit qu'il est largement accessible et que tout fournisseur peut apporter des idées et examiner les protocoles et les technologies proposés. Les logiciels libres favorisent la transparence, la collaboration et l'inclusion dans le processus de développement. Nous pensons que la fourniture d'une base commune à laquelle tout le monde peut accéder, modifier et contribuer est essentielle pour parvenir à l'interopérabilité entre tous les fournisseurs, et non pas entre quelques uns.
Nous avons décidé de concentrer nos efforts initiaux en matière de normes d'interopérabilité sur le cas d'utilisation de l'activation, non seulement parce qu'il s'agit d'un cas d'utilisation fréquemment rencontré dans l'industrie, mais aussi parce que nous avons constaté une certaine confusion quant à la mesure dans laquelle les informations sur les utilisateurs sont échangées entre les parties qui permettent aujourd'hui ce cas d'utilisation selon des méthodes propriétaires.
À première vue, l'activation d'audiences qui se chevauchent à l'aide d'une salle blanche est simple. Prenons le cas d'un annonceur disposant d'une liste de clients et souhaitant afficher des publicités à ces clients lorsqu'ils interagissent avec les sites web ou les applications d'un éditeur. Si les utilisateurs ont fourni des informations d'identification personnelle, telles que leur adresse électronique, à l'éditeur et à l'annonceur directement, l'annonceur et l'éditeur peuvent comparer les ensembles de données dans une salle blanche afin de construire une audience d'utilisateurs qui se chevauchent. Voici un diagramme de Venn illustrant cette opération :
Bien que simple en apparence, le partage d'informations associées à des utilisateurs individuels présente plusieurs différences subtiles mais importantes qui peuvent survenir lorsqu'une telle opération est réalisée dans la pratique. Notamment, quelles nouvelles informations sur les utilisateurs l'annonceur et l'éditeur pourraient-ils obtenir à la suite de l'opération de mise en correspondance et de ciblage ? L'annonceur sera-t-il en mesure de savoir lesquels de ses clients individuels naviguent également sur les sites web de l'éditeur ? Et l'éditeur saura-t-il lesquels de ses utilisateurs enregistrés sont également des clients de l'annonceur ?
Pour répondre à ces questions, un ensemble standard d'objectifs de conception en matière de sécurité et de respect de la vie privée, d'exigences d'entrée et de sortie et de documentation claire concernant la mesure dans laquelle des informations privées sur les utilisateurs sont échangées entre les parties lors de la mise en œuvre du cas d'utilisation de l'activation publicitaire ont été élaborés et intégrés à la spécification OPJA. En fin de compte, notre objectif avec OPJA est de permettre le ciblage publicitaire sur des utilisateurs qui se chevauchent sans que les parties ne se communiquent d'informations sur l'utilisateur. Ce n'est pas seulement bon pour la vie privée de l'utilisateur final, mais cela empêche également le partage de données qui pourraient être exploitées par des concurrents.
Une caractéristique déterminante des salles blanches est qu'elles permettent de limiter la portée du traitement des données des utilisateurs contrôlées par plusieurs parties. Un exemple simple de cette caractéristique est la construction d'un rapport agrégé décrivant l'intersection de deux audiences provenant de parties distinctes. Dans un tel rapport, la réunion, le regroupement, l'agrégation et l'injection de bruit statistique peuvent tous être effectués dans une salle blanche, empêchant ainsi l'une ou l'autre partie d'apprendre quoi que ce soit sur les données de l'autre partie, à l'exception de ce qui est inclus dans le rapport prescrit.
Cette capacité de limitation des salles blanches est inhérente à l'opération d'activation de la correspondance prescrite par la spécification OPJA. Dans OPJA, une correspondance sécurisée est effectuée afin de déterminer quels utilisateurs individuels se trouvent à l'intersection des audiences provenant d'un annonceur et d'un éditeur. Plutôt que de partager la liste des utilisateurs correspondants avec l'une ou l'autre des parties, la présence ou l'absence de chaque utilisateur dans l'intersection est codée sous la forme d'une étiquette, puis cryptée. Ces étiquettes d'utilisateurs cryptées sont partagées avec l'éditeur qui ne peut pas les décrypter, mais qui est en mesure de les insérer dans les demandes de publicité. Les demandes de publicité sont traitées par des techniques publicitaires (SSP et DSP), et seul le DSP désigné par l'annonceur peut décrypter les étiquettes correspondantes, ce qui permet au DSP de décider s'il y a lieu d'enchérir pour la diffusion d'une publicité et quel en est le montant. Il est essentiel que les IIP telles que l'adresse électronique ou le numéro de téléphone ne soient jamais partagées ou transférées dans les demandes d'annonces, ou en dehors de l'opération de correspondance.
Tout aussi important, grâce au cryptage des étiquettes, OPJA permet de cacher à l'annonceur et à l'éditeur les informations concernant les utilisateurs individuels qui se trouvent dans l'intersection d'audience. Cela réduit les fuites de données entre les annonceurs et les éditeurs et permet le remarketing sans nécessiter le suivi de l'utilisateur. Fondamentalement, il s'agit d'une approche qui adhère aux principes de minimisation des données et de limitation des finalités de la protection de la vie privée dès la conception.
L'OPJA décrit deux approches permettant de faire correspondre les données PII des utilisateurs dans un cadre multifournisseur, et elles sont toutes deux basées sur des technologies de renforcement de la protection de la vie privée (PET). La première est une intersection d'ensembles privés déléguée, purement logicielle. Cette méthode permet de comparer des ensembles de données chiffrées à l'aide d'un chiffrement commutatif, sans déchiffrer les données. Le serveur d'assistance délégué ne peut pas décrypter les données de correspondance et n'est utilisé que pour exécuter la comparaison des données et générer des données cryptées pour l'activation. Une confiance supplémentaire dans le serveur d'assistance pourrait être assurée par une attestation à distance fournie par le matériel.
La seconde approche est basée sur des environnements d'exécution de confiance (TEE) fournis par le matériel. Cette méthode garantit que les données de correspondance sont cryptées exclusivement pour le matériel de traitement sécurisé fourni par un serveur d'assistance.
L'utilisation des TEP offre une base solide à partir de laquelle la confiance entre les fournisseurs concernant la manière dont les données des utilisateurs sont comparées peut être établie. L'appariement OPJA exige que les données restent protégées par le cryptage pendant le traitement, grâce à une combinaison de logiciels de cryptographie et de matériel TEE. Cela réduit considérablement le nombre d'éléments sur lesquels les fournisseurs et les prestataires de services doivent se faire confiance.
Les approches d'appariement de l'OPJA ne sont pas non plus théoriquement limitées à un seul nuage ou à un seul environnement d'infrastructure. Ces caractéristiques font des approches fondées sur les technologies de l'information et de la communication des candidats à l'interopérabilité dans un environnement multifournisseur.
Vous pouvez consulter la spécification de l'OPJA ainsi que les directives de l'IAB Tech Lab sur les salles blanches ici. En outre, voici la dernière annonce du Tech Lab concernant la version 1.0 de la spécification.
Pour une introduction amusante à l'OPJA, consultez l'excellent article de Digidayintitulé WTF is IAB Tech Lab's Open Private Join and Activation ?
Pour une démonstration simple de la façon dont le chiffrement commutatif peut être utilisé pour permettre une correspondance en double aveugle (non spécifique à OPJA), jetez un coup d'œil à ce petit explicatif ici.
Si vous êtes un fournisseur de données ou de technologie publicitaire (SSP, DSP, serveur publicitaire) intéressé par l'interopérabilité avec la plateforme de collaboration de données d'Optable en utilisant OPJA, nous serions ravis d'entendre parler de vous. Envoyez-nous un e-mail.
Enfin, nous espérons que l'OPJA servira de catalyseur pour de futures propositions ouvertes associées à la mesure, à la modélisation de l'audience et à d'autres cas d'utilisation qui impliquent le partage de données sensibles sur les utilisateurs entre les annonceurs et les éditeurs.
Alors que les cookies tiers et autres identifiants personnels publics meurent à petit feu, la publicité numérique réclame une approche nouvelle et plus efficace pour les remplacer. Pour combler ce vide, les salles blanches de données sont de plus en plus reconnues comme la solution, les annonceurs recherchant une solution qui fournit des données exploitables dans un cadre respectueux de la vie privée.
Cependant, leur succès, tout comme l'efficacité et l'échelle qu'elles offrent, dépend de leur capacité à relier les systèmes, les plateformes et les partenaires. C'est pourquoi il est essentiel d'offrir une approche sans friction pour la croissance des salles blanches de données.
Alors pourquoi les salles blanches de données sont-elles considérées comme le sauveur de la publicité numérique ? C'est parce qu'elles peuvent alimenter l'ensemble du processus publicitaire, de la fourniture d'informations à la planification de la campagne, en passant par l'activation, le ciblage et la mesure.
Les partenariats sont au cœur de l'approche de la salle blanche : entre annonceurs, éditeurs, fournisseurs de données et vendeurs. Pour assurer la réussite de ces partenariats, il faut une collaboration sans faille qui fonctionne à deux niveaux. Tout d'abord, le niveau du partenariat, où les éditeurs et les annonceurs s'unissent pour travailler avec la personne de leur choix et se lient de manière transparente dans un environnement sécurisé et respectueux de la vie privée.
Deuxièmement, le niveau technologique, en permettant aux salles blanches de se connecter facilement à toute plateforme tierce pertinente. Après tout, les entreprises veulent éviter les frustrations liées à des mises en œuvre sur mesure qui prennent du temps ou à l'incapacité des plateformes à interagir chaque fois qu'elles cherchent à s'engager dans un partenariat.
Ainsi, si la sécurité, la confidentialité et la conformité sont au cœur des salles blanches, elles doivent supprimer les obstacles qui étouffent cette collaboration.
En effet, la création de salles blanches qui permettent aux parties de collaborer directement, indépendamment des plateformes qu'elles utilisent, présente d'énormes avantages intrinsèques. C'est pourquoi, dès le départ, nous avons concentré nos efforts et nos ressources sur la mise au point de notre technologie afin que les utilisateurs puissent créer des salles blanches, puis mettre rapidement en place des partenariats en invitant les entreprises à se connecter sans que l'autre partie ait besoin d'être un utilisateur de notre plateforme. La valeur réelle est obtenue en offrant une solution facile pour réaliser cette collaboration indépendante de la plate-forme.
En fin de compte, toute technologie doit être un outil permettant d'éradiquer la complexité. Pour les salles blanches, cela se résume à l'interopérabilité.
En veillant à ce que les plateformes puissent se connecter et communiquer entre elles, on supprime les frictions liées à la coopération entre les entreprises. Qu'il s'agisse d'intégrer d'autres salles blanches de données ou de collaborer avec des partenaires sans que leurs données aient à quitter leur entrepôt de données, l'interopérabilité marque la prochaine phase de la création d'un environnement sans friction.
L'intérêt de l'interopérabilité est qu'elle nécessite un consensus. À maintes reprises, dans le domaine de la technologie publicitaire, la fragmentation et les silos ont empêché un marché d'évoluer et de prospérer. Toutefois, nous constatons que le secteur commence à s'attaquer à ce problème, le Tech Lab de l'IAB travaillant actuellement à la rédaction d'un ensemble de normes relatives aux salles blanches. Il s'agit d'une reconnaissance de l'importance des salles blanches et d'un point de départ essentiel pour l'interopérabilité, car c'est grâce à des normes convenues que cela devient possible.
Alors que de plus en plus d'entreprises cherchent à tester les salles blanches, il est essentiel pour leur réussite de s'assurer qu'il est facile d'établir des partenariats et que les technologies sont mutuellement compatibles. En fin de compte, en éliminant les obstacles, en supprimant les frictions, en encourageant la collaboration et en intégrant l'interopérabilité, les salles blanches de données peuvent réaliser leur potentiel et répondre aux besoins futurs du secteur de la publicité numérique.
Pour fonctionner comme elles le devraient, les salles blanches doivent apporter une infrastructure fluide, en temps réel et intégrable à la collaboration sur les données. Au cœur d'une telle offre, il doit y avoir une API qui permette à n'importe quel client de déployer l'approche de la salle blanche pour n'importe quel inventaire, n'importe quel type de données d'audience et n'importe quel fournisseur tiers de services en nuage.
Ainsi, toute application ou plateforme tierce devrait pouvoir bénéficier d'une salle blanche en intégrant son API pour une collaboration sécurisée et respectueuse de la vie privée.
Cela permet à son tour un flux de travail complet pour les médias numériques via l'API, et en prenant le service d'Optable comme exemple, cela se présente comme suit :
L'une des meilleures applications d'une API de salle blanche est la combinaison avec une plateforme de données clients (CDP). Une API peut être utilisée pour exploiter correctement les données d'audience hébergées dans une CDP, rendant ces données exploitables pour l'activation et la mesure avec des tiers.
Un autre bon exemple concerne les données et l'inventaire des jardins clos. Qu'il s'agisse de CTV, d'audio ou de formats web traditionnels, une API peut être utilisée pour stimuler efficacement les performances des annonceurs en s'appuyant sur les données réelles des clients.
En fin de compte, l'API est là pour faciliter l'exploitation de l'approche de la salle blanche des données dans n'importe quelle plateforme ou application tierce.