Infomaniak prépare l’arrivée de l’intelligence artificielle (IA) dans ses outils de productivité pour améliorer la productivité des entreprises. La vie privée, la confidentialité et la maîtrise des données sont au coeur du développement : des points sur lesquels Infomaniak ne fait pas de concession. Activable sur option, l’IA développée par nos équipes respectera le cadre strict du RGPD et de la loi suisse sur la protection des données.
« Développer l’IA dans le strict cadre éthique d’Infomaniak pose d’importantes contraintes. Notre IA est au service des utilisateurs, rien d’autre. Elle ne reproduit pas de schémas sociaux injustes ou inégalitaires. Elle est cloisonnée pour respecter la vie privée de chaque utilisateur. Ces principes intangibles orientent tous nos choix techniques et méthodologiques. » François Kawala, Docteur en machine learning
Travaillez plus rapidement avec kDrive et le Webmail
Notre IA sera capable de retrouver et catégoriser vos fichiers et pièces jointes pour mettre rapidement la main sur vos :
- factures
- reçus
- tickets de caisse
- CV
- bons de livraison
- notes de frais
- devis
- fiches de paie
- contrats
- pièces d’identité
- etc.
Chaque document sera automatiquement labellisé. Il suffira de cliquer sur une étiquette pour afficher la catégorie de contenu désirée. Vous pourrez par exemple afficher les factures d’un même fournisseur, les tickets de caisse d’un mois donné ou les fiches de paie de l’année écoulée. À terme, il sera même possible de créer soi-même ses propres labels.
Une intelligence artificielle éthique
« L’IA va simplifier le flux de travail des entreprises. Les gens trouveront plus rapidement les informations qui les intéressent et passeront moins de temps à trier ou classer des données. Nous allons développer cette technologie à notre façon, en protégeant avant tout la vie privée et la confidentialité. Nous veillerons toujours à ce que l’IA travaille pour les utilisateurs et pas pour d’autres raisons. » Marc Oehler, CEO d’Infomaniak
Son activation est optionnelle. Vous gardez le contrôle.
Nous utilisons une intelligence artificielle dite « faible », comme la totalité des systèmes actuellement existants. Cela signifie que cette IA n’a pas conscience d’elle-même, n’a pas de sensibilité, encore moins d’esprit. Il ne s’agit donc pas de Terminator 😉
Il s’agit en fait d’un système d’apprentissage automatique opéré par un réseau artificiel de neurones : le deep learning. Cette technologie donne aux ordinateurs la capacité d’apprendre. La machine s’en sert pour analyser des données afin de prendre une décision en fonction des situations rencontrées. Elle devient capable d’isoler des formes, des visages, de distinguer des caractères dactylographiés, de repérer des signaux sur les marchés boursiers, de détecter des fraudes ou encore d’aider au diagnostic médical, par exemple. Chez Infomaniak, ce réseau neuronal est maîtrisé en interne et intégralement contenu dans notre infrastructure, en Suisse.
L’apprentissage se développe d’abord à partir de données publiques
Pour s’entraîner et fournir des résultats pertinents, notre IA est dépendante de deux points :
- Les questions que nous lui posons
- Les données qui servent à son apprentissage
Nous mettons en place un réseau de neurones puis nous lui donnons des problèmes à résoudre à partir de données publiques. Il s’agit ni plus ni moins de mathématiques et de statistiques que nous pourrions faire manuellement. L’IA permet simplement de répéter ces calculs plus rapidement. C’est tout son intérêt.
Concrètement, comment ça marche ?
Le modèle apprend à discerner les types de contenus à partir de lots de données publiques libres d’accès.
Nous lui fournissons des règles et des caractéristiques de base pour qu’il s’entraîne à trouver la meilleure combinaison possible entre celles-ci afin de distinguer les photos de vacances des photos de documents, les photos de factures des photos de pièces d’identité, etc.
Voici comment cela fonctionne :
D’abord : la phase initiale d’analyse et d’entraînement
Pour détecter les documents, notre modèle observe les pixels pour produire un ensemble de règles qui vont représenter des caractéristiques comme :
- un taux de pixels blancs qui dépasserait 80%
- l’absence de personnes dans l’image
- des marges de tailles régulières
- une forme carrée ou rectangulaire marquée dans la photo
- etc.
C’est à l’issue de cet entraînement initial que l’algorithme est capable d’ignorer les photos privées pour se diriger spontanément vers les photos susceptibles d’être des documents pour les catégoriser avec des labels par la suite.
Ensuite : la phase d’amélioration et de renforcement
Déterminer et étiqueter les fichiers avec les bons labels ne représente que la moitié du travail. En effet, l’algorithme doit ensuite apprendre de l’utilisateur qui va nécessairement modifier des labels pour qu’ils correspondent davantage à ses fichiers. C’est par exemple le cas lorsqu’un utilisateur rectifie un nombre important de labels. Cet implicit user feedback, comme on l’appelle, est la prise en considération des actions de l’utilisateur pour améliorer la pertinence de l’algorithme afin de ne plus reproduire les mêmes erreurs.
Ces étapes sont continuellement répétées afin de nourrir l’algorithme, renforcer l’apprentissage et gagner en pertinence. En ajustant le poids et le seuil des caractéristiques, l’IA apprend à mieux reconnaître certains fichiers pour y apposer directement le bon label. À la longue, elle ne fait plus d’erreurs.
Une IA individuelle, isolée des autres utilisateurs
Pas de débordement possible. Pour les feedbacks personnels, nous prévoyons que chaque utilisateur puisse entraîner en quelque sorte « sa propre IA ». Aucune donnée ne peut fuiter à un autre utilisateur. Votre label « lune de miel » restera votre label. Idem pour un label personnalisé comme « sortie de boîte ». Personne d’autre que vous n’en aura connaissance.
Nous devons parfois aider la machine
Si un utilisateur retire 90% des labels de ses factures par exemple, c’est probablement parce que notre algorithme s’est trompé. Dans des situations complexes, un spécialiste de l’IA chez Infomaniak peut être amené à vérifier manuellement un fichier ou une série de fichiers en cas d’erreur. Il peut arriver que l’IA ne parvienne pas à résoudre le problème posé et donc à trouver le bon label. Si ce problème est insoluble, si et seulement si il s’agit d’un document, il faut aider la machine pour qu’elle puisse avancer et corriger son erreur.
Des fichiers expurgés d’informations personnelles et de métadonnées
Avant d’être sujet à une vérification manuelle, un document doit être expurgé de toute information permettant de le recouper avec son propriétaire.
La machine retire alors le lien avec le compte duquel il provient, supprime ses métadonnées (localisation, heure, date, appareil, etc.) et les mots trop spécifiques comme les prénoms, les surnoms, etc. Dès qu’il n’est plus possible de savoir à qui appartient un fichier, la vérification manuelle peut-être amorcée afin de remettre l’algorithme sur le droit chemin. De cette manière, nous nous assurons que l’IA vous fournisse toujours des résultats satisfaisants tout en respectant au maximum la vie privée des utilisateurs.
Notre engagement pour une IA éthique
Notre vision de l’intelligence artificielle est claire : augmenter la productivité de nos utilisateurs sans sacrifier la protection de la vie privée et de la confidentialité.
- Vos données n’appartiennent qu’à vous
- Notre technologie IA est indépendante
- Elle est développée en interne, en Suisse
- Elle ne passe par aucun fournisseur externe
- Elle est déconnectée des autres utilisateurs
- Tout est hébergé en Suisse, dans nos infrastructures
- L’activation de l’IA est optionnelle et désactivée par défaut
- Les informations sont exclusivement utilisées pour améliorer vos services, et en aucun cas à des fins marketing
- L’examen manuel de fichiers est exceptionnel et ne permet pas de recouper une donnée avec son ou sa propriétaire
- Les données sont anonymisées de façon non réversible (Differential Privacy)
Ces évolutions sont en cours de développement. Il faut néanmoins garder à l’esprit qu’il s’agit là de nos intentions dans le domaine de l’IA et que nous ne ne pouvons pas nous avancer trop précisément sur un agenda ou confirmer avec certitude telle ou telle fonctionnalité. Ceci étant dit, il nous semblait important de vous partager notre vision de l’intelligence artificielle et nous continuerons de vous tenir informés des avancées sur le blog et nos réseaux sociaux.
Pas encore chez Infomaniak ?
Infomaniak permet de rédiger et répondre à ses e-mails avec une IA souveraine
vendredi 10 novembre 2023
Nouvelle loi sur la protection des données (nLPD) : qu’est-ce que cela change ?
mercredi 20 septembre 2023