Infomaniak développe son IA pour améliorer la productivité des entreprises

Publié le 27 août 2021 par Team Infomaniak

Infomaniak prépare l’arrivée de l’intelligence artificielle (IA) dans ses outils de productivité pour améliorer la productivité des entreprises. La vie privée, la confidentialité et la maîtrise des données sont au coeur du développement : des points sur lesquels Infomaniak ne fait pas de concession. Activable sur option, l’IA développée par nos équipes respectera le cadre strict du RGPD et de la loi suisse sur la protection des données.

« Développer l’IA dans le strict cadre éthique d’Infomaniak pose d’importantes contraintes. Notre IA est au service des utilisateurs, rien d’autre. Elle ne reproduit pas de schémas sociaux injustes ou inégalitaires. Elle est cloisonnée pour respecter la vie privée de chaque utilisateur. Ces principes intangibles orientent tous nos choix techniques et méthodologiques. » François Kawala, Docteur en machine learning

Travaillez plus rapidement avec kDrive et le Webmail

Notre IA sera capable de retrouver et catégoriser vos fichiers et pièces jointes pour mettre rapidement la main sur vos :

factures
reçus
tickets de caisse
CV
bons de livraison
notes de frais
devis
fiches de paie
contrats
pièces d’identité
etc.

Chaque document sera automatiquement labellisé. Il suffira de cliquer sur une étiquette pour afficher la catégorie de contenu désirée. Vous pourrez par exemple afficher les factures d’un même fournisseur, les tickets de caisse d’un mois donné ou les fiches de paie de l’année écoulée. À terme, il sera même possible de créer soi-même ses propres labels.

Une intelligence artificielle éthique

« L’IA va simplifier le flux de travail des entreprises. Les gens trouveront plus rapidement les informations qui les intéressent et passeront moins de temps à trier ou classer des données. Nous allons développer cette technologie à notre façon, en protégeant avant tout la vie privée et la confidentialité. Nous veillerons toujours à ce que l’IA travaille pour les utilisateurs et pas pour d’autres raisons. »
Marc Oehler, CEO d’Infomaniak

Son activation est optionnelle. Vous gardez le contrôle.

Nous utilisons une intelligence artificielle dite « faible », comme la totalité des systèmes actuellement existants. Cela signifie que cette IA n’a pas conscience d’elle-même, n’a pas de sensibilité, encore moins d’esprit. Il ne s’agit donc pas de Terminator 😉

Il s’agit en fait d’un système d’apprentissage automatique opéré par un réseau artificiel de neurones : le deep learning. Cette technologie donne aux ordinateurs la capacité d’apprendre. La machine s’en sert pour analyser des données afin de prendre une décision en fonction des situations rencontrées. Elle devient capable d’isoler des formes, des visages, de distinguer des caractères dactylographiés, de repérer des signaux sur les marchés boursiers, de détecter des fraudes ou encore d’aider au diagnostic médical, par exemple. Chez Infomaniak, ce réseau neuronal est maîtrisé en interne et intégralement contenu dans notre infrastructure, en Suisse.

L’apprentissage se développe d’abord à partir de données publiques

Pour s’entraîner et fournir des résultats pertinents, notre IA est dépendante de deux points :

Les questions que nous lui posons
Les données qui servent à son apprentissage

Nous mettons en place un réseau de neurones puis nous lui donnons des problèmes à résoudre à partir de données publiques. Il s’agit ni plus ni moins de mathématiques et de statistiques que nous pourrions faire manuellement. L’IA permet simplement de répéter ces calculs plus rapidement. C’est tout son intérêt.

Concrètement, comment ça marche ?

Le modèle apprend à discerner les types de contenus à partir de lots de données publiques libres d’accès.

Nous lui fournissons des règles et des caractéristiques de base pour qu’il s’entraîne à trouver la meilleure combinaison possible entre celles-ci afin de distinguer les photos de vacances des photos de documents, les photos de factures des photos de pièces d’identité, etc.

Voici comment cela fonctionne :

D’abord : la phase initiale d’analyse et d’entraînement

Pour détecter les documents, notre modèle observe les pixels pour produire un ensemble de règles qui vont représenter des caractéristiques comme :

un taux de pixels blancs qui dépasserait 80%
l’absence de personnes dans l’image
des marges de tailles régulières
une forme carrée ou rectangulaire marquée dans la photo
etc.

C’est à l’issue de cet entraînement initial que l’algorithme est capable d’ignorer les photos privées pour se diriger spontanément vers les photos susceptibles d’être des documents pour les catégoriser avec des labels par la suite.

Ensuite : la phase d’amélioration et de renforcement

Déterminer et étiqueter les fichiers avec les bons labels ne représente que la moitié du travail. En effet, l’algorithme doit ensuite apprendre de l’utilisateur qui va nécessairement modifier des labels pour qu’ils correspondent davantage à ses fichiers. C’est par exemple le cas lorsqu’un utilisateur rectifie un nombre important de labels. Cet implicit user feedback, comme on l’appelle, est la prise en considération des actions de l’utilisateur pour améliorer la pertinence de l’algorithme afin de ne plus reproduire les mêmes erreurs.

Ces étapes sont continuellement répétées afin de nourrir l’algorithme, renforcer l’apprentissage et gagner en pertinence. En ajustant le poids et le seuil des caractéristiques, l’IA apprend à mieux reconnaître certains fichiers pour y apposer directement le bon label. À la longue, elle ne fait plus d’erreurs.

Une IA individuelle, isolée des autres utilisateurs

Pas de débordement possible. Pour les feedbacks personnels, nous prévoyons que chaque utilisateur puisse entraîner en quelque sorte « sa propre IA ». Aucune donnée ne peut fuiter à un autre utilisateur. Votre label « lune de miel » restera votre label. Idem pour un label personnalisé comme « sortie de boîte ». Personne d’autre que vous n’en aura connaissance.

Nous devons parfois aider la machine

Si un utilisateur retire 90% des labels de ses factures par exemple, c’est probablement parce que notre algorithme s’est trompé. Dans des situations complexes, un spécialiste de l’IA chez Infomaniak peut être amené à vérifier manuellement un fichier ou une série de fichiers en cas d’erreur. Il peut arriver que l’IA ne parvienne pas à résoudre le problème posé et donc à trouver le bon label. Si ce problème est insoluble, si et seulement si il s’agit d’un document, il faut aider la machine pour qu’elle puisse avancer et corriger son erreur.

Des fichiers expurgés d’informations personnelles et de métadonnées

Avant d’être sujet à une vérification manuelle, un document doit être expurgé de toute information permettant de le recouper avec son propriétaire.

La machine retire alors le lien avec le compte duquel il provient, supprime ses métadonnées (localisation, heure, date, appareil, etc.) et les mots trop spécifiques comme les prénoms, les surnoms, etc. Dès qu’il n’est plus possible de savoir à qui appartient un fichier, la vérification manuelle peut-être amorcée afin de remettre l’algorithme sur le droit chemin. De cette manière, nous nous assurons que l’IA vous fournisse toujours des résultats satisfaisants tout en respectant au maximum la vie privée des utilisateurs.

Notre engagement pour une IA éthique

Notre vision de l’intelligence artificielle est claire : augmenter la productivité de nos utilisateurs sans sacrifier la protection de la vie privée et de la confidentialité.

Vos données n’appartiennent qu’à vous
Notre technologie IA est indépendante
Elle est développée en interne, en Suisse
Elle ne passe par aucun fournisseur externe
Elle est déconnectée des autres utilisateurs
Tout est hébergé en Suisse, dans nos infrastructures
L’activation de l’IA est optionnelle et désactivée par défaut
Les informations sont exclusivement utilisées pour améliorer vos services, et en aucun cas à des fins marketing
L’examen manuel de fichiers est exceptionnel et ne permet pas de recouper une donnée avec son ou sa propriétaire
Les données sont anonymisées de façon non réversible (Differential Privacy)

Ces évolutions sont en cours de développement. Il faut néanmoins garder à l’esprit qu’il s’agit là de nos intentions dans le domaine de l’IA et que nous ne ne pouvons pas nous avancer trop précisément sur un agenda ou confirmer avec certitude telle ou telle fonctionnalité. Ceci étant dit, il nous semblait important de vous partager notre vision de l’intelligence artificielle et nous continuerons de vous tenir informés des avancées sur le blog et nos réseaux sociaux.

Infomaniak développe son IA pour améliorer la productivité des entreprises

Travaillez plus rapidement avec kDrive et le Webmail

Une intelligence artificielle éthique

Son activation est optionnelle. Vous gardez le contrôle.

L’apprentissage se développe d’abord à partir de données publiques

Concrètement, comment ça marche ?

D’abord : la phase initiale d’analyse et d’entraînement

Ensuite : la phase d’amélioration et de renforcement

Une IA individuelle, isolée des autres utilisateurs

Nous devons parfois aider la machine

Des fichiers expurgés d’informations personnelles et de métadonnées

Notre engagement pour une IA éthique

Pas encore chez Infomaniak ?

Suivez notre mouvement pour un Cloud plus éthique

Sur le même sujet

Euria : l’assistant IA souverain et gratuit pour ne plus dépendre des géants américains

Le chiffrement des e-mails est disponible sur toutes les adresses mail Infomaniak

Infomaniak lance un service Kubernetes managé dans son Public Cloud souverain