La firme de Cupertino envisage de transformer Siri en un assistant si performant qu’il ne serait plus nécessaire de toucher l’écran pour contrôler ses applications.
Imaginez un assistant vocal unifié capable de comprendre des commandes complexes et d’agir dans toutes vos applications, natives comme tierces. C’est l’ambition portée par Apple pour mettre Siri à niveau à l’ère de l’intelligence artificielle (IA) générative.
Cette technologie appelée « App Intents » pourrait permettre de trouver une photo spécifique, d’y appliquer un filtre et de la publier sur Instagram par exemple avec une légende donnée, le tout sans toucher l’écran.
Il serait également possible d’ajouter des articles à un panier d’achat sur un site d’e-commerce ou d’organiser son agenda uniquement par la voix. Selon Bloomberg qui révèle l’information, une telle avancée représenterait l’accomplissement de la vision originelle de Siri, conçue il y a quinze ans.
À l’époque, l’IA générative relevait encore du rêve tout au plus et le constructeur d’iPhone dominait l’innovation au niveau du smartphone. ChatGPT, Gemini, Claude et les autres chatbots n’existaient pas encore.
Un enjeu stratégique majeur pour l’écosystème
Les enjeux sont considérables pour Apple. Sans cette fonctionnalité avancée, les futurs produits domotiques de la firme risqueraient d’être moins performants que ceux lancés par Amazon et Google il y a déjà cinq ans.
C’est précisément pourquoi les retards de Siri ont eu des répercussions en cascade sur l’ensemble de la stratégie produit de la marque à la pomme, contraignant notamment l’entreprise à reporter d’une année entière le lancement de son « écran intelligent ».
Face à ces défis, la firme de Cupertino a, selon Bloomberg, fait de cette fonctionnalité une priorité absolue pour ses équipes mondiales d’opérations de données, ces mêmes équipes chargées de comparer les performances de Siri et d’Apple Intelligence aux données brutes pour détecter les erreurs et proposer des correctifs.
Les tests sont actuellement menés sur des applications majeures telles qu’Uber, Amazon, YouTube, Facebook, WhatsApp, Threads et AllTrails afin de s’assurer que le système fonctionnera avec un nombre suffisant d’applications tout en maintenant un niveau de précision acceptable pour les scénarios critiques.
Le défi crucial de la confiance
Les défis techniques restent en effet immenses. Une erreur d’interprétation pourrait conduire à envoyer des photos privées aux mauvais destinataires, réserver un trajet Uber vers une destination incorrecte, ou commander des quantités aberrantes de produits.
D’où l’impérieuse nécessité de développement de mécanismes de confirmation sophistiqués et des standards de fiabilité irréprochables. La question de la vie privée demeure centrale. Un assistant vocal si puissant nécessite l’accès à des quantités considérables de données personnelles.
Ce développement matériel positionne Apple dans une course technologique mondiale. Sam Altman, PDG d’OpenAI, collabore avec Jony Ive, l’ancien designer de la maison pour créer un dispositif IA promis comme révolutionnaire.