Apple travaillerait sur une nouvelle version de Siri basée sur la technologie des grands modèles de langage (LLM), qui pourrait offrir des fonctionnalités d’intelligence artificielle plus avancées aux utilisateurs d’iPhone et d’autres appareils Apple. Des indices sur ce projet ont été trouvés dans le code de la première bêta d’iOS 17.4, qui montre qu’Apple utilise l’API ChatGPT d’OpenAI pour tester ses propres modèles de langage. Les LLM sont des systèmes d’intelligence artificielle capables de comprendre et de générer du langage naturel à partir de grandes quantités de données textuelles. Des exemples de LLM sont GPT-3 et GPT-4 d’OpenAI, qui peuvent produire des textes cohérents et variés sur n’importe quel sujet, allant des articles de presse aux poèmes en passant par les codes informatiques. Ces modèles sont très puissants, mais aussi très gourmands en mémoire et en ressources de calcul, ce qui pose un défi pour les déployer sur des appareils mobiles comme les iPhone, qui ont une capacité de mémoire limitée.
Pour relever ce défi, les chercheurs d’Apple ont développé une technique innovante qui utilise la mémoire flash - la même mémoire où sont stockées vos applications et vos photos - pour stocker les données du modèle de langage. Cette technique permet de réduire le transfert de données entre la mémoire flash et la mémoire vive (RAM), et d’augmenter le débit de la mémoire flash, ce qui accélère le processus d’inférence du modèle de langage. C'est en tout cas ce qu'a suggéré une étude publiée le mois dernier.
L'article de recherche est intitulé "LLM in a flash : Efficient Large Language Model Inference with Limited Memory". Les auteurs y notent que la mémoire flash est plus abondante dans les appareils mobiles que la mémoire vive traditionnellement utilisée pour l'exécution des modèles. Ainsi, leur méthode contourne astucieusement cette limitation en utilisant deux techniques clés qui minimisent le transfert de données et maximisent le débit de la mémoire flash :
- le fenêtrage : il s'agit d'une méthode de recyclage. Au lieu de charger de nouvelles données chaque fois, le modèle d'IA réutilise une partie des données qu'il a déjà traitées. Cela réduit la nécessité d'aller constamment chercher des données en mémoire, ce qui rend le processus plus rapide et plus fluide ;
- regroupement lignes-colonnes : cette technique revient à lire un livre par morceaux plutôt qu'un mot à la fois. En regroupant les données plus efficacement, elles peuvent être lues plus rapidement à partir de la mémoire flash, ce qui accélère la capacité de l'IA à comprendre et à générer du langage.
Selon l'article, la combinaison de ces méthodes permet aux modèles d'IA de fonctionner jusqu'à deux fois la taille de la mémoire disponible de l'iPhone. Cela se traduit par une augmentation de la vitesse de 4 à 5 fois sur les processeurs standard (CPU) et de 20 à 25 fois sur les processeurs graphiques (GPU). Les auteurs ont écrit : « cette avancée est particulièrement cruciale pour le déploiement de modèles avancés dans des environnements à ressources limitées, ce qui élargit leur applicabilité et leur accessibilité ». Les analystes affirment qu'il s'agit d'une avancée majeure qui ouvre la voie à de nouvelles possibilités pour les futurs appareils d'Apple.
Selon le code d’iOS 17.4, Apple teste actuellement quatre modèles de langage différents.
Selon le code d’iOS 17.4, la mise à jour de l'OS de l'iPhone inclut un nouveau framework privé SiriSummarization qui fait appel à l'API ChatGPT d'OpenAI. Il semble qu'Apple l'utilise pour tester en interne ses nouvelles fonctionnalités d'IA.
Il existe également de nombreux exemples d'invites système pour le framework SiriSummarization dans iOS 17.4. Il s'agit notamment de messages tels que « résume s'il-te-plaît », « réponds à cette question s'il-te-plaît » et « résume le texte donné s'il-te-plaît ».
Les messages-guides du système indiquent également ce qu'il faut faire lorsqu'il reçoit des données sous la forme d'un iMessage ou d'un SMS. Cela correspond à un rapport précédent de Bloomberg, qui a déclaré qu'Apple travaillait sur l'intégration de l'IA dans l'application Messages qui peut « répondre à des questions et compléter...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.