Le glossaire Advalians

Notre glossaire, méticuleusement élaboré, est votre boussole dans l’univers complexe et dynamique du marketing, de la communication et du digital. Ici, chaque terme est une clé que nous vous aidons à décrypter pour vous ouvrir a des concepts innovants et des stratégies éprouvées. Plongez dans nos thématiques pour éclairer votre chemin vers l’excellence et la créativité.

Accueil > Glossaire > L > Latence

Latence :

Définition Latence :

En intelligence artificielle, la latence désigne le temps écoulé entre la soumission d’une requête à un système (ex. : un prompt) et la réception de la réponse générée. Elle constitue un indicateur de performance essentiel, en particulier pour les applications en temps réel.

Décryptage Advalians Latence :

Une faible latence est critique dans les cas d’usage interactifs : chatbots, assistants vocaux, recommandations dynamiques, analyse vidéo en direct, etc. La latence dépend de plusieurs facteurs : la complexité du modèle, l’architecture matérielle (CPU, GPU, TPU), l’optimisation logicielle, la taille du batch, ou encore la charge du système. Elle peut aussi varier en fonction de la localisation du serveur (latence réseau). Pour l’utilisateur final, une latence élevée nuit à l’expérience : lenteur, ruptures de dialogue, ou manque de fluidité. Pour les équipes techniques, réduire la latence implique d’arbitrer entre précision du modèle et vitesse d’exécution, de choisir des formats de modèles adaptés (distilled, quantized) et de monitorer les performances en continu. La latence devient aussi un enjeu de coût, car elle impacte la consommation de ressources et l’échelle de déploiement.

Pour aller plus loin :

Liste des thématiques