Aller au contenu principal
Definition

RAG

Aussi designe par : Retrieval Augmented Generation, Generation augmentee par recuperation

Architecture qui combine un moteur de recherche (retrieval) et un modele de langage (generation), pour produire des reponses fondees sur des sources externes recuperees au moment de la requete.

Le RAG a ete formalise par Lewis et al chez Facebook AI Research en 2020 dans le papier arXiv 2005.11401. C’est l’architecture de tous les moteurs generatifs grand public en 2026 (ChatGPT Search, Perplexity, AI Overviews, Bing Copilot). Le pipeline typique : decoupage du contenu en chunks, vectorisation, retrieval par similarite, generation conditionnee sur les chunks recuperes. La consequence pour le GEO : un article doit etre lisible chunk par chunk, chaque passage devant porter une idee autonome.