Le RAG a ete formalise par Lewis et al chez Facebook AI Research en 2020 dans le papier arXiv 2005.11401. C’est l’architecture de tous les moteurs generatifs grand public en 2026 (ChatGPT Search, Perplexity, AI Overviews, Bing Copilot). Le pipeline typique : decoupage du contenu en chunks, vectorisation, retrieval par similarite, generation conditionnee sur les chunks recuperes. La consequence pour le GEO : un article doit etre lisible chunk par chunk, chaque passage devant porter une idee autonome.
Definition
RAG
Aussi designe par : Retrieval Augmented Generation, Generation augmentee par recuperation
Architecture qui combine un moteur de recherche (retrieval) et un modele de langage (generation), pour produire des reponses fondees sur des sources externes recuperees au moment de la requete.