Aller au contenu principal
Definition

Chunk Relevance

Aussi designe par : Chunk score, Pertinence par chunk

Score interne attribue par les LLM a chaque morceau de texte (chunk) extrait d'une page lors du retrieval. Une chunk relevance elevee augmente la probabilite de citation.

La Chunk Relevance designe le score de pertinence qu’un LLM attribue a chaque morceau de texte (chunk) extrait d’une page lors de l’etape de retrieval. Les pipelines RAG decoupent les pages en chunks de 250 a 800 tokens, puis selectionnent les plus pertinents pour repondre a la requete utilisateur.

Un chunk a haute relevance partage trois caracteristiques mesurables : densite informationnelle elevee (au moins une donnee chiffree, un nom propre verifiable ou une opinion datee tous les 150 mots), structure auto-suffisante (le chunk peut etre lu et compris sans son contexte de page), et alignement semantique fort avec la requete (presence du keyword dans la premiere phrase, structure inverted pyramid).

Olaf Kopp a publie en 2025 une analyse qui identifie la chunk relevance comme l’un des deux facteurs les plus influents pour devenir citation-worthy aux yeux des LLM, avec la LLM readability. La structure de PostLayout d’Academie GEO (TL;DR de 40-220 caracteres en tete, KeyPoints de 3 a 7 bullets, FAQPage en bas) est concue pour maximiser la chunk relevance sur chaque article.