Définition doctrinale
Collision interprétative : phénomène où deux entités (marques, personnes, concepts, produits, organisations, lieux) partagent un voisinage sémantique suffisamment proche pour que le modèle les traite comme une seule entité, ou comme des variantes d’une même chose, produisant une synthèse hybride.
Formes courantes de collision
- Homonymie : même nom, entités différentes.
- Proximité de champ : secteurs proches, mots-clés voisins, audiences semblables.
- Collision marque-produit : le produit devient l’entité, la marque disparaît (ou l’inverse).
- Collision concept-personne : une idée est attribuée à tort comme doctrine stable d’un individu ou d’une organisation.
- Collision historique : rebranding, acquisition, changement de nom, scission d’entreprise.
- Collision multi-langue : traduction ou translittération qui rapproche artificiellement deux entités.
Symptômes observables
- Réponses qui attribuent des propriétés (fondateurs, produits, localisation, dates) à la mauvaise entité.
- Réponses qui cocitent des sources appartenant à deux entités distinctes comme si elles validaient la même chose.
- Résumés “justes en apparence” mais impossibles à vérifier, car les sources ne convergent pas.
- “Hallucination de synthèse” : la réponse assemble des morceaux cohérents séparément, mais incompatibles ensemble.
Pourquoi ça arrive
- Voisinage sémantique trop similaire : les contextes d’usage du nom se recouvrent fortement.
- Signal canonique insuffisant : l’entité n’impose pas de marqueurs d’identité stables (définitions, pages pivot, relations).
- Sources agrégées : pages comparatives, annuaires, listes, qui compressent les distinctions.
- Compression sémantique : réduction des nuances pour produire une réponse “moyenne”.
- Routage / retrieval : les bons documents sont récupérés, mais sans séparation nette, donc le modèle fusionne.