Open Methodology
Premier protocole GEO au monde publiant intégralement son algorithme, ses poids, sa formule d'agrégation et ses templates de requêtes. Reproductible par tout opérateur tiers à ±5 points.
Le marché GEO souffre d'une opacité algorithmique généralisée. AthenaHQ, BotSee, RivalSee, Profound, Promptmonitor et Otterly publient tous des scores de visibilité IA sans documenter leurs poids, leurs formules, leurs intervalles de confiance ni leurs protocoles de détection d'hallucinations. Aucun n'est reproductible. Aucun n'est auditable.
Le SOM Scorecard Protocol v2.0 inverse cette logique. Il publie l'intégralité de l'algorithme. La crédibilité du Score SOM ne repose plus sur la marque AI COMMAND, elle repose sur la traçabilité de chaque chiffre.
Notre moat reste l'infrastructure et l'expérience : orchestration cloud parallèle de 6 modèles, persistence Firestore, intelligence web temps réel, moteur de recommandations contextualisées, expérience SaaS de bout en bout. Le secret n'est pas dans la formule.
Score SOM v5.1
Chaque facteur est sourcé sur la recherche académique (Princeton GEO 2024, AirOps, SparkToro, Profound, Growth Memo) ou explicitement signalé comme décision d'ingénierie produit calibrée.
| # | Facteur | Plage de poids | Description |
|---|---|---|---|
| 1 | Position decay | 1 / log(pos + e) | Décroissance logarithmique de la position dans la liste |
| 2 | Sentiment | 0.15 à 1.30 | negative, neutral, positive, strong_recommendation |
| 3 | Hallucination | 0.70 ou 1.00 | Multiplicateur binaire si hallucination Critique ou Modérée détectée |
| 4 | Consensus inter-modèles | 0.40 + 0.60 × ratio | Plancher 0.40, prime aux marques citées par plusieurs modèles |
| 5 | Narrative role | 0.10 à 1.00 | 5 niveaux : negative, passing, supporting, primary, hero |
| 6 | Recommendation strength | 0.0 à 1.0 continu | Force explicite de la recommandation par le LLM |
| 7 | Evidence type | 0.60 à 1.15 | 8 types : verified_reviews, certification, case_study, etc. |
| 8 | Knowledge freshness | 0.50 à 1.00 | Buckets années : 2026, 2025, 2024, older, uncertain |
| 9 | Source authority tier | 0.75 à 1.20 | 5 tiers : tier1_press, tier1_linkedin, tier2_specialized, etc. |
| 10 | Source diversity bonus | +0% à +12% global | Plafonné, +2.5% par type de source distinct |
Le score final est obtenu par agrégation pondérée de scores par requête, eux-mêmes produits par une formule multiplicative à 5 facteurs combinant 10 sous-multiplicateurs. La formule est rigoureusement bornée à [0, 100], avec une décimale de précision.
# Score par requête qualityMean = mean(narrative, recStrength, evidence, freshness, authority) queryScore = posScore × sentScore × halluFactor × consensusFactor × qualityMean # Agrégation pondérée par intent (0.55 à 1.00) weightedNumerator = Σ (intentWeight × queryScore) weightedDenominator = Σ intentWeight # Normalisation par MAX_PER_QUERY théorique MAX_PER_QUERY = positionDecay(1) × 1.30 × 1.0 × 1.0 × 1.07 ≈ 1.060 normalizedQuality = weightedNumerator / (weightedDenominator × MAX_PER_QUERY) # Score final avec coverage sub-linéaire et diversity bonus coverageFactor = √(citedWeight / weightedDenominator) diversityBonus = min(1.12, 1 + 0.025 × min(sourceTypeCount, 5)) rawScore = normalizedQuality × coverageFactor × diversityBonus × 100 finalScore = round(min(100, max(0, rawScore)) × 10) / 10
Calcul publié intégralement dans le protocole v2.0 Part 8, avec exemple chiffré et valeurs de référence pour chaque facteur.
Six grades calibrés sur la distribution réelle des scores SOM observés sur le corpus d'audits AI COMMAND. Asymétrique pour refléter la rareté des performances exceptionnelles.
| Grade | Plage de score | Lecture |
|---|---|---|
| A+ | ≥ 85.0 | Marque référence dominante |
| A | 70.0 à 84.9 | Très bonne visibilité IA |
| B | 55.0 à 69.9 | Visibilité correcte mais perfectible |
| C | 40.0 à 54.9 | Présence insuffisante |
| D | 20.0 à 39.9 | Visibilité critique |
| F | 0.0 à 19.9 | Invisibilité totale |
Le protocole v2.0 et son annexe recommandations sont publiés et téléchargeables. La calibration sur 12 marques benchmark et le test inter-rater reliability sont en roadmap pour juillet et octobre 2026 respectivement.
Protocole méthodologique complet en 16 parties. Algorithme, formule, 130 templates de requêtes, protocole anti-hallucination, intervalles de confiance Wilson 90%.
Lire le document →
Catalogue complet des leviers d'action par palier de score (D, B, A, A+) plus le playbook de mitigation du risque mono-model collapse.
Lire le document →
Grille de calibration sur 12 marques publiques françaises (Doctolib, Qonto, OVHcloud, Le Monde, Sciences Po, etc.) avec scores et IC 90% publiés.
Test de reproductibilité du protocole sur 5 équipes externes (3 cabinets, 2 universités). Cible Cohen κ ≥ 0.65 sur les grades.
Reproductibilité auditable
Si un opérateur tiers ne peut pas reproduire un score AI COMMAND à ±5 points en suivant strictement le protocole v2.0, c'est soit qu'il y a un bug à signaler, soit qu'une étape n'a pas été suivie. Aucun secret algorithmique ne s'y oppose.
ELMARQ AI COMMAND. (2026). SOM Scorecard Protocol v2.0: Méthodologie ouverte de mesure de Share of Model. ai-command.elmarq.fr/methodology