Open Methodology

Méthodologie ouverte

Premier protocole GEO au monde publiant intégralement son algorithme, ses poids, sa formule d'agrégation et ses templates de requêtes. Reproductible par tout opérateur tiers à ±5 points.

Pourquoi une méthodologie ouverte

Le marché GEO souffre d'une opacité algorithmique généralisée. AthenaHQ, BotSee, RivalSee, Profound, Promptmonitor et Otterly publient tous des scores de visibilité IA sans documenter leurs poids, leurs formules, leurs intervalles de confiance ni leurs protocoles de détection d'hallucinations. Aucun n'est reproductible. Aucun n'est auditable.

Le SOM Scorecard Protocol v2.0 inverse cette logique. Il publie l'intégralité de l'algorithme. La crédibilité du Score SOM ne repose plus sur la marque AI COMMAND, elle repose sur la traçabilité de chaque chiffre.

Notre moat reste l'infrastructure et l'expérience : orchestration cloud parallèle de 6 modèles, persistence Firestore, intelligence web temps réel, moteur de recommandations contextualisées, expérience SaaS de bout en bout. Le secret n'est pas dans la formule.

Score SOM v5.1

Les 10 facteurs calibrés

Chaque facteur est sourcé sur la recherche académique (Princeton GEO 2024, AirOps, SparkToro, Profound, Growth Memo) ou explicitement signalé comme décision d'ingénierie produit calibrée.

#FacteurPlage de poidsDescription
1Position decay1 / log(pos + e)Décroissance logarithmique de la position dans la liste
2Sentiment0.15 à 1.30negative, neutral, positive, strong_recommendation
3Hallucination0.70 ou 1.00Multiplicateur binaire si hallucination Critique ou Modérée détectée
4Consensus inter-modèles0.40 + 0.60 × ratioPlancher 0.40, prime aux marques citées par plusieurs modèles
5Narrative role0.10 à 1.005 niveaux : negative, passing, supporting, primary, hero
6Recommendation strength0.0 à 1.0 continuForce explicite de la recommandation par le LLM
7Evidence type0.60 à 1.158 types : verified_reviews, certification, case_study, etc.
8Knowledge freshness0.50 à 1.00Buckets années : 2026, 2025, 2024, older, uncertain
9Source authority tier0.75 à 1.205 tiers : tier1_press, tier1_linkedin, tier2_specialized, etc.
10Source diversity bonus+0% à +12% globalPlafonné, +2.5% par type de source distinct

La formule d'agrégation multiplicative

Le score final est obtenu par agrégation pondérée de scores par requête, eux-mêmes produits par une formule multiplicative à 5 facteurs combinant 10 sous-multiplicateurs. La formule est rigoureusement bornée à [0, 100], avec une décimale de précision.

# Score par requête
qualityMean   = mean(narrative, recStrength, evidence, freshness, authority)
queryScore    = posScore × sentScore × halluFactor × consensusFactor × qualityMean

# Agrégation pondérée par intent (0.55 à 1.00)
weightedNumerator   = Σ (intentWeight × queryScore)
weightedDenominator = Σ intentWeight

# Normalisation par MAX_PER_QUERY théorique
MAX_PER_QUERY     = positionDecay(1) × 1.30 × 1.0 × 1.0 × 1.07 ≈ 1.060
normalizedQuality = weightedNumerator / (weightedDenominator × MAX_PER_QUERY)

# Score final avec coverage sub-linéaire et diversity bonus
coverageFactor = √(citedWeight / weightedDenominator)
diversityBonus = min(1.12, 1 + 0.025 × min(sourceTypeCount, 5))
rawScore       = normalizedQuality × coverageFactor × diversityBonus × 100
finalScore     = round(min(100, max(0, rawScore)) × 10) / 10

Calcul publié intégralement dans le protocole v2.0 Part 8, avec exemple chiffré et valeurs de référence pour chaque facteur.

Système de grading A+ à F

Six grades calibrés sur la distribution réelle des scores SOM observés sur le corpus d'audits AI COMMAND. Asymétrique pour refléter la rareté des performances exceptionnelles.

GradePlage de scoreLecture
A+≥ 85.0Marque référence dominante
A70.0 à 84.9Très bonne visibilité IA
B55.0 à 69.9Visibilité correcte mais perfectible
C40.0 à 54.9Présence insuffisante
D20.0 à 39.9Visibilité critique
F0.0 à 19.9Invisibilité totale

Documents publiés et roadmap

Le protocole v2.0 et son annexe recommandations sont publiés et téléchargeables. La calibration sur 12 marques benchmark et le test inter-rater reliability sont en roadmap pour juillet et octobre 2026 respectivement.

Publié · Mai 2026

SOM Scorecard Protocol v2.0

Protocole méthodologique complet en 16 parties. Algorithme, formule, 130 templates de requêtes, protocole anti-hallucination, intervalles de confiance Wilson 90%.

Lire le document →

Publié · Mai 2026

Annexe Recommandations Paliers 2-4-5-6

Catalogue complet des leviers d'action par palier de score (D, B, A, A+) plus le playbook de mitigation du risque mono-model collapse.

Lire le document →

Roadmap · Juillet 2026

Calibration v2.0.1 : 12 marques benchmark

Grille de calibration sur 12 marques publiques françaises (Doctolib, Qonto, OVHcloud, Le Monde, Sciences Po, etc.) avec scores et IC 90% publiés.

Roadmap · Octobre 2026

Inter-rater reliability v2.0.2

Test de reproductibilité du protocole sur 5 équipes externes (3 cabinets, 2 universités). Cible Cohen κ ≥ 0.65 sur les grades.

Reproductibilité auditable

Tout opérateur peut reproduire le score à ±5 points

Si un opérateur tiers ne peut pas reproduire un score AI COMMAND à ±5 points en suivant strictement le protocole v2.0, c'est soit qu'il y a un bug à signaler, soit qu'une étape n'a pas été suivie. Aucun secret algorithmique ne s'y oppose.

Citation académique

ELMARQ AI COMMAND. (2026). SOM Scorecard Protocol v2.0:
Méthodologie ouverte de mesure de Share of Model.
ai-command.elmarq.fr/methodology