Open Methodology

Méthodologie ouverte

Premier protocole GEO au monde publiant intégralement son algorithme, ses poids, sa formule d'agrégation et ses templates de requêtes. Reproductible par tout opérateur tiers à ±5 points.

Pourquoi une méthodologie ouverte

Le marché GEO souffre d'une opacité algorithmique généralisée. AthenaHQ, BotSee, RivalSee, Profound, Promptmonitor et Otterly publient tous des scores de visibilité IA sans documenter leurs poids, leurs formules, leurs intervalles de confiance ni leurs protocoles de détection d'hallucinations. Aucun n'est reproductible. Aucun n'est auditable.

Le SOM Scorecard Protocol v2.0 inverse cette logique. Il publie l'intégralité de l'algorithme. La crédibilité du Score SOM ne repose plus sur la marque AI COMMAND, elle repose sur la traçabilité de chaque chiffre.

Notre moat reste l'infrastructure et l'expérience : orchestration cloud parallèle de 6 modèles, persistence Firestore, intelligence web temps réel, moteur de recommandations contextualisées, expérience SaaS de bout en bout. Le secret n'est pas dans la formule.

Score SOM v5.1

Les 10 facteurs calibrés

Chaque facteur est sourcé sur la recherche académique (Princeton GEO 2024, AirOps, SparkToro, Profound, Growth Memo) ou explicitement signalé comme décision d'ingénierie produit calibrée.

#	Facteur	Plage de poids	Description
1	Position decay	1 / log(pos + e)	Décroissance logarithmique de la position dans la liste
2	Sentiment	0.15 à 1.30	negative, neutral, positive, strong_recommendation
3	Hallucination	0.70 ou 1.00	Multiplicateur binaire si hallucination Critique ou Modérée détectée
4	Consensus inter-modèles	0.40 + 0.60 × ratio	Plancher 0.40, prime aux marques citées par plusieurs modèles
5	Narrative role	0.10 à 1.00	5 niveaux : negative, passing, supporting, primary, hero
6	Recommendation strength	0.0 à 1.0 continu	Force explicite de la recommandation par le LLM
7	Evidence type	0.60 à 1.15	8 types : verified_reviews, certification, case_study, etc.
8	Knowledge freshness	0.50 à 1.00	Buckets années : 2026, 2025, 2024, older, uncertain
9	Source authority tier	0.75 à 1.20	5 tiers : tier1_press, tier1_linkedin, tier2_specialized, etc.
10	Source diversity bonus	+0% à +12% global	Plafonné, +2.5% par type de source distinct

La formule d'agrégation multiplicative

Le score final est obtenu par agrégation pondérée de scores par requête, eux-mêmes produits par une formule multiplicative à 5 facteurs combinant 10 sous-multiplicateurs. La formule est rigoureusement bornée à [0, 100], avec une décimale de précision.

# Score par requête
qualityMean   = mean(narrative, recStrength, evidence, freshness, authority)
queryScore    = posScore × sentScore × halluFactor × consensusFactor × qualityMean

# Agrégation pondérée par intent (0.55 à 1.00)
weightedNumerator   = Σ (intentWeight × queryScore)
weightedDenominator = Σ intentWeight

# Normalisation par MAX_PER_QUERY théorique
MAX_PER_QUERY     = positionDecay(1) × 1.30 × 1.0 × 1.0 × 1.07 ≈ 1.060
normalizedQuality = weightedNumerator / (weightedDenominator × MAX_PER_QUERY)

# Score final avec coverage sub-linéaire et diversity bonus
coverageFactor = √(citedWeight / weightedDenominator)
diversityBonus = min(1.12, 1 + 0.025 × min(sourceTypeCount, 5))
rawScore       = normalizedQuality × coverageFactor × diversityBonus × 100
finalScore     = round(min(100, max(0, rawScore)) × 10) / 10

Calcul publié intégralement dans le protocole v2.0 Part 8, avec exemple chiffré et valeurs de référence pour chaque facteur.

Système de grading A+ à F

Six grades calibrés sur la distribution réelle des scores SOM observés sur le corpus d'audits AI COMMAND. Asymétrique pour refléter la rareté des performances exceptionnelles.

Grade	Plage de score	Lecture
A+	≥ 85.0	Marque référence dominante
A	70.0 à 84.9	Très bonne visibilité IA
B	55.0 à 69.9	Visibilité correcte mais perfectible
C	40.0 à 54.9	Présence insuffisante
D	20.0 à 39.9	Visibilité critique
F	0.0 à 19.9	Invisibilité totale

Documents publiés et roadmap

Le protocole v2.0 et son annexe recommandations sont publiés et téléchargeables. La calibration sur 12 marques benchmark et le test inter-rater reliability sont en roadmap pour juillet et octobre 2026 respectivement.

Publié · Mai 2026

SOM Scorecard Protocol v2.0

Protocole méthodologique complet en 16 parties. Algorithme, formule, 130 templates de requêtes, protocole anti-hallucination, intervalles de confiance Wilson 90%.

Lire le document →

Publié · Mai 2026

Annexe Recommandations Paliers 2-4-5-6

Catalogue complet des leviers d'action par palier de score (D, B, A, A+) plus le playbook de mitigation du risque mono-model collapse.

Lire le document →

Roadmap · Juillet 2026

Calibration v2.0.1 : 12 marques benchmark

Grille de calibration sur 12 marques publiques françaises (Doctolib, Qonto, OVHcloud, Le Monde, Sciences Po, etc.) avec scores et IC 90% publiés.

Roadmap · Octobre 2026

Inter-rater reliability v2.0.2

Test de reproductibilité du protocole sur 5 équipes externes (3 cabinets, 2 universités). Cible Cohen κ ≥ 0.65 sur les grades.

Reproductibilité auditable

Tout opérateur peut reproduire le score à ±5 points

Si un opérateur tiers ne peut pas reproduire un score AI COMMAND à ±5 points en suivant strictement le protocole v2.0, c'est soit qu'il y a un bug à signaler, soit qu'une étape n'a pas été suivie. Aucun secret algorithmique ne s'y oppose.

Télécharger le protocole v2.0 Contacter l'équipe méthodologie

Citation académique

ELMARQ AI COMMAND. (2026). SOM Scorecard Protocol v2.0:
Méthodologie ouverte de mesure de Share of Model.
ai-command.elmarq.fr/methodology