Ce guide vous aide à préparer vos sources XML avant de les soumettre à Genii. Il décrit ce que la plateforme accepte, ce qu’elle attend de votre côté, et comment éviter les erreurs d’import les plus courantes.


1. Format de l’URL de votre source

L’URL que vous nous transmettez doit respecter ces règles :

Critère Règle
Protocole https:// obligatoire
Domaine Nom de domaine valide (lettres, chiffres, tirets). Pas d’adresse IP, pas de port.
Extension du fichier .xml, .xml.gz, .gz ou .aspx
Query string Autorisée (ex. ?lang=fr)
Slash final Toléré après l’extension

Exemples valides

<https://example.com/sitemap.xml>
<https://example.com/sitemap.xml.gz>
<https://example.com/sitemaps/pages.gz>
<https://example.com/feeds/sitemap.aspx>
<https://example.com/feeds/sitemap.aspx?lang=fr>
<https://example.com/sitemap.xml/>

Exemples invalides

<http://example.com/sitemap.xml>        ← http:// non autorisé
<https://example.com/sitemap>           ← extension manquante
<https://example.com/sitemap.json>      ← extension non supportée
<https://192.168.1.1/sitemap.xml>       ← IP non autorisée
<https://example.com:8080/sitemap.xml>  ← port non autorisé
<ftp://example.com/sitemap.xml>         ← protocole non supporté

2. Formats XML acceptés

Genii reconnaît trois formats. Le format est détecté automatiquement à la lecture de votre fichier.

Format 1 — Sitemap standard (<urlset>)

Le format le plus courant, conforme au protocole sitemaps.org.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="<http://www.sitemaps.org/schemas/sitemap/0.9>">

  <url>
    <loc><https://example.com/page-1></loc>
    <lastmod>2024-06-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>

  <url>
    <loc><https://example.com/page-2></loc>
  </url>

</urlset>

Champs reconnus dans chaque <url> :

Champ Obligatoire Ce que Genii en fait
<loc> Oui URL de la page à indexer
<lastmod> Recommandé Permet à Genii de sauter les pages déjà à jour lors d’une synchronisation. Sans <lastmod>, toutes les pages sont systématiquement re-traitées, ce qui rallonge les temps de synchronisation et consomme des ressources inutilement.
<changefreq> Optionnel Stocké à titre informatif.
<priority> Recommandé Détermine l’ordre dans lequel les pages sont traitées (priorité haute en premier). Utile sur les gros catalogues pour rafraîchir d’abord les pages stratégiques.

Pour un catalogue volumineux (e-commerce, médias), nous vous recommandons fortement de fournir <lastmod> au format ISO 8601 (ex. 2024-06-01T14:30:00Z). C’est le levier principal pour réduire la durée et le coût de chaque cycle de synchronisation.


Format 2 — Index de sitemaps (<sitemapindex>)