Ce guide vous aide à préparer vos sources XML avant de les soumettre à Genii. Il décrit ce que la plateforme accepte, ce qu’elle attend de votre côté, et comment éviter les erreurs d’import les plus courantes.
L’URL que vous nous transmettez doit respecter ces règles :
| Critère | Règle |
|---|---|
| Protocole | https:// obligatoire |
| Domaine | Nom de domaine valide (lettres, chiffres, tirets). Pas d’adresse IP, pas de port. |
| Extension du fichier | .xml, .xml.gz, .gz ou .aspx |
| Query string | Autorisée (ex. ?lang=fr) |
| Slash final | Toléré après l’extension |
<https://example.com/sitemap.xml>
<https://example.com/sitemap.xml.gz>
<https://example.com/sitemaps/pages.gz>
<https://example.com/feeds/sitemap.aspx>
<https://example.com/feeds/sitemap.aspx?lang=fr>
<https://example.com/sitemap.xml/>
<http://example.com/sitemap.xml> ← http:// non autorisé
<https://example.com/sitemap> ← extension manquante
<https://example.com/sitemap.json> ← extension non supportée
<https://192.168.1.1/sitemap.xml> ← IP non autorisée
<https://example.com:8080/sitemap.xml> ← port non autorisé
<ftp://example.com/sitemap.xml> ← protocole non supporté
Genii reconnaît trois formats. Le format est détecté automatiquement à la lecture de votre fichier.
<urlset>)Le format le plus courant, conforme au protocole sitemaps.org.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="<http://www.sitemaps.org/schemas/sitemap/0.9>">
<url>
<loc><https://example.com/page-1></loc>
<lastmod>2024-06-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc><https://example.com/page-2></loc>
</url>
</urlset>
Champs reconnus dans chaque <url> :
| Champ | Obligatoire | Ce que Genii en fait |
|---|---|---|
<loc> |
Oui | URL de la page à indexer |
<lastmod> |
Recommandé | Permet à Genii de sauter les pages déjà à jour lors d’une synchronisation. Sans <lastmod>, toutes les pages sont systématiquement re-traitées, ce qui rallonge les temps de synchronisation et consomme des ressources inutilement. |
<changefreq> |
Optionnel | Stocké à titre informatif. |
<priority> |
Recommandé | Détermine l’ordre dans lequel les pages sont traitées (priorité haute en premier). Utile sur les gros catalogues pour rafraîchir d’abord les pages stratégiques. |
Pour un catalogue volumineux (e-commerce, médias), nous vous recommandons fortement de fournir
<lastmod>au format ISO 8601 (ex.2024-06-01T14:30:00Z). C’est le levier principal pour réduire la durée et le coût de chaque cycle de synchronisation.
<sitemapindex>)