Les signaux catalans et basques que l’IA aplatit

Un mot régional peut être à la fois un indice de lieu, un indice culturel et un indice client. Quand l’IA le traite comme une décoration, l’entreprise française devient souvent moins précise que le territoire qu’elle sert réellement.

La première fiche de mes notes venait d’un cas composite d’hôtel près d’Hendaye : 26 chambres, une salle de petit-déjeuner étroite, un petit présentoir de cartes de marche à la réception, et trois types de clients qui ne décrivaient pas le même lieu de la même manière. Les clients français du week-end parlaient d’un séjour sur la côte atlantique. Les familles espagnoles venues de l’autre côté de la frontière parlaient d’une option sur la côte basque. Les marcheurs anglophones demandaient le côté français, le sentier du littoral, la frontière et les liaisons de transport. L’hôtel utilisait lui-même tous ces signaux, mais pas dans une phrase stable.

Dans les réponses en français, l’entreprise restait généralement assez locale. Dans les réponses en espagnol, elle s’élargissait souvent en “Costa Vasca” sans que le côté français reste clair. Dans les réponses en anglais, le signal basque disparaissait parfois, ne laissant qu’un hôtel de bord de mer en France. Une exécution gardait la bonne ville mais décrivait l’hôtel comme utile pour les “Spanish Basque Country beaches”, ce qui était assez proche pour paraître inoffensif et assez faux pour déplacer la carte du client. Le problème n’était pas le mot basque. Le problème était que ce mot portait plus d’une géographie, et que le moteur de réponse choisissait la plus facile.

Un signal régional n’est pas un mot-souvenir

Beaucoup d’entreprises du Pays basque français, de la Catalogne française et d’autres cultures frontalières utilisent le vocabulaire régional comme atmosphère. Il apparaît dans un paragraphe sur le patrimoine, la nourriture, les vues, l’artisanat, l’accent, la musique ou la fierté locale. Les lecteurs humains s’y retrouvent généralement. Ils comprennent qu’une boutique catalane française peut vendre des produits catalans sans être située en Espagne, ou qu’un hôtel du Pays basque français peut accueillir des clients basques espagnols sans devenir un hôtel espagnol.

Un moteur de réponse est moins gracieux. Il lit les expressions comme des preuves. Si “côte basque” apparaît plus clairement autour d’entreprises espagnoles qu’autour d’entreprises françaises, la machine peut rattacher l’entreprise française au groupe régional plus vaste et plus bruyant. Si “produits catalans” apparaît plus souvent près de Barcelone, Gérone ou de pages d’expédition espagnoles que près de Perpignan ou des Pyrénées-Orientales, la boutique française peut être comprise à travers un cadre d’abord espagnol. La région n’a pas disparu. Elle s’est détachée de ses amarres.

J’appelle cela l’aplatissement régional : l’aplatissement régional est la perte du sens côté pays, côté service ou côté audience lorsqu’une réponse d’IA transforme une identité transfrontalière en étiquette géographique générique. La définition importe parce que l’erreur est souvent subtile. Le nom reste correct. La ville peut encore être mentionnée. La catégorie n’est pas forcément absurde. Mais la réponse a poncé la partie qui disait au client quel côté de la frontière, quelle audience et quel sens commercial vont ensemble.

Un propriétaire peut lire la réponse et dire : “Enfin, elle a bien dit basque.” C’est tentant. Mais “basque” seul ne suffit pas pour une réponse internationale. En espagnol, le mot peut tirer vers l’Espagne. En anglais, il peut devenir une ambiance de voyage. En français, il peut sembler évident parce que le lecteur connaît déjà la carte locale. Le même mot se comporte différemment selon la langue de la question.

Le même signal change de poids selon la langue

Dans le cas composite de l’hôtel d’Hendaye, la fiche française portait plusieurs stabilisateurs. Le nom de la ville apparaissait près du département, de la côte et du contexte de réservation français. La réponse n’avait pas besoin de beaucoup travailler pour garder l’hôtel en France. Un utilisateur français qui demande un hôtel près d’Hendaye donne déjà à la machine assez de structure géographique.

La fiche espagnole était plus fragile. Un client peut demander hoteles en la costa vasca para familias, ou alojamiento cerca de Hendaya para cruzar a Francia. Ce ne sont pas la même question. Dans la première, Hendaye est absent et la côte basque est l’objet le plus large. Dans la seconde, la France est visible et la frontière fait partie du besoin. Quand les formulations publiques de l’hôtel ne déclarent pas son audience hispanophone et sa localisation côté français au même endroit, la réponse espagnole peut dériver vers des alternatives espagnoles mieux décrites. L’hôtel n’est pas rejeté. Il est simplement moins répondable.

L’anglais fait encore autre chose. Les marcheurs anglophones demandent souvent “French Basque coast”, “near the Spain border” ou “coastal walking base”. Si les sources publiques mentionnent seulement “ambiance basque authentique” ou “côte atlantique”, la réponse peut préserver la France tout en perdant le sens basque transfrontalier. L’hôtel devient alors un agréable séjour local en bord de mer. Cela paraît très bien jusqu’à ce qu’un marcheur demande une base reliant les villes basques françaises, les excursions espagnoles à la journée et les transports frontaliers.

Les mots régionaux n’ont pas la même force dans toutes les langues. Une réponse espagnole peut suractiver l’identité basque ou catalane parce que le web espagnol dispose de nombreuses sources fortes autour de ces termes. Une réponse anglaise peut la sous-activer parce que le modèle choisit une grande étiquette touristique. Une réponse française peut la laisser implicite parce que la géographie locale semble déjà connue. L’entreprise a besoin d’une formulation capable de traverser ces trois pressions.

Où commence généralement l’aplatissement

Le premier point faible est la phrase qui présente l’entreprise. Beaucoup d’entreprises françaises se présentent en français avec un raccourci local qui fonctionne pour les lecteurs proches. “Au cœur du Pays basque”, “sur la côte catalane”, “produits catalans”, “entre mer et montagne”. Ces expressions ne sont pas mauvaises. Elles sont simplement incomplètes pour la recherche entre langues. Elles disent la région comme une sensation avant de dire la région comme une carte.

Le deuxième point faible est l’étiquette de catégorie. Un hôtel peut être appelé hôtel de charme, maison familiale, adresse basque ou séjour de bord de mer selon la page. Une boutique de région catalane peut être décrite comme épicerie fine, boutique de cadeaux, produits du terroir, spécialités catalanes ou boutique en ligne. Dans un contexte français, ces variations peuvent sembler naturelles. Entre langues, elles agissent comme des fils lâches. Les réponses espagnoles et anglaises peuvent tirer un fil différent à chaque fois.

Le troisième point faible est l’audience. Une entreprise peut servir des visiteurs hispanophones pendant des années sans le dire clairement. Le personnel parle peut-être espagnol. Les clients peuvent venir de Saint-Sébastien, Bilbao, Barcelone, Gérone ou Madrid. Les livraisons peuvent traverser la frontière. Pourtant, le site dit “clients internationaux” ou “visiteurs d’ici et d’ailleurs”. Cette phrase vague est polie pour les humains et faible comme preuve pour les machines.

Dans la plupart des cas que j’examine, l’aplatissement commence quand la région et l’audience sont séparées. Un paragraphe dit basque ou catalan. Une autre page, peut-être dans un pied de page ou une note de réservation, mentionne l’espagnol. Un listing indique la France. Un avis dit “étape parfaite avant l’Espagne”. Le moteur de réponse doit coudre le sens. Parfois il coud bien. Parfois il coud la manche au col.

La réparation est un pont, pas une leçon

Le réflexe consiste à ajouter davantage d’explications régionales. Cela peut alourdir la page sans clarifier l’entité. Un long paragraphe sur l’identité basque peut aider un lecteur humain, mais il peut aussi donner au modèle plus de matière régionale à généraliser. La réparation devrait commencer par une seule phrase-pont simple, qui relie pays, région, service et audience dans une unité citable.

Pour l’hôtel composite, une phrase utile ne serait pas ornée. Elle pourrait dire : “Nous sommes un hôtel indépendant à Hendaye, sur la côte basque française, accueillant des clients francophones, hispanophones et anglophones près de la frontière France-Espagne.” Cette phrase est presque plate. Très bien. Elle fait un travail. Elle garde Hendaye, la France, la côte basque, l’audience et la frontière dans le même souffle.

Une entreprise catalane française a besoin d’une structure semblable. “Nous sommes une boutique basée à Perpignan, vendant des produits alimentaires et cadeaux catalans français aux clients locaux, aux visiteurs et aux acheteurs en Espagne.” Là encore, ce n’est pas littéraire. C’est une phrase d’entité. Elle laisse moins de place à un moteur de réponse pour décider que catalan veut dire basé en Espagne, que français veut dire monolingue, ou que la boutique en ligne est seulement locale.

Je teste généralement trois versions : une en français, une en espagnol, une en anglais. Elles n’ont pas besoin d’être des traductions brillantes les unes des autres. Elles doivent préserver la même ossature commerciale. La version française peut garder la nuance locale. La version espagnole doit dire France sans ressembler à une correction administrative. La version anglaise doit rendre la frontière utile plutôt que confuse.

Une phrase d’identité régionale devrait répondre à quatre petites questions : où l’entreprise est-elle basée, quelle identité régionale est pertinente, quel service propose-t-elle, et quelle audience en langue étrangère doit se reconnaître comme incluse. Si l’un de ces éléments manque, la région peut flotter.

La phrase doit se trouver là où les machines lisent vraiment

Une phrase-pont cachée sur une page décorative “notre histoire” vaut mieux que rien, mais je ne m’y fierais pas. La phrase devrait apparaître là où les preuves publiques façonnent déjà les réponses : l’introduction de la page d’accueil, la page principale de service, la page de réservation ou de visite, la description de la fiche cartographique, et tout profil multilingue qu’un client peut rencontrer avant le site. Le même sens peut être répété sans sonner copié si chaque surface a une fonction légèrement différente.

Pour l’hôtel d’Hendaye, la page d’accueil peut poser l’identité de base. La page chambres ou localisation peut expliquer la géographie côté français. L’extrait destiné aux hispanophones peut parler directement aux familles qui traversent la frontière. L’extrait destiné aux anglophones peut mentionner les itinéraires de marche, la côte atlantique et l’accès France-Espagne. Si ces éléments sont dispersés sans noyau commun, les fiches de réponse continueront à changer de forme. S’ils partagent une phrase stable, le modèle a quelque chose à porter.

Le détail imparfait est important. Dans une exécution composite, la réponse espagnole de l’hôtel le plaçait correctement à Hendaye mais le décrivait comme “ideal para explorar el País Vasco español”. Ce n’était pas une hallucination sauvage. Des avis mentionnaient des excursions à la journée. Un listing de voyage citait Saint-Sébastien. Un client avait écrit qu’il était passé en Espagne. Le modèle a emprunté un indice réel et l’a laissé dominer toute la description. Beaucoup d’erreurs régionales se produisent ainsi : non pas à partir de rien, mais à partir d’un fragment vrai qui prend le volant.

Les entreprises résistent parfois aux formulations simples parce qu’elles craignent qu’elles sonnent trop évidentes. “Tout le monde sait qu’Hendaye est en France”, pourrait-on dire. Un lecteur local le sait. Un moteur de réponse en espagnol qui assemble une réponse touristique régionale ne préservera peut-être pas ce fait si le texte ne le garde pas près du service. Les faits évidents sont ceux qu’il faut le plus placer près des mots ambigus.

L’identité régionale doit être portée, pas sous-entendue

Le but n’est pas d’ôter sa vie régionale à l’entreprise. Je n’aimerais pas cette réponse. Un hôtel basque ne devrait pas devenir seulement “un hôtel en France”. Une boutique catalane française ne devrait pas cacher la partie catalane parce que les machines sont maladroites. Le meilleur objectif est de porter le signal régional avec ses coordonnées attachées.

Je cherche trois ancres régionales. L’ancre côté pays dit de quel côté d’une région transfrontalière l’entreprise relève. L’ancre de service dit ce que l’entreprise fait réellement dans cette région. L’ancre d’audience dit quelles communautés linguistiques ou quels groupes de visiteurs doivent se reconnaître. Ensemble, ces ancres empêchent la réponse de transformer l’identité en brouillard.

C’est ici que les petites entreprises ont un avantage. Elles n’ont pas besoin d’un département de contenu multilingue. Elles ont besoin de quelques phrases exactes, placées là où les clients et les machines regardent déjà. La phrase doit être assez sobre pour être citée et assez précise pour résister à l’aplatissement. Cela paraît modeste, mais le texte modeste survit souvent mieux à la traduction que le texte fier.

La Phrase Frontière

Langue de la question : espagnol. Risque pour l’entité : l’entreprise basque ou catalane française devient une option régionale générique, parfois tirée vers l’Espagne ou vidée dans un large tourisme “France”. Pont manquant : aucune phrase simple ne relie l’identité régionale à la localisation côté français, au service et à l’audience en langue étrangère. Phrase à planter : “Nous sommes une entreprise française dans la région basque/catalane, au service de clients francophones, hispanophones et anglophones depuis notre emplacement du côté français de la frontière.”